- Gelişmiş veri ambarı ve veri yönetişimi yetenekleri, modern veri yığınının geleceğini vurgular
- Databricks Marketplace ve Data Cleanrooms işlevi, şirketin açık ve işbirliğine dayalı veri paylaşımı vizyonunu hızlandırır
- Yeni veri mühendisliği optimizasyonları, toplu ve akış veri işlem hatlarını en uygun maliyetli şekilde otomatik olarak yürütür
- Makine öğrenimi yaşam döngüsündeki geliştirmeler, üretim ölçeğinde MLO’ları kökten basitleştirir
SAN FRANCİSCO, 28 Haziran 2022 /PRNewswire/ — veri tuğlalarıveri ve yapay zeka şirketi ve veri göl evi paradigmasının öncüsü, bugün Databricks Lakehouse Platformunun evrimini her yıl düzenlenen yıllık şenlik fuarında tüm biletleri tükenen bir kalabalığa dönüştürdüğünü açıkladı. Veri + Yapay Zeka Zirvesi içinde San Francisco. Ortaya çıkan yeni yetenekler arasında sınıfının en iyisi veri ambarı performansı ve işlevselliği, genişletilmiş veri yönetimi, güvenli veri işbirliği için bir analitik pazar yeri ve veri temiz odaları, ETL operasyonları için otomatik maliyet optimizasyonu ve makine öğrenimi (ML) içeren yeni veri paylaşım yenilikleri yer alıyor. yaşam döngüsü iyileştirmeleri.
“Müşterilerimiz, verilerinin zaten bulunduğu tek bir platformda iş zekası, yapay zeka ve makine öğrenimi yapabilmek istiyor. Bu, doğrudan veri göllerinde çalışabilen sınıfının en iyisi veri ambarı özelliklerini gerektirir. kıyaslama Databricks Lakehouse Platformunun veri ekiplerine basit, açık ve çoklu bulut platformunda her iki dünyanın en iyisini sunduğunu defalarca kanıtladık” dedi. Ali Ghodsi, Databricks’in kurucu ortağı ve CEO’su. “Bugünün duyuruları, hem şirketler içinde hem de şirketler arasında verilerin değerini en üst düzeye çıkarmayı her zamankinden daha hızlı ve kolay hale getirdiğimiz için Lakehouse vizyonumuzu ilerletmede önemli bir adım.”
En İyi Veri Ambarı Göl Evidir
gibi kuruluşlar amgen, AT&T, Kuzeybatı Karşılıklı ve Walgreens, hem yapılandırılmış hem de yapılandırılmamış veriler üzerinde analitik sunma yeteneği nedeniyle göl evine geçiş yapıyor. Bugün Databricks, analitik iş yüklerini daha da geliştirmek için platformunda yeni veri ambarı özelliklerini tanıttı:
- Veri Tuğlaları SQL SunucusuzAWS’de önizlemede sunulan , daha düşük bir maliyetle gelişmiş performans için anında, güvenli ve tam olarak yönetilen esnek bilgi işlem sağlar.
- FotonLakehouse sistemleri için rekor kıran sorgu motoru olan , önümüzdeki haftalarda Databricks Workspaces’te genel olarak kullanıma sunulacak ve Photon’un platformdaki erişimini daha da genişletecek. Photon duyurulmasından bu yana geçen iki yıl içinde, eksabaytlarca veriyi işledi, milyarlarca sorgu çalıştırdı, geleneksel bulut veri ambarlarından 12 kata kadar daha iyi bir kıyaslama ayarı fiyat/performans sağladı.
- Go, Node.js ve Python için açık kaynak bağlayıcıları artık operasyonel uygulamalardan göl evine erişmeyi daha da kolaylaştırın.
- Veri tuğlaları SQL CLI artık geliştiricilerin ve analistlerin doğrudan yerel bilgisayarlarından sorgu çalıştırmasına olanak tanır.
- Databricks SQL şimdi sağlar sorgu federasyonuPostgreSQL, MySQL, AWS Redshift ve diğerleri dahil olmak üzere uzak veri kaynaklarını, önce kaynak sistemlerden veri çekip yüklemeye gerek kalmadan sorgulama yeteneği sunar.
Unity Kataloğu için Gelişmiş Yetenekle En Öncelik Olarak Vurgulanan Veri Yönetimi
birlik Kataloğu, Önümüzdeki haftalarda AWS ve Azure’da genel olarak kullanıma sunulacak olan, yerleşik arama ve keşif, tüm iş yükleri için otomatikleştirilmiş köken, herhangi bir bulutta bir göl evi için performans ve ölçeklenebilirlik ile tüm veriler ve yapay zeka varlıkları için merkezi bir yönetim çözümü sunar. Ayrıca, Databricks tanıtıldı veri soyu Bu ayın başlarında Unity Katalog için, göl evindeki veri yönetişim yeteneklerini önemli ölçüde genişletiyor ve işletmelere tüm veri yaşam döngüsünün eksiksiz bir görünümünü sunuyor. Veri kökeni sayesinde müşteriler, göl evlerindeki verilerin nereden geldiğini, onu kimin ve ne zaman oluşturduğunu, zaman içinde nasıl değiştirildiğini, veri ambarı ve veri bilimi iş yüklerinde nasıl kullanıldığını ve çok daha fazlasını görebilir.
Databricks Marketplace ve Cleanrooms Tarafından Sağlanan Gelişmiş Veri Paylaşımı
Tüm veriler ve yapay zeka için önümüzdeki aylarda kullanıma sunulacak ilk pazar yeri olarak, Veri Tuğlaları Pazar Yeri veri ve analitik varlıklarını paketlemek ve dağıtmak için açık bir pazar yeri sağlar. Databricks Marketplace, yalnızca veri kümeleri sunan pazaryerlerinin ötesine geçerek, veri sağlayıcılarının veri tabloları, dosyalar, makine öğrenimi modelleri, not defterleri ve analitik gösterge panoları gibi bir dizi varlığı güvenli bir şekilde paketlemesine ve bunlardan para kazanmasına olanak tanır. Veri tüketicileri, yeni verileri ve yapay zeka varlıklarını kolayca keşfedebilir, analizlerine hızlı bir şekilde başlayabilir ve verilerden daha hızlı içgörü ve değer elde edebilir. Örneğin, bir veri kümesine erişim elde etmek ve bunun hakkında rapor oluşturmak için panolar geliştirmek ve sürdürmek için kendi zamanlarını harcamak yerine, gerekli analitiği zaten sağlayan önceden var olan panolara abone olmayı seçebilirler. Databricks Marketplace, Delta Sharing tarafından desteklenmektedir ve veri sağlayıcılarının, bulut depolama alanlarından verileri taşımak veya çoğaltmak zorunda kalmadan verilerini paylaşmasına olanak tanır. Bu, sağlayıcıların verileri tek bir kaynaktan diğer bulutlara, araçlara ve platformlara sunmasına olanak tanır.
Databricks ayrıca müşterilerin kurumsal sınırları aşan verileri paylaşmasına ve bu verilerle işbirliği yapmasına yardımcı oluyor. Temiz odalar, önümüzdeki aylarda kullanıma sunulacak, güvenli, barındırılan bir ortamla ve veri çoğaltma gerekmeden kuruluşlar arasında veri paylaşmanın ve bunlara katılmanın bir yolunu sağlayacak. Örneğin medya ve reklamcılık bağlamında, iki şirket hedef kitle örtüşmesini ve kampanya erişimini anlamak isteyebilir. Mevcut temiz oda çözümlerinin sınırlamaları vardır, çünkü bunlar genellikle SQL araçlarıyla sınırlıdır ve birden çok platformda veri çoğaltma riski taşır. Cleanrooms ile kuruluşlar, herhangi bir bulutta müşteriler ve iş ortaklarıyla kolayca işbirliği yapabilir ve onlara hem SQL hem de Python, R ve Scala dahil olmak üzere veri bilimi tabanlı araçları kullanarak tutarlı veri gizliliği denetimleriyle karmaşık hesaplamaları ve iş yüklerini çalıştırma esnekliği sağlayabilir.
MLflow 2.0 Geniş Ölçekte Üretim Makinesi Öğrenimini Kolaylaştırıyor ve Hızlandırıyor
Databricks, MLflow 2.0’ın piyasaya sürülmesiyle MLOps inovasyonunda öncülük etmeye devam ediyor. Bir makine öğrenimi hattının üretime alınması, yalnızca kod yazmayı değil, altyapıyı da kurmayı gerektirir. Bu, yeni kullanıcılar için zor olabilir ve geniş ölçekte herkes için sıkıcı olabilir. MLflow Boru HatlarıMLflow 2.0 tarafından mümkün kılınan , artık kullanıcılar için operasyonel ayrıntıları ele alıyor. Kullanıcılar, not defterlerinin orkestrasyonunu ayarlamak yerine, işlem hattının öğelerini bir yapılandırma dosyasında tanımlayabilir ve MLflow Pipelines, yürütmeyi otomatik olarak yönetir. MLflow’un ötesine bakan Databricks, üretim modeli barındırmayı doğrudan desteklemek için Sunucusuz Model Uç Noktalarının yanı sıra ekiplerin gerçek dünya model performansını analiz etmesine yardımcı olmak için yerleşik Model İzleme panolarını da ekledi.
Delta Live Tables, Veri Mühendisliği İşlem Hatları için Sektörde İlk Performans Optimize Edici’yi içeriyor
Delta Canlı Tablolar (DLT) güvenilir veri boru hatları oluşturmaya yönelik basit, bildirime dayalı bir yaklaşım kullanan ilk ETL çerçevesidir. Onun başlatmak Bu yılın başlarında Databricks, yürütmeyi hızlandırmak ve ETL maliyetlerini azaltmak için tasarlanmış yeni bir performans optimizasyon katmanının tanıtımı dahil olmak üzere DLT’yi yeni yeteneklerle genişletmeye devam ediyor. Ek olarak, yeni Gelişmiş Otomatik Ölçeklendirme, kaynakları akış iş yüklerinin dalgalanmalarıyla akıllı bir şekilde ölçeklendirmek ve Yavaşça Değişen Boyutlar için Değişiklik Verisi Yakalama (CDC) – Tip 2, hem uyumluluk hem de makine öğrenimi deneme amaçları için kaynak verilerdeki her değişikliği kolayca izler .
Databricks Lakehouse Platformu hakkında daha fazla bilgi edinmek için şu adresi ziyaret edin: https://databricks.com/product/data-lakehouse. Daha fazla Veri + Yapay Zeka Zirvesi açılış konuşması için sanal olarak oturum açın: buraya kayıt olmak ücretsiz, sürükleyici çevrimiçi deneyim için.
Veri Tuğlaları Hakkında
Databricks, veri ve yapay zeka şirketidir. Comcast, Condé Nast, H&M ve Fortune 500’ün %40’ından fazlası dahil olmak üzere dünya çapında 7.000’den fazla kuruluş, verilerini, analizlerini ve yapay zekayı birleştirmek için Databricks Lakehouse Platformuna güveniyor. Databricks’in merkezi şuradadır: San Francisco, dünya çapında ofisleri ile. Delta Lake, Apache Spark™ ve MLflow’un orijinal yaratıcıları tarafından kurulan Databricks, veri ekiplerinin dünyanın en zorlu sorunlarını çözmesine yardımcı olma görevindedir. Daha fazla bilgi edinmek için Twitter, LinkedIn ve Facebook’ta Databricks’i takip edin.
Güvenli Liman Bildirimi
Bu bilgi, Databricks’in genel ürün yönünü özetlemek için sağlanmıştır ve yalnızca bilgilendirme amaçlıdır. Databricks hizmetlerini satın alan müşteriler, satın alma kararlarını yalnızca şu anda mevcut olan hizmetlere, özelliklere ve işlevlere dayanarak vermelidir. İleriye dönük beyanlarda açıklanan yayınlanmamış özellikler veya işlevler, Databricks’in takdirine bağlı olarak değiştirilebilir ve planlandığı gibi veya hiç sunulmayabilir.
İletişim: [email protected]
İçerik PR NewsWire’a aittir. DKODING Medya, sağlanan içerikten veya bu içerikle ilgili herhangi bir bağlantıdan sorumlu değildir. DKODING Medya içeriğin doğruluğundan, güncelliğinden veya kalitesinden sorumlu değildir.
Kaynak : https://www.dkoding.in/press-release/databricks-unveils-new-innovations-for-its-industry-leading-data-lakehouse-platform/