日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

「数据新星」Databricks 崛起启示录

發布時間:2023/12/10 编程问答 26 豆豆
生活随笔 收集整理的這篇文章主要介紹了 「数据新星」Databricks 崛起启示录 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

新眸大公司研究組作品

作者|葉靜

編輯|桑明強

在數據庫領域,如果問當下誰最火,那Databricks一定排得上號。

去年8月,距離10億美元的G輪融資剛過去7個月,Databricks再次獲得16億美元H輪融資,身價搖身一變成380億美元,成為外界一致認為的超級獨角獸。一直以來,數據領域備受關注,如果從2007年開始計算,全球的數據量至今已經膨脹了近200倍,數字化被寫入戰略規劃成了各類行業的共識。

在數據量井噴的背景下,上云趨勢也越來越明確,以Snowflake、Databricks為代表的大數據公司應運而生,前者基于AmazonS3打造了云端的數據倉庫,后者除了推出Lakehouse(湖倉一體),現在又押寶機器學習,試圖包管數據在抵達機器學習之前的所有流程。

不同的是,Databricks已經從原來的infra向更廣泛場景延伸,和昔日的伙伴Snowflake同臺競技。與此同時,以AWS為代表的云巨頭,也都曾戰略性投資過Databricks,但現在也都在自研數據分析套件,競合關系漸趨白熱化,讓數據基礎設施的戰火撲朔迷離。

No.1

從0到1

企業的性格往往被它的創始人和技術背景所決定。

十幾年前在UC Berkley的AI實驗室里,Ghodsi和伙伴發起Spark項目:做一個能夠更輕松處理大量數據和機器算法的引擎,并且開源了代碼。相比較多數開源項目,面向的都是底層技術性強要求的infra工程師,spark面向更廣泛的客戶群,同時在上層加了很多的新的API,降低了技術門檻。

因為沒有優秀的開發者社區運營和推廣團隊,Spark變現比較難,之后團隊成員決定成立Databricks,以商業化方式推動Spark社區發展。即便Spark是過去硅谷的頂流產品,但這并沒有讓AWS等巨頭買賬,他們選擇繞過Databricks,直接將Spark集成到自己的產品里。在Databricks賣產品還不如辦Spark峰會收入高的時候,Amazon EMR已經針對Spark實現了幾億營收。?

Databricks創始團隊走了一條不被大眾熟知的激進的路:云。

雖然不管對公司還是客戶來說,云可以更快部署,也更容易維護,但正如聯合創始人Reynold Xin所說,大部分的人知道云是未來,但絕不是現在。當時只有小部分風投注資這家初創企業,New Enterprise Associates的投資者Pete Sonsini說:“我們在Databricks的軟件收入為零時投資,認為他們會在大流行中加速發展,也許是一兩個月,每個人都無法及時知道會發生什么”。和Databricks一樣,他們也在賭未來。

圖:Databricks年度融資及估值變動

2013到2015這三年,雖然有硅谷風投支持,Databricks也借力這些資金吸引人才,推出了基于云端的簡化大數據處理平臺Databricks Cloud,但不管是招主管、找融資還是見客戶,Databricks都會被質疑:真的不支持on-prem嗎?

因為背靠Spark,很多客戶甚至愿意年付幾千萬美金讓Databricks提供咨詢定制化項目,但Databricks做的是一個給數據工程師的平臺,這是當時大部分公司聞所未聞的玩法,也是前幾年商途不順的原因之一。值得一提的是,彼時的云界開源前輩Cloudera曾改名“Cloud Era”,可在當時的市場情況下,最終還是轉向了on-prem做定制和售后支持才得以存活。

在這種邏輯下,云廠商把開源軟件拿來經過簡單的封裝,再作為服務賣出去。由于這個過程只需要簡單的部署和調試,工程成本極低,定價也不高,巨頭從中賺走了大部分,這對Databricks來說相當于吸血,怎樣和有錢有人的云巨頭對抗,是Databricks亟需在技術上打造的壁壘。

他們賭的另一條路,是不做數倉。

彼時數據倉庫競爭過于激烈,以亞馬遜為首的巨頭占據了大部分市場份額,Databricks繼續小眾打法:避開紅海,嘗試切入一個新興卻可能會有爆炸性增長的小市場,針對數據科學家、數據工程師和AI的方向做產品。

開源小公司的優勢在于更懂項目,迭代更快,能夠聚焦、死磕產品性能,而公有云大廠很難在單一方向投入最好的工程師。隨著數據量的爆發,云的生態優勢逐漸被認可,加上當時市面上也沒有大量競品,這給Databricks的產品帶來了機會。

另一方面,在2019年微軟投資Databricks之前,正巧CEO納德拉推動云為先的戰略,兩家合作的Azure Databricks進入了微軟的企業許可協議。微軟從一個大數據競爭劣勢的云產品搖身成為業界領先,形成了云巨頭三足鼎立的局面;因為幾乎所有大企業都和微軟有ELA,共生效應之下,客戶原本買云買Office的預算自然流向了Databricks。

有人將Databricks創始團隊比作一群幸運的加州嬉皮士RD,他們信仰技術,信仰來源,信仰共享和長期主義,這些也都成為了Databricks的底色。

No.2

超級加倍

讓所有人感到意外的是,2019年后,Databricks以絕無僅有的加速度在增長。

截至2021年2月,公司已經籌集了近20億美元資金,包括由富蘭克林鄧普頓領投的10億美元G輪融資,此時Databricks估值已經達到280億美元;在經過最新輪融資后,Databricks380億的身價與三年前的62億相比暴增了近13倍。

基本面決定價值,價值決定價格,如果將Databricks的成功僅歸結于對技術犀利的洞察,借助了巨人的肩膀和好運氣,這還遠遠不夠。基于開源的創新是Databricks成長的關鍵,從大數據領域殺入云計算和AI,它的產品矩陣里包括DeltaLake、MLflow、Koalas以及開源分析引擎Spark等殺傷利器。

其中,超過80%的用戶使用Delta Lake;MLFlow為數據科學家提供了標準化的開源框架,下載量以每月80萬的速度增長,擁有比Spark更多的用戶;而Koalas可以讓數據科學家在筆記本電腦上使用Pandas編程,調用幾個API就可以將工作部署到大型的分布式Spark集群上,把Pandas社區的數據科學創新帶給了Spark用戶。

幫助其他企業構建自己的AI能力,透露出了Databricks的野心:從BI到AI,構建一個企業AI平臺,因為Ghodsi認為,在企業計算領域,行業還沒有出現頭部的企業AI平臺。

除了軟件產品本身,Databricks的業務模式也有所不同。

傳統的開源商業模式是軟件免費,廠商收取支持和服務費用,這在on-prem里或許可行,但在云的世界就不一定了。Databricks在開發、軟件運行、運營和托管方面向客戶收費,采用SaaS開源的盈利模式,客戶可以在本地開源平臺下載免費的基礎軟件,同時也可以下載開源公司打造的其他付費版本。

不高估開源,也不低估市場,Ghodsi說:“在云端托管開源項目并把它們租給用戶,客戶流失率更低,利潤增長更快”。SaaS租賃模式下,Databricks的核心知識產權沒有存放在它所贊助的開源軟件項目中,而是在它用來監管云端軟件的工具中,這樣避免了泄露的風險。

根據報告,Databricks最新ARR (年度經常性收入)達到6億美元,相當于Snowflake同財年12億營業收入的一半,截至目前,后者市值近670億美元,如果按照兩倍之比來簡單預估,Databricks380億的估值也比較合理。以新估值計算,Databricks的價值是當前ARR的63倍,相較于2020年的4.25億美元,ARR近30%的增長率讓投資者對它未來的收入十分看好。

圖:Snowflake與Databricks定價對比(來源:官網)

另一方面,通過對比官網收費方式發現,雖然是平臺租出服務器的計算資源,但這些服務器整個系統都建立在主要的云廠商的基礎服務上。以Snowflake(左)為例,同樣是以每秒粒度使用的計算資源付費,Snowflake是平臺和云廠商打包收費方式,客戶對底層服務界面(如EC2)和上游的Snowflake的成本花費要一次性付清,但比例是怎樣無從得知,而打包之后Snowflake需要支付給云廠商另外成本,這在無形中增加了費用風險。

Databricks(右)的玩法是分開收費,用戶的賬單主要分為兩部分:常規的底層云廠商服務器租用成本,以及Databricks在這些服務器上的功能費用??蛻羰褂玫讓悠鲿r,費用單獨付給云廠商,并不算在Databricks的營收里。

所以如果對比營收,比如2020年的Snowflake營收近6億,但刨去付給云廠商的費用,和Databricks4億多的營收相比,也差不了多少。而這既是Databricks毛利率比Snowflake高的原因,也是前者賺錢能力強的體現。有觀點猜測Databricks遲遲不上市的原因,如果根據Ghodsi的說法,是為了避免二級市場所帶來的波動,或許收費方式被迫改變等不可預測因素也在里面。

No.3

天時地利人和

根據官網顯示,除了為數據科學家、數據領導者與數據工程師提供角色解決方案,Databricks還利用大數據和AI為廣告和營銷、通訊服務商、教育、能源、聯邦政府、金融、醫療等13類行業提供服務。

從類別數量上,Databricks要多于Snowflake,此時全球已經有7000 多家組織(包括荷蘭銀行、康泰納仕、H&M 集團、再生元和殼牌)依靠 Databricks 實現大規模數據工程、協作數據科學、全生命周期機器學習和業務分析。

通常情況下,企業客戶在進行數據架構時,第三方平臺提供數據湖方案,在數據湖中做一些常見的數據工程;同時會有一個數據倉庫,存放相當于數據湖5%-10%的結構化數據,來做BI等簡單的數據分析。

但由于數據分裂在兩個系統上,針對同一個客戶問題分析,不同團隊有不同權限,因而會看到不同版本的同一份數據,當得出不同結論后,做商業決策的團隊不相信數據,進而導致底層數據平臺失信,這是個很致命的問題。

將結構化和非結構化數據結合到一個地方,讓客戶在不移動底層數據的情況下執行數據科學和商業智能工作,是大數據發展的一個關鍵變化。于是,Databricks決定力推Lakehouse,能夠直接在數據湖的低成本存儲上,實現類似于數據倉中的數據結構和數據管理的功能,可支持BI到AI所有的工作流。

從Databricks的網頁介紹上看,無論是數據工程、數據科學,還是機器學習都要依靠Lakehouse運行,加上過去使用低成本對象存儲的數據湖的訪問速度很慢,如今DB SQL提高了分析質量和性能,使數據湖在大數據集上的處理與數據倉庫相媲美。

“Lakehouse是一個新賽道,這是一場地盤爭奪戰”,H輪融資之后,Ghodsi表示,這筆資金將主要用于加速Lakehouse的產品創新和市場開拓。與此同時,Databricks透露保留所有主要公共云的選擇和靈活性,并將Lakehouse發展成傳統數據倉庫的替代品。

越來越多的企業樂于看到Databricks的實力和發展潛力,這和它本身的商業邏輯有關,業內傳統企業如Teradata在營收額上雖高過Databricks好幾個身位,但市值仍徘徊在40多億美元。大劑量的資金注入后,Databricks選擇并購來填補產品路線圖中的空白或不足,重點是機器學習和數據初創公司,以及擴大與云公司的合作伙伴關系。

“云、開源、機器學習,這三個方面已成為每家企業戰略的核心。我們真的很幸運能夠處在這三大趨勢的中心位置上。”Ghodsi在接受采訪時說到。如果說2019年前看好Databricks的小部分風投是賭趨勢,如今匆匆進場的其他機構也并沒有遲到,因為在他們眼里,這家獨角獸仍具備難以估量的增長能力。

往期精彩內容

推薦關注

如何讓SaaS從好模式變成好生意

裁員、收縮、過冬,云計算怎么了

撥開迷霧選型數據中臺,兼談這些供應商的商業模式

中國云計算的新邏輯

未來SaaS創業者將不再沉浸于「大合同」狂歡

逃出SaaS戰略陷阱

行業

從奶粉小廠到媲美茅臺,飛鶴究竟做對了什么?| 案例復盤

奇安信38.9萬中標一政府部門2393萬招標項目,引發行業爭議

留給華為造“芯”的時間不多了|硅基世界

觀察

【產業互聯網周報】中興通訊五年合規監察期結束;馬化騰談“騰訊如何過冬”;釘釘繼續轉型PaaS化

鈦媒體獨家對話葉軍:我在阿里巴巴做“CIO”的日子

寧德時代揭曉調研紀要:一定要進美國市場,友商擴產不會增加競爭

趨勢

未來五年數字中國建設路線圖出爐

關注公眾號,獲取更多信息?

總結

以上是生活随笔為你收集整理的「数据新星」Databricks 崛起启示录的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。

主站蜘蛛池模板: mm131在线 | 小色哥网站 | 性高潮在线观看 | 男人的天堂黄色 | 色吧av色av | 精品国产无码一区二区 | 精品爆乳一区二区三区无码av | 91小宝寻花一区二区三区 | 国产精品主播 | 国产精品黑人一区二区三区 | av电影免费在线播放 | 日本欧美一本 | 国产jzjzjz丝袜老师水多 | 亚洲天堂一区二区在线观看 | 777久久| 伊人蕉久影院 | 亚洲精品乱码久久久久99 | 久久激情影院 | 久久国产精品免费看 | av成人免费在线 | 久久久久久久久久久久久久av | 森泽佳奈中文字幕 | 五十路六十路 | 日本啪啪网站 | 高跟鞋和丝袜猛烈xxxxxx | 天天摸天天射 | 日韩在线免费av | 超碰97人人在线 | 中文天堂在线播放 | 亚洲伊人精品 | 尤物视频在线观看国产性感 | 欧美亚洲91 | 三上悠亚一区二区在线观看 | 精品啪啪| 女~淫辱の触手3d动漫 | 性盈盈影院中文字幕 | 天天插天天爽 | 日本高清一区二区视频 | 91九色蝌蚪 | 青青草欧美 | 乌克兰毛片 | 国产91专区 | 久久久久久久中文字幕 | 日韩精品在线播放 | 青娱乐精品视频 | 欧美图片一区二区三区 | 波多野一区二区三区 | 97在线视频观看 | 九九久久网 | 日韩欧美视频在线 | 超碰伊人| 亚洲 欧美 另类 综合 偷拍 | 激情播播网 | 亚洲精品lv| 午夜不卡久久精品无码免费 | 国产免费不卡 | 免费一级片在线观看 | 日韩专区一区二区三区 | 欧美视频在线一区二区三区 | 狠狠操导航| 成人免费在线视频 | 公侵犯人妻一区二区 | 中文字幕乱码在线观看 | 四虎成人在线视频 | 女人被灌满精子 | 男女日日 | 国产a∨精品一区二区三区仙踪林 | 日韩一区二区三区在线观看 | 免费看91| 风韵少妇spa私密视频 | 欧美成年人网站 | 综合欧美亚洲 | 色婷婷精品久久二区二区密 | 四虎永久在线精品免费网址 | 日韩在线电影一区二区 | 催眠调教后宫乱淫校园 | 教练含着她的乳奶揉搓揉捏动态图 | 少妇超碰 | 国产精品无遮挡 | 亚洲第一字幕 | 熟女俱乐部一区二区 | 自拍偷拍色 | 亚洲精品www久久久 一级aaa毛片 | 精品一区二区三区无码按摩 | 北条麻妃久久精品 | 日韩一级影视 | 内射一区二区三区 | 五月天精品视频 | 日本午夜精华 | 在线观看黄色国产 | 性——交——性——乱免费的 | 桃色视屏 | 精品不卡一区二区 | 99在线小视频 | 日韩欧美中文在线观看 | 亚洲另类xxxx | 亚洲精品国产精品国自产观看 | jizz黄色片 | 欧美日韩视频免费观看 |