圖片來源@視覺中國
(相關(guān)資料圖)
大模型的風(fēng)已經(jīng)不可避免地刮到了大數(shù)據(jù)行業(yè),火藥味還不小。
這不快臨近了有人注意到,兩家大數(shù)據(jù)行業(yè)的“宿敵”Databricks和Snowflake,今年雙雙把各自一年一度最重要的峰會(huì)選在了同一時(shí)段——6月26日-29日舉辦。
這可是這么多年來都沒有過的事。
不僅如此,他們還“不約而同”把今年大會(huì)的主題都往AI靠攏了。Databricks直接給大會(huì)取名叫“Data+AI Summit”,官網(wǎng)一點(diǎn)進(jìn)去就是一個(gè)碩大的“Generation AI”:
請(qǐng)輸入圖說
Snowflake也給自己的大會(huì)加了一個(gè)很牛的定語,“全球最大的數(shù)據(jù)、App和AI主題大會(huì)”:
這說明了什么?說明兩家公司在明目張膽逼著參會(huì)者們做選擇:你要去了他們的會(huì),再來我們這恐怕是來不及了。
要知道這倆公司,一個(gè)在舊金山,一個(gè)在拉斯維加斯,自駕要9個(gè)小時(shí),飛機(jī)也得飛1個(gè)半小時(shí)。參會(huì)者想兼得魚和熊掌,怕不是要折騰個(gè)夠嗆。
下面重頭戲來了,不僅時(shí)間重合,兩家公司都各自請(qǐng)到了重磅嘉賓來發(fā)表主題演講——Databricks請(qǐng)到的是微軟的CEO薩蒂亞·納德拉(Satya Nadella),Snowflake則是英偉達(dá)CEO黃仁勛。
個(gè)個(gè)都是大佬。
有網(wǎng)友提醒大家,鑒于兩家公司的峰會(huì)在同一時(shí)間舉辦,“如果你還沒選邊站,那么現(xiàn)在該你選擇的時(shí)候到了”。
當(dāng)然也有不乏準(zhǔn)備兩邊跑的人。Striim公司的產(chǎn)品經(jīng)理John Kutay就計(jì)劃在兩個(gè)大會(huì)上分別發(fā)表講話,不過也“將評(píng)估拉斯維加斯和舊金山兩地的路程和時(shí)間”。
有還沒做好決定的網(wǎng)友問他在Databricks上的發(fā)言內(nèi)容會(huì)是啥,“我想去,但是到時(shí)候還得趕去SF,唉?!?/p>
對(duì)此,甚至還有個(gè)網(wǎng)友做了個(gè)離譜的夢,“剛剛夢到所有人都在Snowflake的大會(huì)上感染新冠了,因?yàn)镾nowflake不想讓我們參加Databricks的峰會(huì)……”
Snowflake和Databricks都是目前大數(shù)據(jù)分析公司中的佼佼者。前者于2021年創(chuàng)辦,并在2020年9月上市,上市首日收盤股價(jià)飆升111.6%,報(bào)253.93美元,成為美國有史以來規(guī)模最大的軟件IPO。
此外,Snowflake的股東名單里還不乏Salesforce和巴菲特這樣大名鼎鼎的投資方。
創(chuàng)辦于2013年的Databricks則是目前一級(jí)市場中的超級(jí)獨(dú)角獸,曾在2021年連續(xù)獲得兩輪10億美元級(jí)別的大額融資,估值高達(dá)380億美元(2021年數(shù)據(jù))。
一些中國從業(yè)者也更習(xí)慣叫它“磚廠”。
兩家公司不僅經(jīng)常被外界拿來做比較,彼此之間也總是明著暗著各種較勁。
最著名的一次喊話是在2021年。當(dāng)時(shí)眼看著Snowflake靠著云數(shù)據(jù)倉庫就做到了千億市值,Databricks坐不住了,發(fā)了一篇文章稱其數(shù)據(jù)湖技術(shù)創(chuàng)下了TPC-DS基準(zhǔn)測試新記錄。
重點(diǎn)是,Databricks還強(qiáng)調(diào)了第三方研究表明其實(shí)際性能可達(dá)Snowflake的2.5倍。
接著過了十天,Snowflake做出回應(yīng),發(fā)布了自己的測試結(jié)果,同時(shí)稱Databricks公布的性能比較結(jié)論缺乏完整性,而且研究本身也存在缺陷。
Snowflake創(chuàng)始人還強(qiáng)調(diào)這種基準(zhǔn)測試沒什么意義,在這個(gè)年代發(fā)布數(shù)據(jù)庫基準(zhǔn)測試結(jié)果是“將正常的技術(shù)交流變成了缺乏完整性的營銷噱頭”。
不甘心的Databricks再次回應(yīng),創(chuàng)始人發(fā)了一篇博客,這次是更嚴(yán)重的指控:Snowflake為了測試結(jié)果竟然改了TPC-DS的輸入數(shù)據(jù)。
從那之后,兩家之間的互嗆就沒有停過。
在去年和投資人Matt Turck的一次對(duì)話中,Databricks的聯(lián)合創(chuàng)始人兼CEO Ali Ghodsi還不避諱地談到了與Snowflake的競爭。
他先是商業(yè)性地夸了下Snowflake有著“可能是市場上最好的數(shù)據(jù)倉庫”,并且“Databricks與Snowflake將共存于可能70%的客戶中”。
這里補(bǔ)充一點(diǎn),Snowflake主要用的是數(shù)據(jù)倉庫技術(shù),Databricks用的則是數(shù)據(jù)湖技術(shù),這也是兩家技術(shù)思路最主要的不同。
接著Ali Ghodsi就宣傳起了自家的數(shù)據(jù)湖,“公有云計(jì)算供應(yīng)商有動(dòng)力推動(dòng)更多人把數(shù)據(jù)存到他們的數(shù)據(jù)湖中……我認(rèn)為數(shù)據(jù)湖的范式將獲勝。”
產(chǎn)品性能上的你追我趕還沒完,現(xiàn)在Databricks和Snowflake又暗戳戳在大模型上較上勁了。
Databricks在今年3月發(fā)布了一個(gè)名叫Dolly(據(jù)說是為了向第一只克隆羊多莉致敬)的開源大語言模型,稱“只需30美元、一臺(tái)服務(wù)器和三個(gè)小時(shí),我們就能教Dolly開始進(jìn)行人類級(jí)別的交互”。
這明擺著也是在針對(duì)ChatGPT這樣門檻更高的產(chǎn)品,意思就是AI不再是只有大型科技公司才能負(fù)擔(dān)得起的東西,不用拿多少融資,任何人都能開發(fā)出一個(gè)真正像人類的AI。
Databricks接著又在4月發(fā)布了該大語言模型的開源迭代版本Dolly 2.0。
Snowflake這邊也在不斷炒作大模型,在4月發(fā)布文章稱正在為生成式AI和大語言模型搭建一個(gè)以數(shù)據(jù)為中心的平臺(tái),并在文中詳細(xì)解讀了這么做的依據(jù)和將帶來的影響。
隨后的5月,Snowflake宣布收購初創(chuàng)公司Neeva,以在其數(shù)據(jù)云平臺(tái)中添加基于AI的生成搜索。
雖然在AI大模型方面兩家公司還沒有互踏進(jìn)對(duì)方的領(lǐng)地,不過這次年度峰會(huì)舉辦時(shí)間的重疊已經(jīng)說明了他們的態(tài)度。
有趣的是,有人在谷歌搜索“Snowflake conference”,出來的第一個(gè)結(jié)果卻是Databricks家的大會(huì)鏈接,其次才是Snowflake的。
就等于說,Databricks買了競爭對(duì)手的關(guān)鍵字,來賣自己的廣告。
我們也發(fā)現(xiàn),在谷歌同時(shí)輸入“Databricks+Snowflake”搜索,前兩條都是廣告(這個(gè)結(jié)果是動(dòng)態(tài)展示的)——Databricks依然在競價(jià)排名的第一位置宣傳著自己取得的成績,但第二則是一家技術(shù)服務(wù)商,在宣傳自己幫客戶遷移到Snowflake的服務(wù),這個(gè)投放甚至比前面有人發(fā)現(xiàn)的兩家直接競價(jià)的情況更有意思,Databricks依然可以被解讀為(在商業(yè)攻勢上)進(jìn)攻性更強(qiáng)、更有戰(zhàn)斗力的一方,但在兩家的競爭中一些技術(shù)服務(wù)商也在抓緊尋找商機(jī),而且似乎更認(rèn)為轉(zhuǎn)移到Snowflake 的需求更大…
不論如何,一場大戰(zhàn)又要打響了。現(xiàn)在大模型領(lǐng)域不缺攪局者,到了Databricks和Snowflake這里,興許就成了誰先干掉誰的問題。