以太坊交易所 以太坊交易所
Ctrl+D 以太坊交易所
ads
首頁 > BNB > Info

大模型慢半拍,字節甘做“嫁衣”?_CHA:CATGIRL

Author:

Time:1900/1/1 0:00:00

文:財經故事薈,采寫:王舒然,編輯:萬天南

圖片來源:由無界AI工具生成

在大模型甚囂塵上的當下,一向高舉高打的字節,卻一反常態,低調得讓人不太習慣。

當百度、阿里、華為、360等知名互聯網公司的一把手們親自掛帥,為大模型站臺,并不吝用“智能化時代的開端”、“科技和商業史上的革命性時刻”來贊譽它時,字節卻安靜得多。

相關的官宣只有兩個,一是4月11日,飛書宣布將推出AI助手“MyAI”,二是4月18日,火山引擎推出大模型訓練云平臺,包括自研DPU、新版機器學習平臺等系列云產品,以服務于大模型創業公司——字節自研大模型始終未露面。

相反的是,火山引擎總裁譚待公開“承諾”,火山引擎不做大模型,將化身賦能者,為大模型客戶提供算力等AI基礎設施,幫助其做好大模型開發。

此舉似乎表明,字節避開了大模型戰火,選擇以幕后賣水者的身份入局。

只是,在算力、算法、數據這大模型的三要素上均具備優勢的字節,為何會選擇“韜光養晦”?字節真的會徹底放棄大模型,甘為他人做“嫁衣”嗎?

慢一拍的字節大模型

火山引擎不做大模型,或許并不代表字節對大模型無動于衷,這可能是個文字游戲。

實際上,雖然字節從未大張旗鼓得官宣自研大模型,但已經有所部署。

據36Kr在今年2月的報道,字節跳動在大模型上已有布局,會在語言和圖像兩方面發力,語言大模型團隊由字節搜索部門牽頭,目前團隊規模在十數人左右;圖片大模型團隊則由產品研發與工程架構部下屬的智能創作團隊牽頭。

另據《晚點LatePost》報道,張一鳴開始看人工智能論文,且時常會和一些字節人士分享論文心得和對ChatGPT的思考。

孫宇晨:波場TRON主網啟動5年來成就斐然,肩負全新使命再出發:據官方消息,6月25日,波場TRON創始人、火必Huobi全球顧問委員會成員孫宇晨發布推文慶祝波場TRON 5周年獨立日,孫宇晨表示,作為波場TRON的創始人,在這個特殊的日子里,他由衷感謝大家的一路相伴和支持。“讓我們一同共創未來,我們的故事才剛剛開始。”孫宇晨說。

孫宇晨在推文附帶的慶祝視頻中表示,“過去5年,我們一直致力于推動互聯網去中心化。如今我們又有了建設元宇宙金融自由港的全新使命。在此過程中,我們不斷加快國際化與合規化的腳步,積極推動生態繁榮發展,布局行業各類賽道,并在教育、環保、人工智能等領域長期落實工作。我們構建了一套成熟的由公鏈、交易所和穩定幣組成的基礎設施,充分服務于社區每一個用戶。我們可以自豪的說,我們一直熱愛并忠于這份事業。”

此外,孫宇晨直言,用戶的信任是波場TRON最核心的競爭力。他希望在未來攜手全球80億人,共同實現金融自由。[2023/6/25 21:59:16]

這表明,字節并不想缺席這場盛宴,但必須承認的是,字節在大模型上的反應確實有點“遲鈍”了。

民生證券4月9日發布的《當大模型不再稀缺》報告顯示,國內至少已有30多家大模型亮相。大部分都在3~4月份官宣,比如3月16日的百度“文心一言”大模型,4月8日的華為盤古系列AI大模型,4月10日的商湯“日日新”大模型,4月11日的阿里“通義千問”大模型......

而據36Kr報道,字節語言大模型團隊今年初才成立,預期今年年中推出大模型,字節跳動相關技術負責人表示,技術中臺在這些領域的探索仍處于初期,尚未成熟。

事實上,大模型競賽的起點并非今天,而在更早的布局,這方面,字節有些晚了。

《紐約郵報》:SBF在被軟禁期間與《大空頭》作者進行過會談:金色財經報道,據《紐約郵報》消息,SBF在被軟禁期間與《大空頭》作者Michael Lewis進行過會談。

據此前報道,Apple即將與Michael Lewis就其《墮落的加密貨幣之王SamBankman-Fried&FTX》的圖書達成版權交易,有望拍成故事片。Apple擊敗了Netflix和亞馬遜等強力競爭對手,交易金額約在七位數。[2022/12/28 22:11:43]

對比來看,百度、阿里、華為、騰訊等企業的大模型均在2019年~2021年間就已有雛形,比如,百度在2019年發布了文心大模型,阿里在2021年發布了M6大模型,同年華為發布盤古大模型,這些雛形可以視為近期發布的類ChatGPT大模型的“基座”。

而字節方面,雖然其AI布局不算晚,字節AILab早在2016年就成立,與騰訊同一年,但其似乎并未在大模型上下足功夫。

據《晚點LatePost》報道,一位字節人士稱,在去年底ChatGPT出現前,字節對大模型的投入還比較少,表現之一是,約有100人的字節AILabNLP組,只有不到10人在研究語言大模型,其他人主要在做翻譯和抖音安全等優化。

知乎上一位字節AILab工程師的回答也印證了這一點,他表示,字節AILab的主要研究方向和業務應用有關,比如抖音特效、視頻和圖片審核等。

簡單來說,字節對AI的探索比較務實,主要服務于自家業務,這種務實而非務遠的策略,或許反而成了其布局通用大模型的“阻礙”。

而除了晚一步之外,字節對大模型的野望似乎也不是很大。

據《晚點LatePost》報道,字節語言大模型的探索方向主要與搜索相關,可能會在抖音、TikTok中推出類似微軟NewBing的功能;圖像大模型則主要服務商業化需求,以幫助字節的廣告客戶以更低成本制作視頻。

傳Roche Freedman律所除Kyle Roche外的其他律師也持有大量AVAX:金色財經報道,Debevoise&Plimpton律所律師Elliott Greenfield透露,Kyle Roche可能不是CryptoLeaks視頻爆料中唯一獲得Ava Labs股權和AVAX代幣的律師,Roche Freedman律所中,除Kyle Roche之外,包括 Devin “Vevel” Freedman、Amos Friedland和Edward Normand等律師可能都持有大量AVAX代幣,截止發稿時,相關人士均未回復置評請求。據此前報道,Cryptoleaks在其官網的視頻爆料稱Avalanche開發公司Ava Labs在幾年前和美國律師事務 Roche Freedman達成一項合作協議,內容是Ava Labs向Roche Freedman支付大量Ava Labs股權和AVAX(現價值數億美元),Roche Freedman則針對 Binance、Solana Labs和Dfinity Foundation等競爭對手發起惡意訴訟。(Blockworks)[2022/9/5 13:08:30]

另據字母榜報道,有知情人士稱,飛書推出的“MyAI”背后的大模型是由飛書自行操盤,而非字節大模型團隊負責。

從上述信息判斷,字節大模型似乎并不打算“大包大攬”,而是與自家部分業務緊密相關,這與百度“文心一言”、阿里“通義千問”等通用大模型有所差別。

比如“文心一言”,在發布會現場,文心一言展示了五個使用場景,包括文學創作、商業文案創作、數理推算、中文理解和多模態生成。

“通義千問”的功能則包括多輪對話、文案創作、邏輯推理、多模態理解、多語言支持等,阿里巴巴集團董事會主席兼首席執行官張勇表示,阿里所有業務包括天貓、釘釘、高德地圖、淘寶、優酷、盒馬等都將接入該模型,應用場景實屬廣泛。

比特幣的哈希率攀升至接近6月歷史新高,預計挖礦難度大幅提升:金色財經報道,數據顯示,比特幣的哈希率以每秒282.21 exahash?(EH/s) 的速度運行,僅比2022 年6月8日在區塊高度 739928 處記錄的網絡歷史最高點 (ATH)低 3.35%。盡管價格在14天內下跌了9%,但算力卻大幅增加,挖礦難度自2022年8月4日以來已經翻了兩倍。

加密社區已經注意到隨著塊間隔率的增加,節奏的增加。周四,Blocksbridge Consulting 在推特上發布了關于區塊間隔的消息,并表示該公司預計下一次的難度會大幅增加。[2022/8/28 12:53:29]

另一個可以側面佐證這一點的是,百度和阿里均計劃依托自家云平臺,向外界開放大模型服務,打造大模型生態。

比如阿里云智能集團CTO周靖人表示,各行各業的生態伙伴都可以對千問大模型進行再訓練和精調,打造行業專屬大模型;百度智能云事業群總裁沈抖也表示,文心一言的能力將通過百度智能云對外提供服務,會率先在媒體、文娛、企業軟件等行業落地,場景包括智能客服、員工培訓、巡檢日報、知識萃取等。

但字節云卻“反其道而行之”,火山引擎宣稱只做基礎設施服務,不對外輸出大模型能力。

這意味著,字節正在探索的大模型定位可能并非是開放生態,而是為了增強現有業務的競爭力。

當然,這只是初期,字節大模型的全貌尚未揭開,在字節官宣之前,還是變數難料。

字節為何甘為他人做“嫁衣“?

值得探究的是,為何字節對百度、阿里那樣的通用大模型興趣不高?火山引擎又為何堅定得不做大模型?

背后原因或許與以下幾方面的權衡有關:

其一,通用大模型燒錢,且距離商業落地“遙遠”。

訓練大模型的一大成本是算力,而算力的關鍵是芯片,那么,大模型訓練需要多少芯片?

去中心化無線網絡 Helium 將新的 MOBILE 和 IOT 代幣,以激勵 5G 網絡與 LoRaWAN 網絡:6月12日消息,去中心化無線網絡 Helium 將新的 MOBILE 和 IOT 代幣。本月,該項目計劃推出 MOBILE 代幣以獎勵運營 5G 節點并為Helium 最新網絡做出貢獻的用戶,8 月,該網絡計劃推出一種新的 IOT 代幣,節點運營商將為最初為物聯網 (IoT) 設備(如傳感器和跟蹤器)設計的 LoRaWAN 網絡賺取該代幣。同時,現有的 HNT 代幣將繼續存在,并作為不斷擴大的 Helium 生態系統的“儲備貨幣” 。(Decrypt)[2022/6/12 4:20:03]

參考ChatGPT,美國市場研究機構TrendForce推算稱,處理ChatGPT的訓練數據需要2萬枚A100芯片。網上流傳的一份《AI芯片專家交流紀要》顯示,如果是對標ChatGPT的大模型,1萬顆A100芯片是入門券。

而據國盛證券估算,按單張A100芯片的價格為10萬元算,大模型訓練需要投入約10億元。

這還只是訓練階段的芯片成本,還有模型推出后的綜合運營成本,參考ChatGPT,半導體研究公司SemiAnalysis認為,GPT-3每天大規模服務用戶的運營成本高達70萬美元,一年則高達2.555億美元,新一代的GPT-4模型只會更燒錢。

除此外,還有數據采集、人工標注等軟性成本,加起來可謂“天價”。

像字節這樣的大廠或許有資金實力,但麻煩的是,燒錢的結果面臨不確定性。

雖然大模型前景可瞻,但距離大規模的商業落地還有不小的距離,目前仍在摸索階段,除了像釘釘、飛書、印象筆記等辦公場景的具體落地外,其他的應用場景都還停留在展望階段。

創世伙伴CCV合伙人梁宇曾對《21世紀經濟報道》表示,現在是通用人工智能商業化應用的前夜,AI大模型還沒有經過大量的商業包裝和訓練,需要從業者像園藝師一樣去修剪,形成符合行業規律的商業化產品。

IDC中國研究總監盧言霞則認為,大模型落地的不確定性在于,能不能成功落地,是否真的能產出比之前的AI更好的效果,需要多久才能落地等等。

通用大模型投入產出比的不確定性,或許會讓“ROI至上”的字節有所顧慮。

其二,時間就是力量,在過去幾年內,阿里、百度等企業已將大模型“基座”迭代過幾輪,而字節幾乎是從“零”開始,先發優勢已失,追趕不易,不如務實一點。

如今,字節大模型聚焦搜索、視頻生成等場景,離自身的業務落地更近,在算法和數據的儲備上極具優勢,可操作性更高。

火山引擎定位基礎設施的服務也是同理,其2021年開始切入IaaS模式,至今也有一定積累。

且網上流傳的一份《阿里云AI專家交流紀要0401》顯示,在國內大廠的AI算力儲備中,字節排名第二,僅次于阿里。

更重要的是,火山引擎該定位的商業落地十分明確,更容易保障正向現金流。

這是因為大模型訓練需要巨大算力支持,而云廠商是公認的算力等基礎設施的最佳載體。

正如阿里巴巴集團董事會主席兼首席執行官張勇所言,大模型是一場“AI+云計算”的全方位競爭,超萬億參數的大模型研發,是囊括了算法、底層龐大算力、網絡、大數據、機器學習等諸多領域的復雜系統性工程,需要超大規模AI基礎設施的支撐。

微軟便是先例,微軟Azure作為OpenAI的獨家云供應商,為ChatGPT提供算力和超級計算系統。除了OpenAI,微軟2023財年二季度財報電話會議顯示,安盛、聯邦快遞和H&RBlock等公司也都選擇Azure來部署和管理其模型。

像微軟這樣的云廠商被喻為大模型時代的“賣水人”,意為在大模型淘金的人未必能賺到錢,但為淘金人提供基礎服務的肯定能賺到。

硅谷知名風投A16Z的研究印證了這一點:生成式AI的大量資金最終都穩定地流向了基礎設施層,預計生成式AI總收入的10%~20%都流向了云提供商。

總之,商業落地風險小,自身又擅長,無怪乎火山引擎如此定位,而抓住這股“紅利”,有機會為其帶來新的市場增量。

在目前的云市場中,火山引擎還排不上名次,IDC最新發布的《中國公有云服務市場跟蹤》報告顯示,目前公有云服務市場的市場份額排名前五名分別為:阿里云、華為云、中國電信天翼云、騰訊云和AWS,它們總共占據了72%以上的市場份額,其余的云服務廠家份額有限。

或許,以基礎服務切入大模型戰場的火山引擎,未來有機會借此一搏新的市場格局。

火山引擎或遇天花板

目前看,火山引擎這條路走得還算順利。火山引擎總裁譚待表示,目前國內有數十家做大模型的企業,七成已經在火山引擎云上,包括AI技術公司MiniMax、智譜AI、昆侖萬維、毫末智行等。

關于“七成”的數據口徑,譚待的解釋是,該“七成”是火山引擎相關客戶與第三方機構統計的大模型企業數量之比,而能獲得這么多客戶是因為機器學習平臺解決了算力輔助的問題。

這些客戶案例表明,火山引擎在大模型訓練領域已有一定立足之地。

不過,從長遠看,火山引擎也面臨挑戰。

一方面,有能力做大模型的公司畢竟是少數,客戶規模的天花板很明顯。

據譚待透露,在火山引擎的大模型客戶中,通用大模型公司占比大約為三分之一,垂直行業公司占比約為三分之二。

分別來看,在通用大模型方面,雖然目前創業者眾,但大浪淘沙,最終留下的能有幾何?

一位互聯網投資人認為,中國版ChatGPT只會在5家公司里產生:BAT+字節+華為,因為大廠有錢有人有場景。

北京航空航天大學人工智能研究院教授吳文峻也有類似觀點,其在接受《中新經緯》采訪時表示,在目前宣布進軍大模型的三四十家企業中,最后能做成的或許不超過一半。

當客戶數量有明顯的天花板時,火山引擎的前景可能也有了“瓶頸”。

而在垂直行業模型方面,客戶數量雖然很多,但也可能面臨阿里云、百度云等平臺的“狙擊”。

原因在于,阿里云、百度云均自帶通用大模型輸出的能力,基于此,企業可更方便的生成垂直模型。

比如阿里云,阿里云智能集團CTO周靖人在此前的媒體采訪中表示,阿里云會為企業提供一個專屬數據空間,企業將相關信息存入,且不需要做任何數據預處理,便可調用“通義千問”,一鍵式生成自己的行業專屬大模型。

而如果在沒有大模型的火山引擎上做垂直模型訓練,企業要操心的事顯然更多。

上述投資人認為,垂直模型企業一般很少會自己從頭做,而是找一個還不錯的Pre-Train過的大模型,在此基礎上做InstructionTuning。

在此方面,阿里云等平臺可能更有優勢。

另一方面,未來云廠商的模式可能是賣模型+賣算力,而不只是賣算力。

Maas模型即服務的時代已經到來,阿里云、百度云不僅支持專屬行業模型的生成,還支持中小企業甚至個人基于大模型直接開發應用,這就好比個人開發者基于安卓操作系統開發App。

換句話說,模型層在未來可能成為新的基礎設施。

李彥宏在36Kr專訪中更是斷言,未來企業在購買云計算時,不看底層算力,而是看大模型的優劣。

這可能給火山引擎帶來一定沖擊,因為當大量中小企業或個人基于阿里云、百度云開發應用時,云廠商背后的算力也得到了間接調用,從而規模效應平攤了算力成本,最終使其基礎設施層面的服務也更具價格優勢,這頗有點“降維打擊”的意思。

事實上,“價格戰”已經開始了。

4月26日,在2023阿里云合作伙伴大會上,阿里云推出了史上最大規模的降價:核心產品價格全線下調,降幅最高至50%。

不過,火山引擎對此好像比較樂觀,至少現階段如此。

其邏輯在于,一來火山引擎拿到的時間窗口還比較長,譚待認為,國內距離全球最高水平的大模型還需要比較長的時間,現階段不可能用三四十分的模型去做應用,也不可能做好應用。

二來,火山引擎堅信未來是多云多模型時代,企業會避免單一依賴,而選擇使用多家云服務,同時,各行業都有自己高質量的私有語料,會形成多模型生態。

言下之意可能是,市場很大,火山引擎總會有立足之地。

總而言之,大模型市場的未來撲朔迷離,參與其中的任何一員的前途均可能有變數,“缺失”大模型的火山引擎如此,走務實路線的字節大模型也如此。

Tags:GPTCHAATGCHE人工智能chatGPT下載Blockchain Store TokenCATGIRLAlchemyDAO

BNB
500萬年薪招不到CTO,AI創業潮里的虛幻與真實_AIG:ATG

來源:豹變,作者:宋子豪,編輯:邢昀 圖片來源:由無界AI工具生成AI賽道在經過ChatGPT出圈、大廠紛紛下場布局,以及王慧文、王小川等明星創業者入局之后,風口終于來到了普通人的面前.

1900/1/1 0:00:00
定增不超 36.4 億搞大模型!云從科技研發不止,虧損未斷_BTC:USD

原創:南木 來源:柒財經 圖片來源:由無界AI工具生成五一假期前夕,上市公司云從科技定增計劃獲得上交所受理.

1900/1/1 0:00:00
深度解析全鏈游戲引擎MUD_KAM:KAMI

游戲引擎在游戲開發中發揮著至關重要的作用。對于全鏈上游戲來說,同樣需要一個能夠幫助開發者快速部署游戲邏輯的工具.

1900/1/1 0:00:00
對話清華教授胡翌霖:超人類主義與Web3的哲學思辨_DAO:BAI

時間:2023年5月4日21:00 主持人:baiyu 與談人:胡翌霖 嘉賓介紹:胡翌霖,清華大學科學史系副教授。北京大學哲學系博士。研究方向為技術史與技術哲學、媒介環境學.

1900/1/1 0:00:00
元宇宙“下行”和“上行”都在加速 可編程社會加速到來_AIG:AIGENIUS

AIGC不僅會改變數字世界,也很可能會快速影響現實世界,這一現象,我們可以稱之為“元宇宙下行”.

1900/1/1 0:00:00
河南設立首只元宇宙產業基金,今年國內元宇宙融資9.78億元_區塊鏈:元宇宙平臺公司合法嗎

來源:財聯社 記者徐賜豪 河南省在發布專項政策《河南省元宇宙產業發展行動計劃》后,又有新動作。日前該省首只元宇宙產業基金——河南文旅數字科技私募股權投資基金正式成立.

1900/1/1 0:00:00
ads