隨著Chat-GPT的橫空出世, 我們進入了AIGC帶來的顛覆性創新的時代。
AIGC(AI Generated Content),被認為是繼UGC、PGC之后的新型內容生產方式,AI繪畫、AI寫作等都屬于AIGC的分支,Chat-GPT就是一種自然語言處理的大AI語言模型,AI模型作為AIGC的具體形式,在訓練過程和推理過程中有哪些關鍵要素呢?
要素一:算力
高質量、多樣性的數據是訓練AI模型的基礎,算力為模型訓練提供了驅動能力。
在算力提供方面,對于AI模型訓練階段,算力用于執行大規模數據集上的反向傳播、參數更新和模型優化等任務。較高的算力可以加快訓練過程的速度,使得模型能夠更快地收斂和學習數據的特征。 對于AI模型推理階段,算力用于將已訓練好的模型應用于新的數據實例進行預測和推斷。在實時應用中,算力的高低決定了模型能夠處理的請求量和響應速度。
USV合伙人Fred Wilson:若美國禁止Web3,我們將加倍投資:5月24日消息,美國風險投資機構USV(聯合廣場風投)合伙人Fred Wilson發文《創新的自由》。他在文中表示,“USV曾在2014年因其Web3投資活動被約州金融服務部門(DFS)傳喚,當時我們聘請了一家律師事務所,回應了傳喚,這最終讓我在DFS官員面前公開作證。我在證詞中向DFS員工表示,與一些國家不同的是,美國尊重創新自由。
昨天,在USV的LP季度電話會議上,我們被問及美國對Web3的監管壓力是否會導致我們削減Web3投資規模,讓我想到了2014年那一刻。我對此表示,當他們想要禁止它時,我會選擇加倍投資。最強大的技術會整個體制內掀起恐懼的浪潮,當你看到他們眼中的這種恐懼時,就應該投資于造成這種恐懼的事業。[2023/5/24 15:23:04]
許多復雜的AI算法需要大量的計算資源。傳統AI的發展受限于硬件設備的性能和計算能力。尤其是在處理大規模數據集或進行高度復雜的模型訓練時,需要更強大的計算能力。
前Coinbase工程師創立的Web3基礎設施公司Scale3 Labs完成530萬美元融資:金色財經報道,由前Coinbase工程師創立的Scale3 Labs已經籌集了530萬美元的種子資金。本輪融資由Redpoint Ventures牽頭,Mysten Labs和Howard大學參投。
Scale3 Labs創始人Ola Muse和Karthik Kalyanaraman于8月離開Coinbase,并在兩個月內籌集并完成了種子輪融資。Scale3是一家基礎設施初創公司,特別專注于為區塊鏈節點運營商提供服務。Scale3目前在其名為Autopilot的平臺上支持Mysten Labs的Sui區塊鏈。接下來計劃支持以太坊、Solana和Aptos,Muse表示,Scale3的目標是在未來六個月內支持排名前10位的區塊鏈。有了新的資金,Scale3計劃發展其團隊和生態系統。(The Block)[2022/10/7 18:41:24]
目前,市面上對智能算力的共享還缺乏成熟的產品和方案,傳統的算力市場引入個人終端等第三方社會閑散算力,而算力服務運營者不具備對節點的有效掌控能力,并不能保證算力節點自身的安全與可信,使得安全防護的廣度和難度大幅提升。
FTX Web3基金負責人:Web3將吸引許多Web2開發人員:2月20日消息,FTX的Web3基金負責人Amy Wu對Jack Dorsey的Web3概念和風險投資公司a16z在該領域的巨大作用進行了權衡,她表示,懷疑論者將有助于保持Web3生態系統的健康。“有一種持續的敘事和偏執狂認為Web3將變得集中化,就像以前行業和互聯網等的興起一樣,”她說。\"我認為人們對此保持偏執,并大聲討伐“壞人”是件好事。此外,Amy Wu表示,Web3將吸引許多Web2開發人員加入其生態系統,特別是在今年晚些時候許多跨鏈協議上線之后。這些橋梁可以使開發人員對在特定鏈上開發新產品更有信心。隨著時間的推移,更好的安全性將會到來。(Decrypt)[2022/2/20 10:04:21]
數據基于隱私保護的數據共享是AIGC建模的重要支撐。
馬斯克嘲諷web3:我沒找到Web3:12月21日消息,特斯拉CEO埃隆·馬斯克在個人社交媒體平臺發文表示:有人看過web3 嗎? 我沒有找到。隨后Jack Dorsey評論回復稱:它在a和z之間。[2021/12/21 7:53:13]
在數據提供方面,AIGC的模型訓練需要使用大量的數據來獲得良好的性能,提升模型的推理能力和準確性。以ChatGPT為例,GPT的訓練使用了數百億個令牌(tokens)的數據。作為一個大型的AI語言模型,GPT的訓練數據包括了互聯網上廣泛的文本來源,包括網頁、書籍、文章、論文和其他公開可用的文本資源。這些數據覆蓋了多個領域和主題,使得模型能夠具備廣泛的知識和語言理解能力。
總而言之,訓練一個AI大模型需要海量的數據,單一企業的內部數據往往不足以滿足需求,因此這個過程中需要數據共享,然而全球數據量在飛速增長的同時,數據共享帶來的隱私泄露嚴重影響了數據價值的充分利用。IBM Security2022年7月份的報告顯示,2021 年 3 月至 2022 年 3 月期間全球 550 家企業出現的數據泄露事件,平均一起數據泄露產生的損失達到 440 萬美元,相比較2020年損失增加了13%,因此如何在保證數據隱私安全的前提下,進行數據流通和價值挖掘,并服務于AIGC技術的成長,成為業內日益關注的一個話題。
Web3作為建立在區塊鏈和去中心化技術之上的新一代互聯網,具有更大的去中心化、開放性和透明度。當AI結合Web3時,它可以獲得許多與傳統AI不同的優勢。
Web3的去中心化特性使得全球范圍內的計算資源能夠被整合和共享。這為AI模型訓練和推理提供了更大規模的計算能力。傳統AI模型訓練通常依賴于單一的計算設備或云服務提供商,而結合Web3可以利用全球網絡中的分布式計算資源,提供更高效和彈性的算力支持。
Web3的核心概念之一是去中心化和用戶掌握數據的權力。結合AI,Web3可以為用戶提供更多控制權和數據共享的機會,使其能夠以更加隱私安全的方式參與AI模型的訓練和數據共享。
Web3的智能合約和分布式計算平臺可以促進AI模型的開發和部署。智能合約可以提供去中心化的方式來管理和驗證模型的訓練過程,同時分布式計算平臺可以利用全球網絡中的計算資源來加速模型的訓練和推理。
Web3可以通過激勵機制和去中心化的數據市場,促使用戶提供更多高質量、多樣性的數據,從而改善傳統AI所面臨的數據限制問題。
Waterwheel的算力網絡結合TEE技術和區塊鏈技術構建一個可信、公開、高效的算力共享平臺,具備全網算力節點和區塊鏈節點的統籌盤點能力,能夠納管全球各地的閑置算力。
Waterwheel是基于區塊鏈和隱私計算打造去中心化的數據共享平臺,建設覆蓋全球的數據資產網絡,支持數據貢獻者個人進行數據登記和參與數據眾籌任務,并通過隱私計算技術解決數據流通過程中數據泄漏的安全問題,在保證數據安全隱私的前提下,為數據貢獻者帶來價值收益。
傳統的AIGC同樣缺乏隱私保護,用戶的獨特創意通過prompt輸入絕大部分會被直接公開,不同的AI模型提供和計費方式,也使用戶付出了更高的成本,由于AIGC的創作過程主要由AI模型完成,創作者很難通過傳統的版權交易方式獲得合理的收益。
Waterwheel融合區塊鏈、隱私計算、AI技術,打造安全可信的模型訓練平臺,通過使用隱私計算TEE技術的遠程證明和隱私環境,解決模型訓練方、數據提供方和算力提供方之間的互相不信任和數據泄漏風險的問題,保證模型訓練的全流程中,數據和模型處于“可用不可見”的狀態,幫助AI模型訓練方安全合規獲取更多的數據,同時將AI模型托管在隱私環境中,保證模型的安全和隱私性。
期待看到更多Web3.0平臺推動AI行業的發展和應用!
金色早8點
Odaily星球日報
金色財經
Block unicorn
DAOrayaki
曼昆區塊鏈法律
作者:DeFi^2(@DefiSquared);編譯:Babywhale,Foresight News 該 Twitter Thread 的作者為 DeFi^2,據其推特簡介顯示.
1900/1/1 0:00:00zkSync Era 主網 自3月24日上線以來,短短三個月,TVL便達到6.27 億美元,占整個Layer2板塊的6.48%,一躍成為第三大Layer2網絡,且每周增速將近 20%.
1900/1/1 0:00:002023年6月27日,Chibi Finance團隊實施了一起退出騙局,導致投資者資金損失超過100萬美元.
1900/1/1 0:00:00昨天(6月26日),MetaTdex創始人李俊、BG Trade CEO Ali Nauman、MetaDAO創始人徐偉卓等包括一些華人深度參與的《迪拜WEB3新動向》主題論壇在迪拜硅谷數字產業.
1900/1/1 0:00:00作者:MooMs,加密KOL;翻譯:金色財經xiaozou早早地發現那些有巨大增長空間的項目不是什么難事。我們來看看The Spartan Group為下一輪牛市做了哪些押注.
1900/1/1 0:00:002023年(北京時間)6月13日,OpenAI宣布,更新為了提高工作場所的人工智能能力,OpenAI宣布對其開創性的生成AI模型GPT-3.5 Turbo和GPT-4進行一系列更新.
1900/1/1 0:00:00