以太坊交易所 以太坊交易所
Ctrl+D 以太坊交易所
ads

A16Z:生成式人工智能領域的 4 個突破點_API:exchange-union

Author:

Time:1900/1/1 0:00:00

大型語言模型(LLMs)已經成為科技行業的熱點,為我們提供了一些令人稱奇的體驗——從幾秒鐘內編寫一周的代碼,到生成比與人類進行的對話更富有共情的對話。通過使用成千上萬個GPU進行數萬億令牌的數據訓練,LLMs展示了出色的自然語言理解能力,并改變了文案和代碼等領域,將我們推進了全新、令人興奮的生成式AI時代。與任何新興技術一樣,生成式AI也受到了一些批評。盡管這些批評在一定程度上反映了LLMs當前能力的局限性,但我們將這些阻礙視為進一步創新的機會,而不是技術本質性的缺陷。

為了更好地了解LLMs的近期技術突破,并為創始人和運營者做好未來準備,我們與一些領先的生成式AI研究人員進行了交談,他們正在積極構建和訓練一些最大最前沿的模型,包括Anthropic公司的首席執行官Dario Amodei、Cohere公司的首席執行官Aidan Gomez、Character.AI公司的首席執行官Noam Shazeer以及AI21 Labs的Yoav Shoham。這些交談確定了未來即將到來的4個關鍵創新方向:導向、記憶、"手和腳"以及多模態。在本文中,我們將討論這些關鍵創新如何在未來6到12個月內發展,以及對于對將AI整合到自己的業務中感興趣的創始人來說,如何利用這些新進展。

導向

許多創始人對在其產品和工作流程中使用LLMs表示擔憂,因為這些模型有可能產生幻覺和重現偏見。為了解決這些問題,一些領先的模型公司正在致力于改進導向技術——一種在LLMs輸出中更好地控制模型結果、讓模型更好地理解和執行復雜用戶需求的方法。Noam Shazeer在這方面提到了LLMs和孩子之間的相似之處:“這是如何更好地引導[模型]的問題...我們在LLMs上面臨的問題就是我們需要正確的方式告訴它們如何按照我們的要求行事。小孩子也是如此——他們有時會編造事情,對幻想和現實沒有一個明確的理解。”盡管在模型提供商和類似Guardrails和LMQL的工具出現之后,在導向能力方面已經取得了顯著的進展,研究人員仍在不斷取得進步,我們認為這對于更好地將LLMs產品化對于最終用戶至關重要。

a16z未來將繼續與硅谷銀行合作:金色財經報道,Andreessen Horowitz向投資者表示,將在未來繼續與硅谷銀行合作,同時也在制定一項長期的多元化計劃。(Business Insider)[2023/3/16 13:06:48]

在企業公司中,改進的導向尤其重要,因為不可預測行為的后果可能是昂貴的。Amodei指出,LLMs的不可預測性會讓人們感到不安,作為一個API提供者,他希望能夠“對著客戶說‘不,模型不會做這個’,或者至少很少會這樣做。”通過改進LLMs的輸出,創始人們可以更有信心地確保模型的性能與客戶需求相符。改進的導向還將為其他行業的廣泛采用鋪平道路,這些行業對精確性和可靠性的要求更高,例如廣告行業,其中廣告投放的風險很高。Amodei還認為改進的導向可以應用于“法律用例、醫療用例、存儲金融信息和管理金融賭注,以及需要保護公司品牌的場景。您不希望您所整合的技術是不可預測或難以預測或刻畫的。”通過更好的導向,LLMs還能夠在少量提示工程的情況下完成更復雜的任務,因為它們將能夠更好地理解整體意圖。

LLMs導向方面的進展還有可能在用戶期望定制和準確回應的敏感消費者應用中開啟新的可能性。雖然當用戶與LLMs進行對話或創造性交互時,他們可能會容忍較低準確性的輸出,但是當用戶使用LLMs來協助日常任務、指導重要決策或增強生活教練、治療師和醫生等專業人士時,他們希望得到更準確的輸出。有人指出,LLMs有望取代搜索等已深入人心的消費者應用,但在這成為真正可能之前,我們可能需要更好的導向來改善模型輸出并建立用戶信任。

關鍵突破點:用戶可以更好地定制LLMS的輸出。

記憶

Metatheory完成2400萬美元融資,a16z領投:金色財經消息,Web3互動媒體公司Metatheory完成2400萬美元A輪融資,a16z領投,Pantera Capital、FTX Ventures、Breyer Capital、Merit Circle、Recharge Theme Ventures、Dragonfly Capital Partners、Daedalus、Sfermion和Global Coin Research等參投。

據介紹,Metatheory由Twitch聯合創始人Kevin Lin創立,旨在構建Web3游戲和虛擬世界,重點關注建立具有超越游戲本身的強大IP的特許經營權。[2022/5/17 3:20:23]

由LLMs驅動的文案撰寫和廣告生成應用程序已經取得了巨大的成功,從而在營銷人員、廣告商和創業者中迅速流行起來。然而,目前大多數LLMs的輸出相對泛化,這使得難以將它們用于需要個性化和情境理解的用例。雖然提示工程和微調可以提供一定程度的個性化,但是提示工程的可擴展性較差,而微調往往代價高昂,因為它需要一定程度的重新訓練,并且通常需要與大多數閉源LLMs緊密合作。為每個個體用戶進行微調模型通常是不可行或不可取的。

上下文學習是實現這一目標的圣杯,其中LLMs從您的公司生成的內容、您公司的特定行話和特定上下文中獲取信息,以創建更精細、針對特定用例的輸出。為了實現這一目標,LLMs需要增強的記憶能力。LLM記憶有兩個主要組成部分:上下文窗口和檢索。上下文窗口是模型可以處理和用于指導其輸出的文本,除了它被訓練的數據語料庫之外。檢索是指從模型的訓練數據語料庫之外的數據體中檢索和引用相關信息和文檔(“上下文數據”)。目前,大多數LLMs的上下文窗口有限,無法原生地檢索附加信息,因此生成的輸出缺乏個性化。然而,通過更大的上下文窗口和改進的檢索,LLMs可以直接提供更加精細的、針對個別用例的輸出。

Audius戰略顧問加入由a16z前合伙人創辦的加密基金Variant Fund:10月29日消息,區塊鏈音樂流媒體Audius戰略顧問Cooper Turley發推稱,加入由a16z前合伙人Jesse Walden創辦的加密投資基金Variant Fund,作為其最新的風險投資合伙人。除Cooper Turley外,Variant Fund團隊包括a16z前合伙人JesseWalden、前DTC Capital投資顧問SpencerNoon、AtelierVentures創始合伙人LiJin(前a16z合伙人)、前AccompliceVC研究分析師JonItzler、she256聯合創始人MedhaKothari、前CompoundLabs總法律顧問JakeChervinsky。[2021/10/29 6:20:01]

特別是通過擴展上下文窗口,模型將能夠處理更大量的文本并更好地保持上下文,包括在對話中保持連貫性。這將進一步顯著提高模型在需要更深入理解較長輸入的任務中的能力,例如總結長篇文章或在長時間對話中生成連貫且上下文準確的回應。在上下文窗口方面,我們已經看到了顯著的改進——GPT-4具有8k和32k標記的上下文窗口,相比之下,GPT-3.5和ChatGPT的上下文窗口分別為4k和16k標記,而Claude最近將其上下文窗口擴展到驚人的100k標記。

僅擴展上下文窗口并不能充分改善內存,因為推理的成本和時間與提示的長度呈準線性甚至二次方關系。檢索機制通過與提示相關的上下文數據增強和完善LLM的原始訓練語料庫。由于LLMs是在一個信息體上進行訓練的,并且通常難以更新,檢索的兩個主要好處是根據Shoham的說法:“首先,它允許您訪問在訓練時沒有的信息源。其次,它使您可以將語言模型聚焦在您認為與任務相關的信息上。”矢量數據庫(例如Pinecone)已成為高效檢索相關信息的事實標準,并且作為LLMs的內存層,使模型更容易快速準確地搜索和引用海量信息中的正確數據。

a16z啟動4億美元種子基金以擴展新技術:8月27日消息,據風險投資公司Andreessen Horowitz(a16z)最新公告顯示,他們將推出一個價值4億美元的種子基金。該風投表示,種子投資長期以來一直是VC核心,是對創業團隊、創業想法的真正投資押注。今年六月,a16z推出22億美元的加密基金,專注于投資加密網絡和數字資產行業的創業團隊,目前該風投在加密基礎設施、DAO、DeFi和NFT等垂直領域都有投資。憑借最新推出的種子基金,該公司將擴大其他“機會網絡”,并與技術領域里有雄心勃勃想法的頂級團隊一起學習。(blockworks)[2021/8/28 22:42:36]

增加的上下文窗口和檢索將在企業用例中尤為重要,例如導航大型知識庫或復雜數據庫。公司將能夠更好地利用其專有數據,如內部知識、歷史客戶支持票據或財務結果,作為LLMs的輸入,而無需進行微調。改進LLMs的記憶將在培訓、報告、內部搜索、數據分析和業務智能以及客戶支持等領域帶來改進和深度定制的能力。

在消費者領域,改進的上下文窗口和檢索將實現強大的個性化功能,從而革新用戶體驗。Noam Shazeer認為:“其中一個重大突破將是開發出一種具有非常高的內存容量,可以針對每個用戶進行定制,同時在規模上仍然具有成本效益的模型。您希望您的治療師了解您的生活方方面面;您希望您的老師了解您已經掌握的知識;您希望生活教練能夠就正在發生的事情向您提供建議。他們都需要上下文。” Aidan Gomez對此發展也表示興奮。“通過讓模型訪問與您獨特相關的數據,如您的電子郵件、日歷或直接消息,”他說,“模型將了解您與不同人的關系以及您如何與朋友或同事交談,并在這種情況下幫助您最大程度地提供幫助。”

a16z正為第二支加密貨幣基金尋求4.5億美元資金:金色財經報道,硅谷投資巨頭Andreessen Horowitz(a16z)正為其第二支專注于加密貨幣的基金籌集4.5億美元資金。其中一位知情人士說,a16z可能會在大約一周內敲定新基金,但尚未對其規模設定硬性上限。據此前報道,該投資公司的第一支加密專用基金在2018年中期吸引了3.5億美元的資本承諾。[2020/4/15]

關鍵突破點:LLMs將能夠考慮大量相關信息,并提供更個性化、定制和有用的輸出。

“手臂和腿部”:賦予模型使用工具的能力

LLMs的真正威力在于使自然語言成為行動的媒介。LLMs對常見且有詳細文檔的系統具有復雜的理解能力,但它們無法執行從這些系統中提取的任何信息。例如,OpenAI的ChatGPT、Anthropic的Claude和Character AI的Lily可以詳細描述如何預訂航班,但它們本身無法原生地預訂航班(盡管像ChatGPT的插件等技術進展正在推動這一邊界)。Amodei表示:“這個大腦在理論上擁有所有這些知識,只是缺少從名稱到按鈕的映射。”他說:“連接這些電纜并不需要太多的訓練。你有一個沒有實體的大腦,它知道如何移動,但它還沒有連接上手臂和腿部。”

隨著時間的推移,我們已經看到公司不斷改善LLMs使用工具的能力。像必應和谷歌這樣的老牌公司和Perplexity和You.com這樣的初創公司推出了搜索API。AI21 Labs推出了Jurassic-X,它通過將模型與一組預定工具(包括計算器、天氣API、維基百科API和數據庫)結合起來,解決了獨立LLMs的許多缺陷。OpenAI推出了ChatGPT的插件測試版,允許ChatGPT與Expedia、OpenTable、Wolfram、Instacart、Speak、網絡瀏覽器和代碼解釋器等工具進行交互,這一突破被認為類似于蘋果的“應用商店”時刻。最近,OpenAI在GPT-3.5和GPT-4中引入了函數調用 ,允許開發者將GPT的能力與任何外部工具進行鏈接。

通過從知識挖掘轉向行動導向,增加手臂和腿部的能力有望在各種公司和用戶類型之間實現一系列用例。對于消費者而言,LLMs可能很快就能給出菜譜建議,然后為您訂購所需的食材,或者建議一個早午餐地點并為您預訂餐桌。在企業領域,創始人可以通過接入LLMs使他們的應用程序更易于使用。正如Amodei所指出的:“對于從用戶界面角度來說非常難以使用的功能,我們可能只需用自然語言描述即可實現復雜的操作。”例如,對于Salesforce等應用程序,LLM集成應允許用戶用自然語言進行更新,并使模型自動進行這些更改,從而大大減少了維護CRM所需的時間。像Cohere和Adept這樣的初創公司正在致力于將LLMs集成到這類復雜工具中。

Gomez認為,雖然LLMs能夠在2年內使用Excel等應用程序的可能性越來越大,但“仍然需要進行許多細化工作。我們將擁有第一代能夠使用工具的模型,這將是引人注目但易碎的。最終,我們將獲得夢寐以求的系統,我們可以將任何軟件交給模型,并附上一些描述,例如‘這是工具的功能,這是如何使用它的’,它將能夠使用它。一旦我們可以為LLMs提供特定和通用的工具,它所帶來的自動化將成為我們領域的巔峰之作。”

關鍵突破點:LLMs將能夠與我們今天使用的工具進行更加有效的交互。

多模態

盡管聊天界面對許多用戶來說令人興奮和直觀,但人類聽和說語言的頻率可能與寫或讀語言的頻率相當或更高。正如Amodei所指出的:“AI系統能做的事情是有限的,因為并不是所有的事情都是文本。”具備多模態功能的模型能夠無縫地處理和生成多種音頻或視覺格式的內容,將這種交互擴展到超越語言的領域。像GPT-4、Character.AI和Meta的ImageBind這樣的模型已經能夠處理和生成圖像、音頻和其他模態,但它們在這方面的能力還比較基礎,盡管進展迅速。用Gomez的話說,我們的模型在字面上今天是盲的,這一點需要改變。我們構建了很多假設用戶能夠看到的圖形用戶界面(GUI)。

隨著LLMs不斷進化,更好地理解和與多種模態交互,它們將能夠使用依賴GUI的現有應用程序,比如瀏覽器。它們還可以為消費者提供更加引人入勝、連貫和全面的體驗,使用戶能夠超越聊天界面進行互動。Shazeer指出:“多模態模型的許多出色整合可以使事物更具吸引力和與用戶更緊密相連。”他還說:“我認為,目前大部分核心智能來自文本,但音頻和視頻可以使這些事物更有趣。”從與AI導師進行視頻聊天到與AI合作迭代和編寫電視劇劇本,多模態有潛力改變娛樂、學習與發展以及跨各種消費者和企業用例的內容生成。

多模態與工具使用密切相關。盡管LLMs最初可能通過API與外部軟件進行連接,但多模態將使LLMs能夠使用設計給人類使用但沒有自定義集成的工具,例如傳統的企業資源計劃(ERP)系統、桌面應用程序、醫療設備或制造機械。在這方面,我們已經看到了令人興奮的進展:例如,谷歌的Med-PaLM-2模型可以合成乳腺攝影和X射線圖像。而且從長遠來看,多模態(特別是與計算機視覺的集成)可以通過機器人、自動駕駛車輛和其他需要與物理世界實時交互的應用程序,將LLMs擴展到我們自己的物理現實中。

關鍵突破點:多模態模型能夠在沒有重大定制的情況下推理圖像、視頻,甚至物理環境。

盡管LLMs存在一些實際限制,但研究人員在短時間內對這些模型進行了驚人的改進。事實上,我們在撰寫本文時已經多次更新過它,這證明了該領域技術的快速發展。Gomez也表示同意:“LLM在20次中有1次編造事實顯然還是太高了。但我真的非常有信心,這是我們第一次構建這樣的系統。人們的期望相當高,所以目標已經從‘計算機很笨,只會做數學’變成了‘一個人可能做得更好’。我們已經足夠彌合差距,以至于批評集中在人類能做到什么程度上。”

我們特別對以下4項創新感到興奮,它們正處于改變創業者構建產品和經營公司方式的臨界點。從長遠來看,潛力更大。Amodei預測:“在某個時刻,我們可能會擁有一個模型,它能夠閱讀所有生物數據,并找出治愈癌癥的方法。”現實情況是,最好的新應用可能仍然是未知的。在Character.AI,Shazeer讓用戶開發這些用例:“我們將看到許多新的應用程序解鎖。對我來說很難說出這些應用程序是什么。將會有數百萬個應用程序,用戶比少數工程師更善于發現如何使用技術。”我們迫不及待地期待這些進步將如何影響我們作為創業者和公司在生活和工作中的方式,因為這些新工具和能力賦予了我們新的力量。

感謝Matt Bornstein、Guido Appenzeller和Rajko Radovanovi?在撰寫過程中提供的意見和反饋。

DoraFactory

個人專欄

閱讀更多

金色早8點

Odaily星球日報

金色財經

Block unicorn

DAOrayaki

曼昆區塊鏈法律

Tags:LMSGPTCHAAPIlms幣發行量XGPTexchange-unionblockchain.infoapi

抹茶交易所
揭開Lido崛起的面紗:它如何鞏固其在以太坊質押市場的龍頭地位_IDO:LID

作者:Ebunker 憑借堅實的基本面,強大的生態系統和值得信賴的社區,規模最大的流動性質押協議 Lido Finance 已成為市占率最高的 LSD質押平臺.

1900/1/1 0:00:00
隨著以太幣質押收益的下降 協議將不得不尋求創新解決方案_BLO:BLOCKS

作者:Aleks Gilbert 來源:dlnews 編譯:金色財經,善歐巴 摘要 隨著更多的以太幣被質押以保障網絡安全,質押收益率正在下降最近的年度質押收益率為5%.

1900/1/1 0:00:00
OP+ZK Hybrid Rollup會成為以太坊擴容的終極未來嗎?_IMI:OPT

我并不打算在這篇文章里詳細敘述 ZK 和 Optimistic Rollups 的運作原理,如果我要花時間去解釋 Rollups 的本質,那么這篇文章將會過于冗長.

1900/1/1 0:00:00
金色早報 | BCH短時突破310美元 累計漲幅已達208%_區塊鏈:比特幣今日價格行情價格查詢

▌BCH短時突破310美元,自EDXMarkets宣布提供BCH交易服務以來漲幅已達208%金色財經報道,行情顯示,BCH短時突破310美元,現報308.4美元,日內漲幅達到27.8%.

1900/1/1 0:00:00
晚間必讀 | 為什么我們仍然看好 BTC 下半年的表現?_DFI:GuildFi

黃立成堅定地說自己一向是個合法者,而ZachXBT 則表示自己會予以反擊并貼出揭秘原文。在法院判決結果出來前孰是孰非無法定論,但雙方勝訴的信心都顯得十分強大,那這種自信究竟從何而來?點擊閱讀LS.

1900/1/1 0:00:00
貝萊德的”監督共享協議“怎樣預防比特幣 ETF 操縱?_OST:NEUROS價格

作者:BlockWorks;編譯:比推BitpushNews Mary Liu在最新一波現貨比特幣 ETF 申請文件中.

1900/1/1 0:00:00
ads