ChatGPT引爆的AI熱潮也“燒到了”金融圈,彭博社重磅發布為金融界打造的大型語言模型——BloombergGPT。
3月30日,根據彭博社最新發布的報告顯示,其構建迄今為止最大的特定領域數據集,并訓練了專門用于金融領域的LLM,開發了擁有500億參數的語言模型——BloombergGPT。
報告顯示,該模型依托彭博社的大量金融數據源,構建了一個3630億個標簽的數據集,支持金融行業內的各類任務。該模型在金融任務上的表現遠超過現有模型,且在通用場景上的表現與現有模型也能一較高下。
一般來說,在NLP領域,參數數量和復雜程度之間具有正相關性,GPT-3.5模型的參數量為2000億,GPT-3的參數量為1750億。
國務院辦公廳:加快貿易金融區塊鏈平臺建設:據官網公告,國務院辦公廳發布關于加快發展外貿新業態新模式的意見。意見表示,探索區塊鏈技術在貿易細分領域中的應用,加快貿易金融區塊鏈平臺建設。[2021/7/9 0:40:11]
關于BloombergGPT
報告指出,研究人員利用彭博社現有的數據,對資源進行創建、收集和整理,通過構建迄今為止最大的特定領域數據集來完成BloomberGPT,并基于通用和金融業務的場景進行混合模型訓練:
彭博社主要是一家金融數據公司,數據分析師在公司成立的四十年的時間里收集了大量的金融文件,擁有廣泛的金融數據檔案,涵蓋了一系列的主題。
我們將這些數據添加到公共數據集中,以創建一個擁有超過7000億個標簽的大型訓練語料庫。
綠地金融牽頭財團將成立暫命名為綠聯銀行的數字銀行,注冊資本不低于1億美元:綠地控股集團股份有限公司發布關于“綠地金融牽頭的財團獲得新加坡數字批發銀行牌照”的公告。公告稱,公司全資子公司綠地金融投資控股集團有限公司牽頭香港聯易融有限公司和北京協力創成股權投資基金組成的財團獲得了新加坡數字批發銀行牌照 (DWB),DWB牌照將專注于為中小型企業和其他非零售部門提供服務。
綠地金融牽頭的財團在牌照獲批后,將成立暫命名為綠聯銀行(GLL Bank)的數字銀行,預計注冊資本不低于1億美元。綠地金融牽頭的財團將致力于把中國領先的金融科技和服務中小企業的經驗引入新加坡,同時將持續秉承ESG理念, 通過各方的豐富資源和能力為新加坡市場做出貢獻。
鑒于上述數字批發銀行業務為公司擬在新加坡開展的新金融業務,尚無成熟的可借鑒模式,且根據新加坡金融管理局預計2022年初才能開始運營,因此該業務短期內對公司經營業績無重大影響。敬請廣大投資者注意投資風險。[2020/12/7 14:27:08]
使用這個訓練語料庫的一部分,我們訓練了一個具有彭博風格的,達500億參數的模型,該模型是根據Hoffmann和LeScao等人的指導方針設計,基于通用和金融業務的場景進行混合模型訓練。
聲音 | IBM主管:CBDC可緩解導致2008年金融危機的風險:據cointelegraph報道,IBM的央行加密貨幣(CBDC)解決方案全球主管、金融服務區塊鏈首席技術官(CTO)Stanley Yong 11月14日在接受CNBC的采訪時表示,CBDC可以幫助緩解或即將導致2008年金融危機的風險。Yong認為,CBDC是唯一可以確定金融服務所需結算的方式,特別是考慮到2008年雷曼危機期間出現的各種風險。他建議,將中央銀行在數字系統中用于資金轉移的方式靈活地與區塊鏈系統中各種商品、衍生品和股票的交付機制相結合,將是擺脫2008年看到的各種風險的方式。[2018/11/15]
結果表明,我們的混合訓練方法使我們的模型在金融任務上的表現大大超過了現有的模型,而在通用場景上的表現則與之相當甚至優于現有模型。
聲音 | 李禮輝:基于區塊鏈的供應鏈金融等平臺可達成可靠性、安全性的標準:據世界浙商網消息,中國銀行原行長、中國區塊鏈研究工作組組長李禮輝近日表示,基于區塊鏈技術的資產托管、聯合貸款、供應鏈金融等業務平臺,可達成不同參與方歸并校驗、實時共管,同時達成可靠性、安全性標準。金融科技創新得以成功的基本要素是效率更高、成本更低、具有商業價值的經濟模式、具有社會認可的可靠性和安全度。[2018/11/7]
1.BloombergGPT優勢:特定領域模型仍有其不可替代性且彭博數據來源可靠
在論文中,彭博社指出,現階段,通用的自然語言處理模型可以涵蓋許多領域,但針對特定領域模型仍有其不可替代性,因彭博社的大多數應用均為金融領域,著手構建了一個針對金融領域的模型尤其優勢,同時可以在通用LLM基準測試上保持競爭力:
俄羅斯國家杜馬一審通過數字金融資產法草案:數字資產持有者只能進行將代幣兌換成法幣的交易:俄羅斯國家杜馬一審通過了數字金融資產法草案。該法案規定,數字金融資產所有者只可以執行一種交易,目前指的是將代幣兌換成盧布或外幣的交易。該文件是根據俄羅斯聯邦總統的指示于2017年10月10日舉行金融領域數字技術使用會議之后制定的。該法案引入了數字化的金融資產,其中包括加密貨幣、以及立法的定義建立一個新的合同類型的電子形式訂立合同 - 智能合同,履行義務在其下進行使用數字金融技術。與此同時,該法案直接規定,數字金融資產不是俄羅斯聯邦境內的合法支付手段。[2018/5/22]
除了構建金融領域的LLM外,本文的經驗也為其他研究領域的專用模型提供了參考。我們的方法是在特定領域和一般數據源上訓練LLM,以開發在特定領域和通用基準上表現優異的模型。
此外,我們的訓練數據不同于傳統的網絡爬取數據,網絡上的數據總有重復和錯誤,但我們的數據來源可靠。
2.BloombergGPT的訓練數據集:
BloombergGPT的訓練數據庫名為FINPILE,由一系列英文金融信息組成,包括新聞、文件、新聞稿、網絡爬取的金融文件以及提取到的社交媒體消息。
為了提高數據質量,FINPILE數據集也使用了公共數據集,例如ThePile、C4和Wikipedia。FINPILE的訓練數據集中大約一半是特定領域的文本,一半是通用文本。為了提高數據質量,每個數據集都進行了去重處理。
對金融領域的理解更準
報告指出,在金融領域中的自然語言處理在通用模型中也很常見,但是,針對金融領域,這些任務執行時將面臨挑戰:
以情感分析為例,一個題為“某公司將裁員1萬人”,在一般意義上表達了負面情感,但在金融情感方面,它有時可能被認為是積極的,因為它可能導致公司的股價或投資者信心增加。
報告指出,從測試來看,BloombergGPT在五項任務中的四項表現最佳,在NER中排名第二。因此,BloombergGPT有其優勢性。
測試一:ConvFinQA數據集是一個針對金融領域的問答數據集,包括從新聞文章中提取出的問題和答案,旨在測試模型對金融領域相關問題的理解和推理能力。
測試二:FiQASA,第二個情感分析任務,測試英語金融新聞和社交媒體標題中的情感走向。
測試三:標題,數據集包括關于黃金商品領域的英文新聞標題,標注了不同的子集。任務是判斷新聞標題是否包含特定信息,例如價格上漲或價格下跌等。
測試四:FPB,金融短語庫數據集包括來自金融新聞的句子情緒分類任務。
測試五:NER,命名實體識別任務,針對從提交給SEC的金融協議中收集金融數據,進行信用風險評估。
對于ConvFinQA來說,這個差距尤為顯著,因為它需要使用對話式輸入來對表格進行推理并生成答案,具有一定挑戰性。
ChatGPT為彭博點贊
華爾街見聞就這個問題專門詢問了ChatGPT,ChatGPT認為BloombergGPT是一項很有意義的技術進步:
它是專門為金融領域開發的一種語言模型,可以更好地處理金融領域的數據和任務,并且在金融領域的基準測試中表現出色。
這將有助于金融從業者更好地理解和應用自然語言處理技術,促進金融科技的發展。同時,BloombergGPT還可以為其他領域的語言模型的發展提供參考和借鑒。總的來說,BloombergGPT是一個有益的技術創新。
作者:金色財經Jason. 金色財經區塊鏈4月2日訊經典移動方塊益智游戲“俄羅斯方塊”近日宣布推出Web3忠誠度計劃,人們發現越來越多品牌開始進入這一領域.
1900/1/1 0:00:00對于政府而言,為企業家和創新者提供一個安全的沙箱來探索Web3世界,同時確保投資者在網關處的安全可能是一個成功的策略.
1900/1/1 0:00:00這兩天,一篇關于“GPT-4救了我狗的命”的帖子屬實有點火:短短一兩天就有數千人轉發,上萬人點贊,網友在評論區討論得熱火朝天.
1900/1/1 0:00:00自chatGPT火遍全球之后,各國又掀起了一波AI領域的創業潮。馬斯克在采訪中也強調人工智能的發展可能會給人類帶來空前災難.
1900/1/1 0:00:00Polygon和Avalanche雙方都對自己的應用鏈解決方案Supernets和Subnets投入了很多資源,現在它們發展如何呢.
1900/1/1 0:00:00作者:waynezhang.ethTwitter:@Wayne24699837上周,我們發布了LSDFi生態與LSDFiWar報告,但無論是選擇的項目還是思考的背景都是以太坊.
1900/1/1 0:00:00