在之前的文章(《熱度“狂飆”的ChatGPT,亟待“合規剎車”》)中我們討論了當紅風頭正盛的ChatGPT,分析了它的技術本質、應用場景和法律風險初探。而在近期的《流浪地球》系列電影中,“虛擬數字人”的概念博人眼球。這不禁讓我想起另一個紅極一時的概念,“深度偽造(DeepFake)”、“AI換臉”。
深度合成技術
事實上,“虛擬數字人”的構建離不開包括偽造技術在內的深度合成技術,而ChatGPT是深度合成領域下的一類模型。數據深度合成(Deep Synthesis)本身是一個中性概念,泛指借助深度學習算法模型等智能化方案自動生成文本、圖像、語音、視頻等數據內容的一系列處理技術。其中文本因為其較強的字符特征,只需滿足空間序上的合理性,與視頻、音頻類型數據的處理思路略有不同。
分析師:比特幣的下一個測試水平在9萬美元附近:10月22日消息,Fundstrat在周三的一份報告中寫道:“比特幣超過6.5萬美元后的初始上行目標是72500美元左右,然后是8.9萬美元,人們認為,隨著比特幣突破之前的高點,這一水平肯定觸手可及。”比特幣創下歷史新高,原因是投資者對美國ETF的預期,還有機構對加密資產的持續投資,以及“鯨魚”的購買可能。
有很多人預測今年年底比特幣將達到10萬美元,包括BitMEX首席執行官Alexander Hoptner,他在周五接受彭博電視臺采訪時提出了這個水平。Fairlead Strategies的創始人Katie Stockton周一(在BTC創新高之前)表示,BTC突破新高提供了一個積極的長期趨勢,根據可測量的移動預測,比特幣的目標價格應該是8.98萬美元。(彭博社)[2021/10/22 20:49:16]
在ChatGPT一類的大型語言模型中,包含預訓練和下游任務訓練兩個部分。在預訓練階段,模型從大量的數據中學習復雜的上下文聯系,并將這種聯系向量化。Next-token-prediction 和 masked-language-modeling 是用于預訓練語言模型的核心技術。在第一種方法中,模型被給定一個詞序列作為輸入,并被要求預測序列中的下一個詞,而在第二種方法中,其輸入句子中的一些詞被替換為特殊token,例如[MASK],模型被要求預測應該插入到[MASK]位置的正確的詞。同時,在下游任務訓練中,In-content Learning(語境學習)被提出以提升模型在各個場景任務下的表現能力。譬如標注者會給模型一個提示性的輸入,讓模型更加清楚的感知到應該輸出的范式。
長沙試水數字人民幣:線下支持數字人民幣支付的商家已達3404個:長沙市金融辦相關負責人表示,自2020年11月長沙正式獲批成為數字人民幣試點城市以來,長沙市人民政府、人民銀行長沙中心支行組織工行、農行、中行、建行、交行、郵儲6家試點銀行機構和中移金科在涉及數字支付的各個領域開展數字人民幣試點。(湖南日報)[2021/2/6 19:03:28]
在圖像、音頻類深度偽造模型中,生成網絡”(generative network)或“生成器”(generator)負責制作復制原始數據集特征的合成數據如圖片、音頻記錄、視頻等,并制作“深度合成物”;鑒別網絡(discriminative network)或者說鑒別器(discriminator)則負責識別合成的數據,檢測該視頻是否為偽造。通過反復的“無監督學習”過程,“生成網絡”制作并修改“深度合成物”,直到“鑒別網絡”無法再檢測出該合成物系經“深度合成”,最終形成高保真的信息內容。
動態 | 浙江省政務服務平臺試水區塊鏈技術 累計開具醫療收費電子票據金額超40億:據浙江新聞消息,浙江省在2019年6月依托浙江政務服務網上線了全國首個區塊鏈電子票據平臺,在全省統一的移動政務服務平臺“浙里辦”試水區塊鏈技術,以提高政務服務效能。最新數據顯示,目前浙江全省已有包括浙一醫院、浙醫二院、邵逸夫醫院在內的超過400家各級醫療機構上鏈,累計開具醫療收費電子票據數量超1億,金額超過40億元。浙江政務服務網工程師吳鋼表示,隨著區塊鏈被應用到更多的辦事事項中,相關政務數據的存儲和應用會更安全。[2019/10/26]
總體而言,基于深度學習的數據合成技術隨著算力的發展逐漸從研究型走向應用型,主要應用在文本合成、視覺合成、聽覺合成等三大領域,因循數據收集、模型訓練、偽造內容等核心步驟,創造虛擬數字人及其所處的生態環境。
試水區塊鏈遭問詢,金溢科技上市后業績連降:金溢科技上市后業績連降,對市場質疑聲音認為,金溢科技有蹭熱點“區塊鏈”的意思。金溢科技則表示,針對投資者問題“公司在經過認真核實后做出了答復,答復內容符合公司實際情況”。金溢科技表示,公司目前已開展智能交通領域的區塊鏈理論與應用研究,處在初步研究階段,尚未形成相關業務,亦不存在相關產品情況、業務模式、盈利模式、前五大客戶及供應商等信息。公司尚未做出重大投入,尚未產生直接經濟收益,也尚未開發新產品、新發明或取得專利,對公司財務狀況和經營成果不會產生重大影響。[2018/3/22]
相關戲仿性應用產品迅速迭代,一方面,數據深度合成的正向應用將創建的文本段落、虛擬角色、聲音模擬、視頻渲染等廣泛應用到社交通訊、娛樂文化等眾多場景之中,提升信息處理效率,增進臨場體驗。另一方面,深度合成內容難以精準及時地予以鑒識,部分主體傳播虛假信息,操控受眾反應,嚴重威脅整個社會的安全體系與保障機制,因此亟待構建和完善規模化的規制體系。
資本開始試水“區塊鏈+游戲”:隨著消費熱度提升,壕鑫互聯、網易、黑桃互動等國內資本開始探索“區塊鏈+游戲”的市場。專業人士認為,未來包括游戲在內的泛娛樂產業有望基于區塊鏈應用技術打造全新產業生態圈,實現更高效便捷的交易機制,降低交易成本,提升產業鏈協同效率,形成更加誠信的產業生態。[2018/3/15]
《互聯網信息服務深度合成管理規定》解析
我國國家互聯網信息辦公室、中華人民共和國工業和信息化部、中華人民共和國部在2022年11月3日通過了《互聯網信息服務深度合成管理規定》(下稱“規定”),該規定基于深度合成應用的定性和風險的評估,從而提出包括內容標志、主體報備、用戶實名制、內容審核機制、救濟機制、個人信息保護和數據安全等方面的規制措施。
內容標志
深度合成服務提供者(下稱“服務提供者”)對使用其服務生成或者編輯的信息內容,應當采取技術措施添加不影響用戶使用的顯著標識,從而防止公眾混淆誤認。
主體報備和用戶實名制
具有輿論屬性或者社會動員能力的服務提供者和技術支持者應當按照《互聯網信息服務算法推薦管理規定》履行備案手續,并在網站、應用程序公示,同時按照國家有關規定開展安全評估(相關合規流程仍在摸索之中);服務提供商需要對深度合成服務使用者進行真實身份信息認證。颯姐團隊認為之后會出臺針對深度合成內容專門的備案手續。
內容審核機制和救濟機制
服務提供者應當加強深度合成內容管理。采取技術或者人工方式對輸入數據和合成結果進行審核,建立健全用于識別違法和不良信息的特征庫,完善入庫標準、規則和程序,記錄并留存相關網絡日志。
服務提供者應當建立健全辟謠機制。發現利用深度合成服務制作、復制、發布、傳播虛假信息的,應當及時采取辟謠措施,保存有關記錄,并向網信部門和有關主管部門報告。
個人信息保護和數據安全
服務提供者和技術支持者應當加強訓練數據管理,采取必要措施保障訓練數據安全,若數據集中包含個人信息,則需遵循個保法相關規定和配套標準。
算法安全評估
規定要求合成服務提供者和技術支持者應當加強技術管理,定期審核、評估、驗證生成合成類算法機制機理,強調了處理具有生物識別信息、可能涉及國家信息的模型、模板需要進行安全評估,相關審核、評估機制尚未明確要求。颯姐團隊認為該類評估由于企業對核心技術披露的限制以及當前評估技術的局限性,困難重重。
寫在最后
深度合成歸根結底是人工智能技術,尤其是算力發展的產物,其獨特的創造性注定會逐漸走入生產生活,因此監管體系和合規體系的構建是必然路徑。
深度合成技術上的特殊性要求我們一方面做好深度合成配套法律法規、標準的制定和完善,企業逐步摸索出一條合規路徑,另一方面投入到深度合成檢測追蹤技術的開發與應用,法律、技術雙管齊下,為做優產業發展環境提供重要基石,最終促進整個行業的健康發展。
肖颯lawyer
個人專欄
閱讀更多
金色早8點
金色財經
Arcane Labs
Odaily星球日報
歐科云鏈
澎湃新聞
深潮TechFlow
MarsBit
BTCStudy
鏈得得
金色周刊是金色財經推出的一檔每周區塊鏈行業總結欄目,內容涵蓋一周重點新聞、行情與合約數據、礦業信息、項目動態、技術進展等行業動態。本文是項目周刊,帶您一覽本周主流項目以及明星項目的進展.
1900/1/1 0:00:00作者:Maverick 近期,一款名為 ChatGPT 的人工智能聊天程序爆火讓AI 概念出圈,該程序在兩個月就獲得一億用戶,在近期日活更是突破千萬.
1900/1/1 0:00:00DeFi數據 1、DeFi代幣總市值:505.06億美元 DeFi總市值及前十代幣 數據來源:coingecko2、過去24小時去中心化交易所的交易量42.
1900/1/1 0:00:00文/Christine Kim,Galaxy Digital副研究員;譯/金色財經xiaozou 1、本文要點 自MEV-Boost創建以來.
1900/1/1 0:00:00金色財經記者 Jessy趙長鵬押注去中心化存儲賽道了。2月1日, BNB Greenfield 白皮書發布,這條定位于BNB Chain側鏈的區塊鏈,其主要功能是在一條鏈上實現存儲和計.
1900/1/1 0:00:00以太坊“上海”升級暫定在 3 月份,這是以太坊自去年9月PoS合并以來的首次重大升級,也稱為“硬分叉”.
1900/1/1 0:00:00