前言
上一篇我們講述了人工智能,機器學習與聯邦學習的關系。
這篇我們將繼續探索聯邦學習方法的分類。聯邦學習方法被分為橫向聯邦學習、縱向聯邦學習和遷移聯邦學習三類,適用于解決不同的實際問題。
橫向聯邦學習
在兩個數據集的用戶特征重疊較多而用戶重疊較少的情況下,把數據集按照用戶維度切分,并取出雙方用戶特征相同而用戶不完全相同的那部分數據進行訓練。這種方法叫做橫向聯邦學習。
▲?應用場景
橫向聯邦學習的本質是樣本的聯合,適用于參與者間業態相同但觸達客戶不同,即特征重疊多,用戶重疊少時的場景,比如不同地區的銀行間,他們的業務相似,但用戶不同。
TRON數字錢包科普資料《波場錢包的現在過去與未來》已上線:據最新消息顯示,由TokenPocket聯合波場TRON官方,以及 TokenPocket 社區志愿者共同撰寫的《波場錢包的現在過去與未來》已正式上線。《波場錢包的現在過去與未來》又稱為波場錢包小白書,詳細介紹了當前TRON錢包與TRON生態密切結合的實例,是目前市面上最為詳細的TRON數字錢包科普資料。波場錢包作為波場公鏈生態中極為重要的入口,是波場生態的重要構成要素。波場錢包從一開始只提供權限管理、轉賬收款、節點投票等基礎功能,到如今不僅可以為用戶提供法幣交易、閃兌和去中心化交易所等方便快捷的交易服務,還能讓用戶直接在錢包上體驗波場上DApp,挖礦、DeFi、Staking等資產增值服務。詳情見原文鏈接。[2020/8/20]
比如,有兩家不同地區銀行?—?上海與杭州兩地的兩家銀行,它們的用戶群體分別來自上海與杭州的居住人口,用戶的交集相對較小。由于銀行間的業務相似,記錄的用戶特征大概率是相同的。因此,橫向聯邦學習可以被考慮用來構建聯合模型。
人大附中物理老師李永樂科普拜占庭將軍問題和區塊鏈:5月14日,人大附中物理老師、科普視頻網紅李永樂在其公眾號發布視頻《拜占庭將軍問題是什么?區塊鏈如何防范惡意節點?》。李永樂老師在視頻中對拜占庭將軍問題和區塊鏈進行了講解,他表示,拜占庭將軍問題本質上指的是,在分布式計算機網絡中,如果存在故障和惡意節點,是否能夠保持正常節點的網絡一致性問題。在近40年的時間里,人們提出了許多方案解決這一問題,稱為拜占庭容錯法。例如蘭波特自己提出了口頭協議、書面協議法,后來有人提出了實用拜占庭容錯PBFT算法,在2008年,中本聰發明比特幣后,人們又設想了通過區塊鏈的方法解決這一問題。區塊鏈通過算力證明來保持賬本的一致性,也就是必須計算數學題,才能得到記賬的權力,其他人對這個記賬結果進行驗證,如果是對的,就認可你的結果。與拜占庭問題比起來,就增加了叛徒的成本。[2020/5/14]
于2017年,Google提出了一個針對安卓手機模型更新的數據聯合建模方案:在單個用戶使用安卓手機時,不斷在本地更新模型參數并將參數上傳到安卓云上,從而使特征維度相同的各數據擁有方建立聯合模型的一種聯邦學習方案。
聲音 | 上海股交所總經理:區塊鏈想要大規模發展要做好社會科普工作:金色財經報道,上海股交所總經理張云峰表示,區塊鏈當前還處于一個“概念”的階段,距離成熟應用,影響到百姓的日常生活還有很長的路要走。對于“區塊鏈”和其會帶來的社會和經濟效果,沈陽應當持審慎的態度。區塊鏈想要大規模發展,一方面要做好這項復雜技術的社會科普工作,加快社會大眾對區塊鏈的了解。另一方面,要充分發揮市場的作用,讓企業用實實在在的技術創新,賦能實體經濟的發展。[2019/11/17]
▲?學習過程
Step1.參與方各自從協調方上下載最新模型;
Step2.每個參與方利用本地數據訓練模型,加密梯度上傳給協調方,協調方聚合各用戶的梯度以更新模型參數;
金色財經獨家分析 監管機構、媒體、業界提示詐騙風險 區塊鏈科普道阻且長:新華社今日發文表示,近來“區塊鏈”類詐騙案件頻發,不法分子以“投資虛擬貨幣周期短、收益高、風險低”為借口,騙取用戶信任并誘使其轉賬進行投資。無獨有偶,同日消息,騰訊手機管家安全專家也提醒此類風險,并從技術上提出防騙建議。在美國,監管機構警示加密貨幣欺詐現象普遍承諾高收益而不披露潛在風險。金色財經獨家分析,不法分子假借新技術之名進行詐騙,一方面是抓住民眾趨利的心理,一方面反映出區塊鏈科普的欠缺。區塊鏈是新興科技和底層技術并有改變社會生產關系的潛力,應該進行系統性的科普教育,當前,部分大學已經開始設置了區塊鏈課程,但對于普通民眾仍然有科普的需求,人們應該了解到系統和正確的知識,不僅要了解區塊鏈的好,也要明確局限和弊端,以在高收益的誘惑下,保持清醒客觀。[2018/4/11]
Step3.協調方返回更新后的模型給各參與方;
Step4.各參與方更新各自模型。
縱向聯邦學習
在兩個數據集的用戶重疊較多而用戶特征重疊較少的情況下,把數據集按照特征維度切分,并取出雙方用戶相同而用戶特征不完全相同的那部分數據進行訓練。這種方法叫做縱向聯邦學習。
▲?適用場景
縱向聯邦學習的本質是特征的聯合,適用于用戶重疊多,特征重疊少的場景,比如同一地區的商超和銀行,他們觸達的用戶都為該地區的居民,但業務不同。
比如,有兩個不同機構,一家是某地的銀行,另一家是同一個地方的電商。它們的用戶群體很有可能包含該地的大部分居民,用戶的交集可能較大。由于銀行記錄的都是用戶的收支行為與信用評級,而電商則保有用戶的瀏覽與購買歷史,因此它們的用戶特征交集較小。縱向聯邦學習就是將這些不同特征在加密的狀態下加以聚合,以增強模型能力的聯邦學習。
▲?學習過程
介紹一種簡單通用的縱向聯邦學習的建模學習過程,加密方式也以半同態加密的PallierEncryption為主。
訓練前:
先采用加密文本對齊的技術手段,在系統內篩選出不同企業之間的共同用戶。
訓練時:
Step1.協調方C向企業A與B發送公鑰,用來加密所需傳輸的數據;
Step2.A和B分別計算和自己相關特征的中間結果,并加密完后進行交互,用來求解各自的梯度結果和損失結果;
Step3.A和B分別計算各自加密后的梯度并添加掩碼后發送給C,同時B計算加密后的損失先發送給C;
Step4.C解密梯度和損失后回傳給A和B,A、B去除掩碼并更新模型。
遷移聯邦學習
在兩個數據集的用戶與用戶特征重疊都較少的情況下,不對數據進行切分,而可以利用遷移學習來克服數據或標簽不足的情況。這種方法叫做聯邦遷移學習。
▲?適用場景
當參與者間特征和樣本重疊都很少時可以考慮使用聯邦遷移學習,如不同地區的銀行和商超間的聯合。主要適用于以深度神經網絡為基模型的場景。
遷移學習的核心是,找到源領域和目標領域之間的相似性。舉一個楊強教授經常舉的例子來說明:我們都知道在中國大陸開車時,駕駛員坐在左邊,靠馬路右側行駛。這是基本的規則。然而,如果在英國、香港等地區開車,駕駛員是坐在右邊,需要靠馬路左側行駛。那么,如果我們從中國大陸到了香港,應該如何快速地適應他們的開車方式呢?訣竅就是找到這里的不變量:不論在哪個地區,駕駛員都是緊靠馬路中間。這就是我們這個開車問題中的不變量。找到相似性?(不變量),是進行遷移學習的核心。
比如有兩個不同機構,一家是位于中國的銀行,另一家是位于美國的電商。由于受到地域限制,這兩家機構的用戶群體交集很小。同時,由于機構類型的不同,二者的數據特征也只有小部分重合。在這種情況下,要想進行有效的聯邦學習,就必須引入遷移學習,來解決單邊數據規模小和標簽樣本少的問題,從而提升模型的效果。
▲?學習過程
聯邦遷移學習的步驟與縱向聯邦學習相似,只是中間傳遞結果不同。
以上是常見的幾種聯邦學習類型,聯邦學習這件“小事”能用在什么場景中,帶來怎樣的價值,會在下一篇文章中詳細介紹。也歡迎各位與我們一起對以上三種類型的聯邦學習進行更深一步的討論,添加小助手加入技術交流群。
作者簡介
嚴楊
來自數據網格實驗室BitXMesh團隊?PirvAIの修道者
原標題:《早期玩家眼中的NFT》在NFT的市場上,我們看到一些早期的持有者收益很高,但大多數后期進入者難以獲利。相對而言,對于多數加密用戶來說,NFT市場是一個進入門檻較高的領域.
1900/1/1 0:00:00作者:超級蜂巢 這期來說說Swarm的設計架構中底層設計的一部分,東西實在太多,估計整個設計架構要講好久.
1900/1/1 0:00:00本手冊是第一本中文的NFT用戶指南,主要內容包括:NFT領域的專有名詞、用戶的操作指南、以及NFT的項目。本手冊會隨著NFT生態發展持續更新。希望本手冊能夠為新用戶進入NFT領域提供幫助.
1900/1/1 0:00:00撰文:ByrneHobart,金融和科技作家、投資者、咨詢師編譯:LeoYoung資產價格急劇上漲,投資者變富,對市場泡沫批判會變成FOMO的武器:容忍他人變富的最簡單方法就是.
1900/1/1 0:00:002021年6月16日,《人民法院在線訴訟規則》發布,該《規則》將在8月1日正式施行。《規則》在第十六條到第十九條首次確定了區塊鏈存證效力范圍和審查標準.
1900/1/1 0:00:00通過“社區貢獻機會”將一個中心化的項目轉變為一個去中心化的、社區主導的、可持續的dApp的計劃。DAO是一種強大的人力協調新工具。越來越多的DAO出現試圖解決各種各樣的問題.
1900/1/1 0:00:00