來源|?dankradfeist.de
作者|?DankradFeist
原標題:《數據可用性檢查》
數據可用性檢查須知
本文旨在解釋數據可用性檢查,以及為什么區塊鏈的擴容方案,例如以太坊2.0,需要它們。本文預設了讀者具有區塊鏈(例如比特幣和以太坊)的基本背景知識、最好對現在使用的共識算法(工作量證明和權益證明)也有所了解。為了簡單起見,解釋內容將建基于權益證明鏈——由所有具有相同權重的全節點運行共識協議,具有2/3誠實假設;但這些分析同樣適用于工作量證明和其他協議。
入門知識
想想看,區塊鏈有全節點和輕客戶端,還有一個點對點網絡,它可能對數據是有損的,但不會自適應地審查數據。相對于全節點來說,輕客戶端是一個更便宜的選擇。在傳統的區塊鏈協議里,我們假設所有客戶端都運行全節點,驗證在狀態轉換中的每一筆交易。運行一個全節點要求計算機有大量的內存、算力和帶寬。對于移動客戶端和許多資源受限的環境來說,這個成本可能太高了。
輕客戶端是只需下載每個區塊的區塊頭的節點,它們信任全節點對狀態轉換的檢查是正確的——并假設共識算法不會產生違背這點的區塊鏈。輕客戶端依賴全節點為任何相關交易提供區塊內的信息。這很可能只占鏈上所有數據很小的百分比。
為了解釋地更清楚,我介紹這里的三類角色:
觀點:加密貨幣生態系統為脫離貧困提供了前所未有的機會:1月22日消息,來自德克薩斯州的前USAA抵押貸款承銷商Brenda Gentry認為,包括NFT和DeFi在內的加密貨幣生態系統為克服貧困的世代詛咒提供了一個奮斗機會。Gentry,又稱MSCryptomm,辭去了長達十年的銀行家工作,開始了全職加密職業生涯,因為她從2020年初開始的初始投資證實了“加密貨幣提供的前所未有的機會”。她目前經營著Gentry Media Productions,這是一家為DeFi和NFT項目提供咨詢的公司,每月營收20枚ETH,在撰寫本文時價值接近50000美元。(Cointelegraph)[2022/1/22 9:06:35]
全節點通過對每個區塊的共識生成一條區塊鏈,并始終下載所有數據和驗證所有狀態。每當它們看到區塊里有不一致的狀態(例如,區塊的最終狀態與區塊內的交易不一致),它們會生成一個欺詐證明,以警告輕客戶端。輕客戶端只下載區塊頭(非交易數據和狀態),除了它們想知道的交易和部分狀態。它們與全節點連接,以請求所需要的數據。點對點網絡傳播區塊頭,并允許隨機訪問上傳到它的數據塊。一個全節點具有下列安全保證:
與其他全節點形成的共識(絕對)多數可以構建另一條區塊鏈,從而進行雙花攻擊;更廣泛來說,它們可以任意對交易進行重新排序,創建另一個版本的交易歷史。由于要檢查狀態,即使是其他全節點形成超級多數對不一致的狀態達成共識,也不可能讓一個誠實全節點同意這條鏈。因此,一個全節點的安全假設是2/3的誠實全節點可以保證交易不會被重新排序,但正確的狀態執行是不需要任何的誠實假設來確保的(一個全節點根本不可能被欺騙接受一個不正確的狀態轉換)。
觀點:在歐洲發行穩定幣很可能最終需要銀行執照:經濟學家Philipp Sandner等的觀點,在穩定幣方面,歐盟的加密資產市場監管(MiCA)旨在為加密資產(包括穩定幣)建立一個全面的監管框架。隨著歐洲議會和各成員國政府努力處理帶來一些法律確定性的草案,它目前的范圍正在不斷變化。在歐洲發行穩定幣很可能最終需要銀行執照,這有利于成熟的(不一定具有巨大創新能力的)金融參與者。實際上,MiCA帶來的總體監管負擔可能非常昂貴,而那些擁有大量行政資源的公司最有能力遵守,即大銀行和大型科技公司。
目前主要的穩定幣都與美元掛鉤,從本質上講,今天的穩定幣項目通過無縫和無摩擦地在世界各地分發美國貨幣,促進了區塊鏈生態系統的全球美元化,普及數字歐元也可以實現同樣的目標。 歐洲不僅必須認識到數字歐元對歐洲經濟未來的重要性,還必須認識到需要不同類型的數字歐元。理想情況下,這不僅應該包括歐元央行數字貨幣(CBDC),還應該包括獨立的歐元參考穩定幣和其他模式。(Cointelegraph)[2021/7/4 0:26:35]
對于輕客戶端來說,情況略有不同,因為它們不下載和驗證狀態。因此,在沒有欺詐證明(詳見下文)的情況下,“天真”的輕客戶端會被騙,相信由絕對多數(2/3)的全節點達成共識的區塊鏈是沒有問題的,即使它實際上有一個不正確的狀態轉換。
欺詐證明
欺詐證明能是給輕客戶端一個更好的安全模型,使其安全性接近于全節點。其目的是,只要至少有一個誠實的全節點(比2/3多數假設弱得多),輕客戶端也可以被保護,免受無效鏈的影響。
觀點:國際貿易可能是英國采用數字英鎊的最大驅動力之一:NEM企業執行董事Antony Welfare表示,數字英鎊帶來的最大好處之一可能是金融普惠,理由是移動設備無處不在,并且大眾使用廣泛。Welfare警告說,各國在CBDC方面的差距可能會破壞英鎊的地位 。“從長遠來看,采用數字英鎊的最大驅動力之一可能在于國際貿易領域,” Welfare補充說:“擁有CBDC的國家或地區可以要求以自己的本地CBDC進行付款,即數字人民幣,數字美元等,這將是上敏感的談判問題,并有可能破壞英鎊的價值。”(Cointelegraph)[2021/4/21 20:43:48]
欺詐證明是如何實現這點的?假設區塊鏈執行區塊B內的交易t1,…,tn,且區塊頭為H。如果我們增加一個執行跟蹤,用來存儲每筆交易前和后的狀態的默克爾根,我們把它叫做s0,…,sn,如果有任何交易被錯誤執行(即其結果沒有正確應用于狀態)就可以構建一個虛假證明:如果說交易ti?是有問題的交易,給出三元組(si?1,ti,si),再加上在區塊頭H里顯示已被打包的默克爾證明,這將構成一個欺詐證明。事實上,我們僅需要打包ti?需要和影響到的si-1和si。這個欺詐證明的大小比原來的區塊B要小得多,因此容易在網絡里廣播,警告輕客戶端不要跟隨這條鏈。
所以,現在輕客戶端的安全假設就比之前的要強很多了:
2/3的不誠實全節點可以構建另一條鏈,從而改變交易歷史或給交易重新排序(例如,發起雙花攻擊)。但是為了防止出現不正確的狀態轉換,現在的假設是至少有一個誠實全節點(它可以創建欺詐證明),且網絡是同步的(這樣你就能即使接受到欺詐證明)。
觀點:ETH一旦突破306美元,可能會大幅上漲:加密貨幣交易員Josh Rager在推特上表示,以太坊(ETH)價格一旦突破306美元,可能會大幅上漲。他還稱,現在購買以太坊與在2017年上漲之前購買以太坊一樣,當時以太坊和比特幣不僅分別達到了1,300美元和20,000美元的歷史高位,而且許多山寨幣價格也暴漲。(U.Today)[2020/7/7]
數據可用性問題
用欺詐證明保護輕客戶端不受錯誤狀態轉換影響這個方法其實有一個缺口。如果絕對多數的全節點都已經對一個區塊頭簽名了,但不發布部分數據(特別是,這可能是欺詐性交易,它們將晚點發布,以騙過別人接受印出來的或偷來的錢)?顯然,誠實全節點將不會跟隨這條鏈,因為它們不會下載該數據。但輕客戶端不會知道數據是否可用,因為它們只下載區塊頭,不下載數據。因此,現在的情況是誠實全節點知道有貓膩,但它們無法警告輕客戶端,因為它們缺少可能需要用來創建欺詐證明的數據。
難道它們就不能用其他信息警告輕客戶端,告訴它們:“嘿,小心,這個區塊的數據不可用。”嗎?是的,但問題在于它們無法證明——不存在數據不可用的證明,所以上述的簡單欺詐證明機制是不起作用的。
更糟糕的是,這不是可歸責的問題。有些數據可能因為網絡條件不好而丟失了,而這些數據可能在以后再次出現。因此,如果你是一個誠實節點,看到數據不可用的警報,然后檢查發現數據實際上在那里,你不能確定是誰出錯了:可能是出塊者沒有在開始時上傳數據,而是在警報產生后才上傳(出塊者的錯),或者這是一個錯誤的警報。
觀點:合約交易止盈止損最重要:據幣格 BigONE 官方消息,幣格 BigONE 于 5 月 15 日 14:00 舉辦了主題為“幣格BigONE與您一起創造 2020”的新品線上發布會。
發布會第一個圓桌論壇主題為“創見——合約交易的門道”,本圓桌由 Blocklike 小琬主持,圈內知名合約 KOL “易達”、“肖邦”、“投資界小奶牛”、“小九”擔任嘉賓參與了討論。各位嘉賓分享了自己的合約交易經驗,他們認為在進行合約交易時,要認真了解產品、選擇平臺,尤其作為合約新手來說,更應該學會看交易指標。另外,交易時切忌貪心,及時做好止盈止損。
目前BigONE 已經上線永續合約,支持 USDT 結算和 BTC 結算的兩種合約,最高支持 100 倍杠桿,平臺風控,安全穩定。[2020/5/15]
由于這不是可歸責的問題,我們不能因為警報的結果懲罰出塊者或挑戰者。這很煩人,因為這基本上意味著增加這個功能會增加一個DOS向量(Vitalik的這篇文章對這個問題進行了非常好的說明。)
解決方案:用糾刪碼進行數據可用性檢查
要解決這個難題,就要確保輕客戶端可以知道數據是否真的可用。因為如果它們知道這個數據是可用的,它們也就知道很可能有一個誠實全節點看到并檢查了該數據——如果該數據是不正確的或是欺詐性的,誠實全節點就會廣播一個欺詐證明。
當然我們不想要輕客戶端必須下載整條區塊鏈和狀態來實現這點——因為這樣它們就不再是輕客戶端了。因此,我們將讓它們下載隨機的數據塊,并檢查它們是否可用。如果你嘗試下載100個不同的數據塊,并全部都獲取了,你就可以很確定大部分的數據都是可用的(例如,如果少于50%的數據是可用的,你能成功下載100個數據塊的概率是2-100≈10-3,這是一個非常小的數字)。
然而,這只能證明大多數的數據是可用的——比方說,10兆字節的數據塊中僅有100字節丟失了,在這種情況下,你對那一點數據發出請求的可能性非常低。而100字節足以為作惡交易作掩護,躲過誠實的欺詐證明者。
因此,我們需要對這些數據做一些處理,以確保那些檢查切實保證所有的數據都將是可用的。我們可以用糾刪碼(erasurecode)實現這點。一個糾刪碼以更大量的數據E取代區塊數據B,其特性是某固定百分比q<1將總足以重構整個數據。因此,即使有些數據丟失了,只要輕客戶端確保足夠大部分數據是可用的,它們就知道區塊數據B是可被重構的。
現在,我們準備定義輕客戶端在數據可用性檢查中的行為。對于每個它們下載的區塊頭,它們將嘗試下載數據E中k個隨機數據塊,以評估數據是否實際可用。如果它們可以下載全部的數據塊,那么,在網絡里有實際上足夠的數據重構整個區塊的概率是1-qk。
使用這個機制就無須全節點警告輕客戶端數據是否可用了。只需要下載少量數據,輕客戶端就可以自行測試并知道答案了。
糾刪碼實例:RS碼
我們實際上是如何構建糾刪碼的呢?一個簡單且為人熟知的實例是Reed-Solomoncodes(縮寫為RS碼)。它們是基于這樣一個簡單的事實:在一個域里,任何次數是d的多項式都僅由其在d+1點的估值確定。例如,多項式的次數為1(即一條線),然后只需要知道多項式兩個點的值就足以知道整個多項式了(只有一條線穿過兩個不同的點)。
我們必須在一個有限閾里解多項式,否則系數和估值都會變得任意大。幸運的是,有大小為2m的域可用(即所謂的二進制域或伽羅瓦域F2),這樣我們就不需要研究素域Fp(盡管我們可能在一定方案里因為其他原因需要)。
因此,假設我們有n個數據塊d0,…,dn?1,我們想對其進行糾刪編碼。為了用一個RS碼來實現,我們將插值一個多項式
次數為d=n-1,估值d0在0,即f(0)=d0、f(1)=d1,這樣下去。我們知道有這樣的多項式存在,事實上拉格朗日插值多項式(Lagrangeinterpolationpolynomials)給了我們建構它的明確方法(盡管還有更高效的方法)。
現在,我們通過對多項式在更多的點上估值來拓展數據——比方是n多個點,如果我們想把比率設為q=0.5。那么就會有dn=f(n),dn+1=f(n+1)...,d2n?1=f(2n?1)。由此我們得出它的一個特性,即任何n個點將足以重構這個多項式——如果我們有多項式f(x),我們也可以輕易對它在0,...,n-1進行估值,得到我們的原始數據。
就這些內容了!RS碼不過是一些多項式插值。這實際上就解決了數據可用性問題了,因為它們在編碼效率上是最優的,除了一個小問題——欺詐事件可以以另一種方式發生,即產生錯誤的編碼。而對于RS碼,為了證明編碼是錯誤的,你必須提供n個數據塊,并足以用一個多項式對其中的n-1插值,并顯示最后一個不在這個多項式上。這就是為什么我們現在做大量的研究,旨在找出避免必須做這些不正確編碼證明或使它們盡可能小的方法。
在分片上的應用
數據可用性檢查對于許多不同區塊鏈擴容方案是很重要的,因為即使節點不能檢查所有或甚至下載所有數據,它也能給這些節點提供安全。由于這是區塊鏈的一個根本性瓶頸(共識節點必須下載所有數據),這是一個重要的擴容要求。
例如,在以太坊2.0里,驗證者只需對信標鏈上的數據進行完全驗證,分片上的驗證工作由委員會負責。這個結構旨在減輕驗證者必須驗證所有數據的負擔。但是,這意味著驗證者在多數分片上實際上是輕客戶端(除了活躍驗證者)。因此,數據可用性檢查是需要的。在這種情況下,以太坊2.0的驗證者實際上同時是“全節點”和輕客戶端。那些下載并檢查所有分片數據的節點是“超級節點(supernodes)"——這些節點可能只會由組織或做了大量質押的人來運行,他們會驗證所有分片。我們當然不會想要只是信任這一小部分人是誠實的來運行以太坊2.0。
因此,有數據可用性檢查和欺詐證明是絕對必要的,這樣一般人都可以運行驗證者節點。
擴展閱讀
1.VitalikButerin的這篇文章解釋了欺詐證明和糾刪碼
它介紹了多維RS碼如何形成更小的不正確編碼證明這是論文版本2.多為代碼替代方案的最新想法:
使用STARKs使用FRIs使用Kate’spolynomialcommitment方案原文鏈接:https://dankradfeist.de/ethereum/2019/12/20/data-availability-checks.html
據澎湃新聞7月12日消息,華東政法大學金融監管與刑事治理研究中心主任、博士生導師、教授毛玲玲今日在以“涉虛擬貨幣相關犯罪法律適用問題”為主題論壇上表示,對以虛擬財產或虛擬貨幣為對象的犯罪.
1900/1/1 0:00:007月24-25日,2021世界區塊鏈大會·杭州即將開幕。本次大會由杭州時戳信息科技有限公司主辦,杭州未來科技城管委會等機構支持.
1900/1/1 0:00:00作者|王晟宇 8月2日,騰訊發布國內首個NFT交易APP“幻核”,并推出NFT產品“限量版十三邀黑膠唱片NFT”.
1900/1/1 0:00:00隨著新基建和“十四五”數字經濟規劃的推進,全球數據總量爆發式增長。“數據安全法”等相關政策的落地,分布式儲存得到了前所未有的重視,作為Web3.0時代的底層基礎設施,分布式儲存未來已來.
1900/1/1 0:00:00鏈集市?·讓區塊鏈落地更簡單 《區塊鏈行業觀察》專欄·第34篇作者丨Rafia?Raji 圖片丨來源于網絡 區塊鏈最簡單的形式是一種去中心化的數據庫架構.
1900/1/1 0:00:00巴比特訊,7月25日,“2021世界區塊鏈大會·杭州”在杭州未來科技城學術交流中心開幕。本次大會由杭州時戳信息科技有限公司主辦.
1900/1/1 0:00:00