前言:原文作者是來自Gauntlet的Hsien-TangKao和TarunChitra,在這篇文章中,他們使用Ampleforth的rebase機制、RAI的反射指數、EIP-1559的費用市場提案及THORChain的激勵鐘擺機制來說明反饋控制器在不同機制中的使用,此外,他們還將展示反饋控制如何使鏈上衍生品定價成為可能。
我們已看到了大量新出現的defi協議,它們提供了新的機制來支持交易、借貸以及其他金融活動。盡管這些協議在功能和用途上差異很大,但一些原語已成為了很多新協議的通用組件。其中,常數函數做市商及自動利率曲線,是兩大最受歡迎的DeFi組件,它們出現在眾多DeFi產品中。隨著行業聚集在這些原語周圍,這就引出了一個問題:是否存在更好的選擇?
實際上,反饋控制系統正是一種可能改善協議激勵、效率及彈性的方法。
什么是反饋控制?
「反饋是生命體的核心特征,反饋的過程控制著我們如何成長,如何應對壓力及挑戰,以及負責調節體溫、血壓、膽固醇水平等因素。從細胞中蛋白質的相互作用,到復雜生態系統中有機體的相互作用,這些機制在每一個層面都起著作用。」
——馬倫·霍格蘭(MahlonHoagland)和伯特·竇德生(BertDodson),《生命的運作方式》,1995年
控制理論在應用數學、電氣工程及機器人學中得到了廣泛的研究。
它在許多行業都有廣泛的應用,包括航空航天系統、自動駕駛車輛及物聯網設備。在經典的「反饋系統」教科書中,KarlJohan?str?m和RichardM.Murray將控制定義為在工程系統中使用算法和反饋。
DeFi下一重要原語:探索反饋控制在Ampleforth與THORChain等應用
開環系統
DeFi下一重要原語:探索反饋控制在Ampleforth與THORChain等應用
閉環系統
圖和說明了開環和閉環控制系統的區別。在開環系統中,控制器輸出與系統輸出無關。與之相反的是,閉環系統的控制器,將系統輸出作為附加輸入。在閉環系統中,系統動力學依賴于控制器動力學,而控制器動力學又依賴于系統動力學,這就產生了系統與控制器動力學的耦合效應。由于循環依賴性,理解反饋系統是非常重要的。
Stellar加入Mercado Bitcoin聯盟探索CBDC:金色財經報道,拉丁美洲最大的交易所Mercado Bitcoin與Stellar Development Foundation (SDF)合作,開發LIFT Challenge Real Digital的9個項目之一,這是巴西中央銀行(Bacen)開展的一個合作環境。與中央銀行服務器協會全國聯合會(Fenasbac)合作,探索中央銀行數字貨幣(CBDC)的用例。SDF宣布加入CPQD和ClearSale,成為Mercado比特幣的LIFT Challenge財團的一部分。Bacen計劃旨在確定Real Digital基礎設施的基本特征,以便能夠支持LIFT挑戰賽參與者提出的用例。Bacen預計,Real Digital將于2022年下半年推出,在第一階段,將針對有限的觀眾進行試點。Mercado Bitcoin之所以選擇Stellar網絡,是因為它是CDBC其他項目、穩定幣發行和金融資產代幣化的首選網絡,因為它具有獨特的速度、效率、安全性和合規范性。(finextra)[2022/5/25 3:39:50]
反饋控制與強化學習簡史
比例-積分-微分控制器是最為常見的反饋控制器。它利用期望系統狀態與觀測狀態之間的差值連續計算控制信號。1922年,俄國人NicolasMinorsky為美國海軍艦艇的自動操舵系統,發表了第一個PID控制器的理論分析。20世紀50年代,商用數字計算機問世,這使得最優控制理論得到迅速發展。最優控制的首要問題,是找到一個能產生最優狀態軌跡,并使動態系統行為的測度最小化或最大化的控制律。RichardE.Bellman的「最優性原理」、動態規劃算法及馬爾可夫決策過程,就是在這一時代發展起來的,它們目的是為解決最優控制問題。20世紀80年代末90年代初,在最優控制和人工智能領域的前期工作,推動了強化學習的發展。強化學習在不完全了解系統狀態的情況下,通過試錯學習或逼近來解決最優控制問題。近二十年來,隨著計算和深度學習算法的發展,出現了新一輪成功的深度強化學習算法。深度強化學習通過使用深度神經網絡,擴展強化學習,而不需要顯式地設計狀態空間。DeepMind利用這些算法來創建可以玩Atari游戲的人造代理,以及比人類做得更好的Go。
《南華早報》:中國正探索設立虛擬資產交易場所:金色財經消息,參考消息網12月14日報道 香港《南華早報》網站近日報道稱,中國正在探索設立虛擬資產交易場所,與此同時,中國政府為推進數字人民幣試點做出了下一階段布局。報道稱,目前沒有提供關于擬議設立的數字資產交易場所的細節,不過分析人士認為,該交易所不會用于加密貨幣的交易。中國一向禁止各類數字貨幣和非同質化代幣流通。據要求匿名的一名香港銀行從業人員說,數字資產的涵蓋范圍非常廣泛,從信貸數據到債券或碳配額的代幣化。香港證券商協會主席陳柏楠說,最新發布的這一公告很可能與推廣使用數字人民幣有關。從中可以看出國家推動數字貨幣的決心。陳柏楠說,由于數字人民幣是需要中國人民銀行和政府其他部門開展大量監管討論的項目,發展這樣的平臺對北京的銀行來說會更加近便。首批此類銀行2014年開始獲準上線,從中央政府推動使用數字人民幣的計劃來看,未來很可能會出現更多這樣的銀行。[2021/12/14 7:37:16]
PID控制器
了解反饋控制或PID控制器的直觀方法,是通過一個比例控制器
DeFi下一重要原語:探索反饋控制在Ampleforth與THORChain等應用
其中K_p是一個常數,在一個比例控制器中,控制輸入u(t)與觀測輸出和期望系統輸出之間的誤差e(t)成比例。
這里我們將展示一個恒溫器如何使用反饋機制來控制室溫。假設當前溫度為90°F,恒溫器溫度設置為70°F,則誤差為20°F。當K_p=0.1千瓦/°F時,恒溫器控制空調設備,使其使用u(t)=2千瓦來冷卻整個房間。
當溫度下降到80°F時,誤差減小到10°F,空調將輸出1千瓦的功率。從這個例子中,我們可以看出,恒溫器輸出一個控制信號來改變空調器的輸出功率,并降低溫度。恒溫器測量溫度誤差,并改變輸出控制信號,這種反饋回路使室溫逐漸收斂到所需溫度。
DeFi下一重要原語:探索反饋控制在Ampleforth與THORChain等應用
PID控制器方塊圖
PID控制器擴展了比例控制器的概念。除了當前誤差e(t),它還測量累積誤差\inte(t)及誤差變化率\frac來計算控制輸入:
探索 · 創新 · 共贏Web3.0生態大會于今日在西安圓滿結束:由西安市區塊鏈技術應用協會主辦,開源礦池、PolkaBase、金色財經聯合主辦,鏈上ChainUP、螞蟻集群聯合承辦的“探索 · 創新 · 共贏Web3.0生態大會”于今日在西安圓滿落幕。
本次大會匯聚區塊鏈行業協會、區塊鏈行業領袖以及投資機構、知名專家學者、媒體代表等眾多嘉賓,到場觀眾近500人。本次大會以Web 3.0技術生態為主題,針對Web 3.0的核心基礎設施IPFS&Polkadot進行技術研討和生態探究,剖析行業熱點話題,共話行業發展前景。
據悉,本次大會秉承“開啟數字未來,助推產業共進”的理念,響應我國大力推行以5G、大數據、云計算、區塊鏈等尖端技術為代表的“新基建”的號召,營造數字經濟蓬勃發展氛圍,共同研討數字經濟與分布式存儲技術落地應用成果,致力于推進數字經濟在更寬領域、更廣范圍的合作與交流。[2020/12/19 15:48:40]
DeFi下一重要原語:探索反饋控制在Ampleforth與THORChain等應用
其中,K_p、K_i以及K_d都為常數。
反饋控制和DeFi
DeFi下一重要原語:探索反饋控制在Ampleforth與THORChain等應用
反饋控制是一種簡單而強大的思想,它在現實世界中已經被廣泛應用。在現有的應用之外,反饋控制也是DeFi應用的重要組成部分。
假設一個協議有一個高層次的目標,該協議測量當前狀態的距離,并使用反饋機制更新協議參數,以激勵市場參與者將系統推向期望狀態。例如,穩定幣協議希望將代幣與1美元錨定,協議根據穩定幣價格不斷調整利率,當穩定幣價格高于1美元時,該協議將降低利率并激勵參與者發行更多的穩定幣。否則,協議將提高利率并激勵參與者償還債務。通過算法調整利率,當穩定幣在1美元左右時,市場就可以達到供需平衡。
很多DeFi應用已經在協議設計中隱式或顯式地使用這種模式。這里我們將使用Ampleforth的rebase機制、RAI的反射指數、EIP-1559的費用市場提案及THORChain的激勵鐘擺機制來說明反饋控制器在不同機制中的使用。我們還將展示反饋控制如何使鏈上衍生品定價成為可能。
動態 | 山財大研發疫情采集監測系統,探索區塊鏈應用場景:近日,新型冠狀病感染的肺炎疫情防治管控工作已進入關鍵時期。在抗擊疫情的過程中,大數據、云計算、人工智能等新一代信息技術正在發揮作用,區塊鏈技術也以其特有的分布式、隱私性、無法篡改等特點,加入抗“疫”大軍。記者獲悉,山東財經大學研發的“區塊鏈疫情采集監測系統”已于2020年2月7日凌晨5時正式上線,用時僅兩天兩夜。據悉,根據疫情的需要,山東省科技廳組織山東財經大學區塊鏈金融實驗室籌備組、阿里云等單位,研究開發了“區塊鏈疫情采集監測系統”。(中國山東網)[2020/2/14]
波動性抑制資產
Ampleforth和RAI開創了不相關和低波動性加密資產的概念。乍一看,這些協議似乎有不同的底層機制。AMPL動態調整供應,以解決不適應性問題,而RAI則使用動態贖回率機制來最小化反射指數波動。然而,這兩個協議本質上都是反饋控制系統,它們旨在創造一個波動性抑制資產。而這些協議的主要區別,在于它們使用了不同的控制輸入。我們將使用反饋控制框架來展示這兩種協議之間的異同。
AmpleforthRebase機制
AMPL是一種根據市場價格動態調整供應的數字資產,當AMPL的價格高于1美元時,其供應量就會擴大,反之則會縮小。代幣供應機制的擴張與收縮,激勵理性的AMPL交易員介入,推動AMPL價格向1美元目標邁進。
為了用公式表示rebase機制,我們首先將誤差定義為目標值與觀測值之間的差:
DeFi下一重要原語:探索反饋控制在Ampleforth與THORChain等應用
假設目標值為1美元,觀察值為當前價格,則誤差項為:
DeFi下一重要原語:探索反饋控制在Ampleforth與THORChain等應用
當價格偏差e(t)大于偏差閾值d_t時,AMPL的供應調整為:
DeFi下一重要原語:探索反饋控制在Ampleforth與THORChain等應用
根據上面的方程,我們可以將rebase表示為一個比例控制器,其中:
DeFi下一重要原語:探索反饋控制在Ampleforth與THORChain等應用
動態 | 電廣傳媒運用區塊鏈等探索數字化內容投送形態,向內容服務商轉型:據長沙晚報報道,日前,電廣傳媒(000917)與華為達成合作,計劃搭建5G創新應用平臺,建成全國首批5G技術應用示范基地,同時充分運用大數據、人工智能、區塊鏈等,探索數字化內容投送形態,向內容服務商轉型。[2018/12/25]
控制規則:
DeFi下一重要原語:探索反饋控制在Ampleforth與THORChain等應用
從這個例子中可以看出,rebaselag是決定系統行為的關鍵參數。
選擇適當的rebaselag參數與調節控制器的比例增益是一樣的。比例增益對系統特性的影響在控制系統中得到了廣泛的研究:高比例增益可以減小穩態誤差,加快上升時間,但會增加超調量,使系統更具振蕩性。
DeFi下一重要原語:探索反饋控制在Ampleforth與THORChain等應用
來源:Matlab和Simulink的控制教程
RAI反射指數
反射指數是一種波動性低于其抵押品的資產。該系統使用類似MakerDAO的債務抵押頭寸進行資產發行。當反射指數的贖回價格偏離市場價格時,協議會調整贖回率,以激勵CDP持有人產生更多債務或償還未償債務。
RAI反射指數是在協議設計中第一個明確引用PID控制器的協議。這個反射指數中的誤差項是市場價格和贖回價格之間的差額:
DeFi下一重要原語:探索反饋控制在Ampleforth與THORChain等應用
贖回率是控制輸入,并由一個比例控制器修改:
DeFi下一重要原語:探索反饋控制在Ampleforth與THORChain等應用
以及
DeFi下一重要原語:探索反饋控制在Ampleforth與THORChain等應用
在上面提到的兩個例子中,都有一個反饋控制系統。這些協議以特定的參考價格為目標,但使用不同的經濟機制來影響代幣的供應。Ampleforth直接改變了系統的總供應量,以激勵參與者進行「供應發現」或「市值發現」,從而將AMPL價格推向1美元。RAI改變了贖回價格,激勵參與者重新平衡未償債務總額,以減少價格波動。
EIP-1559:以太坊費用市場更改提議
當前的以太坊費用市場使用簡單的第一價格拍賣機制來定價交易費用。這種拍賣機制是次優的,它為競拍人帶來了相當大的開銷,因為每個競拍人都需要根據其他競爭對手的預期出價進行競標。EIP-1559通過一種自適應的收費機制解決了這個問題,這樣收取的總費用可以超過網絡的社會成本。
擬議的交易費用包括動態調整的基礎費用以及給礦工的額外小費。區塊使用量是決定基礎費用的主要因素:
當區塊使用量高于目標使用量時,基礎費用增加,反之則降低。這種費用調整算法尋求博弈論均衡并建立費用下界。這項提議可能是以太坊1.0最重大的變化,它將極大地改變用戶體驗和貨幣政策。
毫不奇怪,EIP-1559可以被描述為一個反饋控制問題,它的基礎費用調整算法為:
DeFi下一重要原語:探索反饋控制在Ampleforth與THORChain等應用
算法中的誤差項為:
DeFi下一重要原語:探索反饋控制在Ampleforth與THORChain等應用
基礎費用調整算法也是一個比例控制器,其中:
DeFi下一重要原語:探索反饋控制在Ampleforth與THORChain等應用
控制輸入為:
DeFi下一重要原語:探索反饋控制在Ampleforth與THORChain等應用
以及
DeFi下一重要原語:探索反饋控制在Ampleforth與THORChain等應用
THORChain的激勵鐘擺機制
THORChain是一個為跨鏈資產交換提供便利的去中心化網絡,該協議要求系統的總池子資本大于擔保資本,以保證其安全。在THORChain中,2:1的資本比例被認為是最優的系統狀態。這種激勵鐘擺機制是為了使系統處于平衡狀態,它將總的通貨膨脹報酬和交易費用重新分配給參與者,使系統逐漸收斂到最優狀態。特別是,分配給流動性提供者的系統收入比例為:
DeFi下一重要原語:探索反饋控制在Ampleforth與THORChain等應用
其中,b和s表示總的擔保資本和總的池子資本,其余部分則給予擔保人。在最優狀態下,激勵鐘擺將33%的系統收益分配給流動性提供者,將66%的系統收益分配給擔保人。如果系統只有擔保資本,激勵鐘擺會將100%的系統收入分配給流動性提供者。
THORChain的激勵鐘擺使用鏈一個確定的公式來計算系統的收入分配。雖然它沒有使用PID控制器的公式,但是激勵鐘擺和PID控制器有一個非常相似的概念:
該機制試圖將誤差隨時間的變化最小化,即使系統狀態收斂到最優狀態;
控制信號是一個誤差函數,其中誤差是測量的bonded-to-pooled資本和最佳bonded-to-pooled資本之間的差;
鏈上衍生品定價
2020年當中最大的驚喜之一是,現貨資產DEX能夠處理和中心化交易所相同數量級的現貨交易。
然而,最活躍的加密交易產品——永續合約,尚未實現去中心化。
盡管目前已經有了一些去中心化期貨產品的嘗試,比如FutureSwap和McDEX,但截至目前,這些協議都沒有實現他們的承諾。其中的一個主要原因是,相比現貨交易,期貨交易對延遲要敏感得多。這是因為預言機價格更新需要非常迅速,以避免搶先交易和延后交易。此外,由于較低的保證金要求允許用戶用較少的抵押品進行大規模押注,因此流動性往往會以更快的速度在衍生品交易場所增加和移除。然而,在不需要高流動性速度的情況下,有許多新的機制可以復制衍生品的結果。這些方法涉及自動做市商,它們具有動態曲線。在這一方向上的一個基本工作是AlexEvans的一個定理,其表明,如果一個Balancer池根據一個修改后的PID控制器調整其權重,那么你可以復制任何無杠桿回報。
DeFi下一重要原語:探索反饋控制在Ampleforth與THORChain等應用
在上面的等式中,Balancer池的權重w*遵從控制方程,作為預期收益g的一個函數。生成任意的衍生品收益是一個增加杠桿作用的問題——如果某人可以針對支付g(x,t)的Balancer池股份進行借貸,并用借入的資金創建新的資金池份額,那他們就可以將自己的敞口杠桿化為g的常數倍數。而像Aave和Compound這樣的鏈上借貸平臺,就非常適合進行這種操作。那這與永續合約交易有什么關系?
我們可以將永續合約產品視為一個將指數價格p映射為正或負回報的函數。例如Balancer這樣的常數函數做市商,允許將p(t)表示為一個數量向量,以及池的權重控制著從數量到價格的映射。因此,我們可以將永續產品的替代結構視為一個CFMM,其形狀正在調整以保持收益。雖然權重更新仍可以前推和后推,但要做到這一點要比操縱價格要困難得多。這是因為你需要操縱做市商持有的數量來調整收益g。與操縱價格不同,你必須調整抵押品數量x。正如我們在Uniswap論文的附錄D中所指出的,隨著鎖定的總值增加,這種操縱會越來越困難。
這個例子說明,當使用適當的比例控制器時,當與動態調整的做市商耦合時,很多衍生品產品可存在于鏈上。雖然設計此類控制器的研究尚處于起步階段,但像Yield、Opyn及其他團隊設計的CFMM,這種流行趨勢已經表明,控制理論使得鏈上衍生品成為可能。
以太坊的計算和存儲容量有限
DeFi下一重要原語:探索反饋控制在Ampleforth與THORChain等應用
在關于反饋控制與強化學習的歷史上,算法的進步可以說是成功的主要因素。然而,人們往往忽視了這樣一個事實:計算和存儲范式的轉變,也導致了這些技術突破。在20世紀50年代沒有商用計算機的情況下,動態規劃是解決最優控制問題的一種方法,如果沒有GPU集群和巨大的存儲空間,Deepmind無法有效地訓練用于玩Atari游戲的深度強化學習模型。
我們知道,以太坊的計算和存儲容量是有限的。目前,大多數的DeFi協議都是通過使用簡單的反饋算法來克服這些限制,這些算法不需要大量的存儲來跟蹤歷史狀態的變化。因此,PID控制器或其他恒定的空間及時間復雜度算法很適合資源受限的計算環境。
關于鏈上杠桿控制理論自然而然的下一步,是制定DeFi協議反饋機制作為一個最佳控制問題。原因有二:關于最優控制,已有大量的理論工作,而且它不依賴于龐大的計算能力。另一個可能的途徑是通過協議的治理過程,在鏈上引入更復雜的算法優化參數。許多中立的第三方可以在鏈外處理區塊鏈數據及外部數據源,運行復雜的算法,并提交優化的治理投票參數,以提高協議效率。
最后的想法
比例控制器是工業中最常見的控制器形式,它以電流誤差為輸入,較好地解決了大部分問題。為了進一步改進現有的反饋系統,協議可以考慮添加「過去誤差」和「預期未來誤差」作為控制器的輸入。
聯合曲線或利率曲線是激勵特定用戶行為的機制。參數化這些曲線是非常重要的,因為設計空間很廣。例如,具有不同形狀的曲線,可能會獲得非常相似的結果,但很難斷言其中一條曲線嚴格優于另一條曲線。基于聯合曲線的方法存在維數災難。參數化三維或更高維曲面,似乎是一項具有挑戰性的任務。協議開發團隊可以考慮使用反饋控制方法來簡化設計及參數化方法。開發人員不需要設計描述一系列參數值之間關系的整個曲線,而只需要關注參數值的「變化率」。
考慮到智能合約通常涉及高風險及反饋系統的動態性,設計一個基于反饋控制的智能合約是一項挑戰。我們知道,模擬在工業中被廣泛應用于參數調試,而Gauntlet可幫助協議設計者通過模擬大量的協議參數及市場環境來對他們的協議進行壓力測試。建立一個安全高效的DeFi生態系統,一直是我們的首要任務。
Tags:MPLAMPAMPLCHAWrapped AmpleforthXAMPAMPLG幣blockchain公司介紹
尊敬的XT用戶: TBCC-BEP20錢包升級維護,XT現已暫停TBCC-BEP20提幣業務。給您帶來的不便,敬請諒解!區塊鏈游戲開發商Heynext完成3000萬美元融資:金色財經報道,區塊鏈.
1900/1/1 0:00:00Gate.io一直秉承真實,透明的理念,不造假數據,不干預市場交易,為用戶提供真實自由的市場工具和穩定健康的市場服務。杠桿交易提供做多和做空機制,可以有效穩定市場到合理價值.
1900/1/1 0:00:00作者|秦曉峰 編輯|郝方舟 出品|Odaily星球日報?????? 一、整體概述 VitalikButerin將出鏡的一部以太坊的紀錄片「Ethereum:TheInfiniteGarden」.
1900/1/1 0:00:00相信大家對ipfs并不陌生,不僅如此,隨著主網的上線,IPFS也變得火熱起來。有人認為他會成為一個傳奇,有人把它看作一場偉大的革命,那就是第三代互聯網的基本協議即web3.0.
1900/1/1 0:00:00每個在以太坊錢包中擁有NFT的人都可以直接從DappRadar平臺將這些數字資產發送給朋友。DappRadar是與DeFi和NFT密切相關的地方,因此我們一直在嘗試推出新功能.
1900/1/1 0:00:00公告編號2021072601各位關心ZBG.kim的投資者們和項目方:ZBG平臺現已恢復ETC的充提幣.
1900/1/1 0:00:00