以太坊交易所 以太坊交易所
Ctrl+D 以太坊交易所
ads
首頁 > AAVE > Info

完全基于Transformer的目標檢測器,ICLR匿名論文視覺、檢測統一_DET:RAM價格

Author:

Time:1900/1/1 0:00:00

機器之心報道

編輯:陳萍

一種新的集成視覺和檢測Transformer的目標檢測器ViDT。

Transformer在NLP任務中取得不錯的發展,許多研究將其引入到計算機視覺任務中。毫不夸張的說,Transformer正在改變計算機視覺的格局,尤其是在識別任務方面。例如Detectiontransformer是第一個用于目標檢測的、端到端的學習系統,而visiontransformer是第一個完全基于transformer的圖像分類架構。在本文中,一篇被ICLR2022接收的匿名論文集成了視覺和檢測Transformer(VisionandDetectionTransformer,ViDT)來構建有效且高效的目標檢測器。

ViDT引入了一個重新配置的注意力模塊,將SwinTransformer擴展為一個獨立的目標檢測器,之后是一個計算高效的Transformer解碼器,該解碼器利用多尺度特征和輔助技術,在不增加計算負載的情況下提高檢測性能。

華東師范大學教授劉擎:元宇宙不完全是所謂VR:金色財經報道,華東師范大學教授劉擎表示,元宇宙之所以這么熱,一方面是科技公司在推動,有些是出于科技的發展,有些人是對科學本身著迷。當然它也有另外的商業的利益,但它會調動普通人。元宇宙不完全是所謂virtual reality(VR),但它跟VR特別相關,建立在VR基礎上,而VR以前是游戲族的事情。現在好多人說“世界太糟糕了,我想也想不清楚。那么給我一個不同的元宇宙,一個alternative,另類的世界,我在那里面是不是可以過得好一點?”能夠心想事成。或者,大多數時候就待在那里,然后到真實的物理世界來解決一些基本問題,可能是吃頓飯睡個覺。不得不說,這是一個非常具有吸引力的誘惑人的想法。元宇宙不只在科學界、商業界、金融界引發巨大反響,還能吸引很多普通人。(新浪)[2022/1/20 9:00:31]

在MicrosoftCOCO基準數據集上的評估表明,ViDT在現有的完全基于transformer的目標檢測器中獲得了最佳的AP和延遲權衡,其對大型模型的高可擴展性,可達49.2AP。

Bitbuy獲得監管批準成為“完全注冊交易運營商”后擬于2022年1月13日下架XRP:金色財經報道,據加密貨幣交易平臺Bitbuy最新消息,XRP將于2022 年1月13日被下架,包括XRP/CAD和XRP/BTC交易對都會從其平臺刪除。12月初,Bitbuy獲得了安大略省證券委員會 (OSC) 的批準,成為“完全注冊交易運營商”。對于本次下架XRP原因,Bitbuy表示“他們必須遵循 OSC 的指導方針來決定某種加密貨幣是否可以歸類為證券,同時也要考慮國際監管機構的意見。”今年年初,由于圍繞XRP的監管不確定性,包括 Coinbase、Kraken、Binance.US 和其他交易平臺都停止了相關交易服務。[2021/12/14 7:37:59]

論文地址:https://openreview.net/pdf?id=w4cXZDDib1H

歐洲央行官員:CBDC并不是現有貨幣體系的完全替代品:10月14日消息,歐洲央行市場基礎設施和支付總監Ulrich Bindseil表示,中央銀行數字貨幣(CBDC)系統應與現有貨幣系統共存。CBDC并不是現有貨幣系統的完全替代品。中央銀行數字貨幣(CBDC)是一種全球現象,且是可以在任何地方實現的“民主技術”。隨著世界范圍內現金支付使用逐漸減少,預計有可能建立新的支付方式,并且隨著貨幣的發展,銀行將適應這種發展。且應致力于新興體系與現有金融體系保持平衡,而不是完全清除銀行和票據。(CoinPost)[2020/10/14]

ViDT:視覺與檢測Transformer

ViDT架構如下圖2(c)所示:

首先,ViDT引入了一種改進的注意力機制,名為ReconfiguredAttentionModule(RAM),該模塊有助于ViT變體處理附加的和token以進行目標檢測。因此,ViDT可以將最新的帶有RAM的SwinTransformer主干修改為目標檢測器,并利用其具有線性復雜度的局部注意力機制獲得高可擴展性;

現場 | 徐明星:區塊鏈完全可以通過超級私鑰來管理:金色財經現場報道,12月1日,海南國際離岸創新創業示范區建設暨區塊鏈?數字資產交易技術創新高端論壇在三亞舉行。會上,歐科集團創始人徐明星就“區塊鏈技術的現在與未來”發表了演講。徐明星提到,去中心化其實是去中間環節,區塊鏈是一種技術,分布式賬本可以作為一個底層的共享數據庫,他是加密的,不屬于任何人,但完全可以通過超級私鑰來管理。

據了解,海南國際離岸創新創業(三亞)試驗區在會上正式揭牌,歐科集團擬在三亞崖州灣科技城成立區塊鏈離岸數字資產交易實驗室,后續將配套建設區塊鏈大數據研究院、區塊鏈創新應用研發中心等,同時設立歐科集團亞太總部。[2019/12/1]

其次,ViDT采用輕量級的無編碼器neck架構來減少計算開銷,同時仍然在neck模塊上啟用額外的優化技術。請注意,neck編碼器是不必要的,因為RAM直接提取用于目標檢測的細粒度表示,即token。結果,ViDT獲得了比neck-free對應物更好的性能;

Koinex CEO:印度政府并沒有完全禁止數字貨幣:Koinex CEO Rahul Raj認為政府在討論的是“非法使用”而不是“破壞整個行業”。[2018/2/19]

最后,該研究引入了用于知識蒸餾的token匹配新概念,它可以在不影響檢測效率的情況下從大型模型到小型模型帶來額外的性能提升。

RAM模塊

該研究引入了RAM模塊,它將與和token相關的單個全局注意力分解為三個不同的注意力,即×、×和×注意力。如圖3所示,通過共享和token的投影層,全部復用SwinTransformer的所有參數,并執行三種不同的注意力操作:

ENCODER-FREEneck結構

為了利用多尺度特征圖,ViDT結合了多層可變形transformer解碼器。在DETR家族中,其neck部分需要一個transformer編碼器,用于將從骨干中提取的用于圖像分類的特征轉換為適合目標檢測的特征;編碼器通常在計算上很昂貴,因為它涉及×注意力。然而,ViDT只保留了一個Transformer解碼器作為其neck,因為帶有RAM的SwinTransformer直接提取適合目標檢測的細粒度特征作為獨立的目標檢測器。因此,ViDT的neck結構在計算上是高效的。

解碼器從帶有RAM的SwinTransformer接收兩個輸入:從每個階段生成的token從最后階段生成的token,如圖2(c)的Neck所示。在每個可變形的transformer層中,首先執行×注意力。對于每個token,應用多尺度可變形注意力以生成一個新的token,聚合從多尺度特征圖

中采樣的一小組關鍵內容:

用于目標檢測的token匹配知識蒸餾

雖然大型模型具有實現高性能的高容量,但在實際使用中它的計算成本可能很高。因此,該研究還提出了一種簡單的知識蒸餾方法,可以通過token匹配從大型ViDT模型中遷移知識。

匹配每一層的所有token在訓練中非常低效,因此,該研究只匹配對預測貢獻最大的token。兩組token直接相關:P:用作多尺度特征圖的token集合,由body中的每個階段生成,D:token的集合,它們是從neck的每個解碼層生成的。因此,基于token匹配的蒸餾損失公式為:

評估

表2將ViDT與DETR(ViT)和YOLOS的AP、FPS等進行了比較,其中DETR(ViT)有兩個變體:DETR和DeformableDETR。

實驗結果表明:ViDT實現了AP和FPS之間的最佳權衡。憑借其高可擴展性,其性能優于1億個參數的Swin-base,在相似的AP的下,FPS比DeformableDETR快2倍。此外,ViDT參數為16M,得到40.4AP,比DETR(swin-nano)和DETR(swin-tiny)高分別高6.3AP、12.6AP。

表3對比了不同空間位置編碼與ViDT的結果。結果表明:pre-addition比post-addition帶來的性能提升更高,即sinusoidalencoding優于learnable編碼;因此,正弦空間編碼的2D歸納偏置在目標檢測中更有幫助。特別是,與不使用任何編碼相比,使用正弦編碼的預加法將AP增加了5.0。

表4總結了使用不同選擇策略進行交叉注意力時的AP和FPS,其中SwinTransformer總共包含四個階段。有趣的是,只要在最后階段激活交叉注意力,所有策略都表現出相似的AP。由于在各個階段中以自下而上的方式提取特征,因此在低級別階段很難直接獲得有關目標對象的有用信息。因此,研究者想要獲得較高的AP和FPS,只使用最后階段是最好的設計選擇,因為token的數量最少。

為了徹底驗證輔助解碼損失和迭代框細化的有效性,該研究甚至對YOLOS等neck-free檢測器進行了擴展。表5顯示了兩種neck-free檢測器YOLOS和ViDT(w.o.Neck)性能。實驗結果證明在ViDT中使用Neck解碼器來提高目標檢測性能是合理的。

下圖表明:教師模型的規模越大,學生模型的收益越大。從系數來看,系數值越大,性能越好。模型蒸餾將AP提高了1.0-1.7,而不會影響學生模型的推理速度。

研究者將所有提議的組件結合起來,以實現目標檢測的高精度和速度。如表8所示,有四個組件:(1)RAM將SwinTransformer擴展為獨立的目標檢測器,(2)neck解碼器利用多尺度特征和兩種輔助技術,(3)從大模型中獲益知識蒸餾,(4)解碼層drop進一步加快推理速度。結果表明:當使用Swin-nano作為其主干時,它僅使用13M參數就達到了41.7AP和合理的FPS。此外,當使用Swin-tiny時,它僅損失了2.7FPS而表現出46.4AP。

Tags:DETETRRAMDET幣是什么幣ETR價格ETR幣RAM幣RAM價格

AAVE
以色列與德國簽訂潛艇購買協議_:

德國為以色列制造的達喀爾級潛艇概念圖。以色列國防部日前發布消息稱,1月20日,以色列與德國簽訂價值30億歐元(1歐元約合7.2元人民幣)的潛艇購買協議.

1900/1/1 0:00:00
10天狂賺160萬的元宇宙課程,真有料還是割韭菜?_區塊鏈:元宇宙

來源:市場資訊 01:44   文/張婧怡   編輯/蘇建勛   “元宇宙”的提出者扎克伯格應該沒有想到,雖然概念還沒完全落地,但已經有人靠販賣概念賺到了錢.

1900/1/1 0:00:00
開放式金融基礎設施,STD打造DeFi體系基石系統_DEF:DEF價格

雖然DEFI的概念早在2017年就已經在項目中提出,但由于流動性的原因,DEFI一直沒有得到真正的發展。直到2020年,“流動性挖礦”的概念被提出,DEFI-去中心化金融迎來了巨大的發展.

1900/1/1 0:00:00
“春節送禮”如何講好一個消費升級的故事_LOV:LOV價格VELO價格

春節贈禮變化折射出消費變遷文丨紅碗社IDhongwanshe2020 作者丨Julie 子曰:來而不往非禮也.

1900/1/1 0:00:00
想成為主流?數字人民幣得跟互聯網有更多結合_數字人:NFC數字人直播軟件多少錢

圖片來源@視覺中國 文丨雷科技leitech剛進入2022年,數字人民幣試點就來到了新階段,作為官方服務平臺的“數字人民幣”App自1月4日起開始在各大安卓應用市場和蘋果AppStore正式上架.

1900/1/1 0:00:00
胖達人香精團訟案二審判賠342萬新臺幣 小S免賠_:

本文轉自:華夏經緯網 胖達人面包涉有香精事件,二審16日判生技達人等賠342萬多元,小S仍免賠.

1900/1/1 0:00:00
ads