以太坊交易所 以太坊交易所
Ctrl+D 以太坊交易所
ads

點寬專欄——教你如何應用樸素貝葉斯分類器進行股價趨勢分類預測_NFT:TEP

Author:

Time:1900/1/1 0:00:00

樸素貝葉斯分類器進行股價趨勢分類預測

原理

貝葉斯定理

模型思想

1、在風險識別中,貝葉斯模型本質上也是一種已知結果找原因的思維工具。

2、在風險決策中,利用貝葉斯模型的基本思想是充分利用先驗信息,將先驗分布和抽樣分布整合成后驗分布,從而利用后驗分布進行決策。如果有新的信息,則更新后驗分布,實現遞歸決策方案。從而得到最優策略,使得決策風險盡可能低。在概率統計的表述是:應用所觀察到的現象對有關概率分布的主觀判斷進行修正的標準方法。

3、在分類預測中,樸素貝葉斯的思想基礎是這樣的:對于給出的待分類項,求解在此項出現的條件下各個類別出現的概率,哪個最大,就認為此待分類項屬于哪個類別。

概率論基礎

要理解貝葉斯模型,必須先理解貝葉斯定理。貝葉斯定理實際上就是計算“條件概率”的公式。

加密風險投資公司Pantera使用硅谷銀行作為托管人:金色財經報道,根據上個月的一份監管文件,專注于加密貨幣的風險投資和投資巨頭Pantera capital最近與現已關閉的硅谷銀行(SVB)有資產。在2月3日的ADV表格中,Pantera將SVB列為其私人基金的三家托管人之一,另外兩家是BitGo和加密交易所Coinbase的托管服務。在聯合首席投資長Joey Krug離職后,Pantera上月重組了高層管理層。該公司今年1月透露,其流動性代幣基金在2022年損失了80%。[2023/3/11 12:55:49]

條件概率

條件概率,是指在事件B發生的情況下,事件A發生的概率,用P(A|B)來表示。其公式為:

上式可轉化為:

稱為乘法公式。

全概率公式

設試驗E的樣本空間為S,A為E的事件,B1,B2,…,Bn為S的一個劃分,則全概率公式為:

蘋果將允許歐洲用戶在第三方應用商店購買 NFT 和加密貨幣,以遵守歐盟新壟斷法:12月14日消息,為遵守歐盟新壟斷法,科技巨頭蘋果將允許其歐洲用戶在第三方應用商店購買 NFT 和加密貨幣。此前,蘋果對 NFT 應用程序有著嚴格的規定,用戶必須要在蘋果自己的 App Store 內購買,且需支付蘋果公司 30% 的傭金,不能使用加密貨幣支付。

蘋果公司這一開放其生態系統的最新舉措可以看作是對歐盟《數字市場法案》的回應,該法案旨在規范所謂的“看門人”,并確保平臺公平行事,允許“第三方與看門人自己的服務進行互操作”。(cointelegraph)[2022/12/14 21:44:10]

模型公式

公式

通常,事件A在事件B(發生)的條件下的概率,與事件B在事件A的條件下的概率是不一樣的;然而,這兩者是有確定的關系,貝葉斯法則就是這種關系的陳述。

美聯儲柯林斯:未來小幅加息可能會變得更加合適:金色財經報道,美聯儲柯林斯表示,美聯儲是時候把焦點從加息的規模轉移到最終目標上了。如果需要,仍可以加息75個基點。美聯儲進入貨幣政策緊縮周期的新階段。通脹仍然過高,美聯儲必須恢復價格穩定。有跡象顯示通貨膨脹激增開始緩和,未來小幅加息可能會變得更加合適。[2022/11/5 12:18:41]

設試驗E的樣本空間為S,A為E的事件,B1,B2,…,Bn為S的一個完備事件組,則:

其中:P(Bi):Bi的先驗概率或邊緣概率。之所以稱為“先驗”是因為它不考慮A任何因素的影響。P(Bi|A):已知A發生后Bi的條件概率,即由于得知A的取值而被稱作Bi的后驗概率。P(A|Bi):已知Bi發生后A的條件概率,即由于得知Bi的取值而被稱作A的后驗概率。P(A):A的先驗概率或邊緣概率,也作標準化常量

解析

數據:Proof Of Merge NFT采用ERC1155標準,現已鑄造超3萬枚:9月15日消息,根據NFTScan瀏覽器最新數據顯示,為紀念以太坊合并事件的Proof Of Merge NFT采用了ERC1155資產協議標準,目前NFT鑄造數量為31826枚,還在持續增長中。

此前消息,a16z Crypto推出紀念以太坊合并的NFT“Proof-of-Merge”,用戶可免費鑄造。[2022/9/15 6:57:38]

根據貝葉斯公式:

當A為特征向量,Bi(i=1,2,…,n)為分類標簽時。貝葉斯模型就可以進行分類預測。例如,在對股價進行分類中,特征向量A可以是各種技術指標或K線量價特征。而Bi(i=1,2,3)對應于給定方向上的實際價格變動的事件,其有三個可能的選項:B1=-1“向下”,B2=0“不確定”,B3=1“向上”。我們就可以根據歷史數據來進行分類預測,而預測結果的可能性可以用P(Bi|A)表示,分類級別很簡單:P(Bi|A)越大,則屬于該類別的可能性也越大。該分類方法也被稱為樸素貝葉斯分類器

特斯拉上半年錄得1.7億美元比特幣減值損失:7月25日消息,由于比特幣價格的變動,截至今年6月30日的六個月內,特斯拉錄得了1.7億美元的減值。同期特斯拉部分比特幣兌換法幣外匯獲利6400萬美元。(財聯社)[2022/7/25 2:36:23]

實踐

樸素貝葉斯模型在股票價格趨勢分類預測的應用

步驟

樸素貝葉斯分類器的具體步驟如下:

step1:設x={a1,a2,…,an}為一個待分類項,而每個a為x的一個特征屬性。

step2:有類別標簽集合C={y1,y2,…,ym}。

step3:根據貝葉斯公式,計算P(y1|x),P(y2|x),…,P(ym|x)。

step4:如果,P(yk|x)=max{P(y1|x),P(y2|x),…,P(ym|x。,則x被分到yk類別。

重點

關鍵就是如何計算第3步中的各個條件概率。

我們可以這么做:

step1:找到一個已知分類的待分類項集合,這個集合叫做訓練樣本集。

step2:統計得到在各類別下各個特征屬性的條件概率估計。即:

step3:如果各個特征屬性是條件獨立的,則根據貝葉斯定理有如下推導:

因為分母對于所有類別為常數,因為我們只要將分子最大化皆可。又因為各特征屬性是條件獨立的,所以有:

其中,1/N為常數。

因此,樸素貝葉斯分類器過程是利用樣本集統計出各特征屬性的條件概率以及分類標簽的概率。然后根據以上步驟對待分類項進行分類預測。

心得

可以看到,整個樸素貝葉斯分類分為三個階段:

第一階段——準備工作階段,這個階段的任務是為樸素貝葉斯分類做必要的準備,主要工作是根據具體情況確定特征屬性,并對每個特征屬性進行適當劃分,然后由人工對一部分待分類項進行分類,形成訓練樣本集合。這一階段的輸入是所有待分類數據,輸出是特征屬性和訓練樣本。這一階段是整個樸素貝葉斯分類中唯一需要人工完成的階段,其質量對整個過程將有重要影響,分類器的質量很大程度上由特征屬性、特征屬性劃分及訓練樣本質量決定。

第二階段——分類器訓練階段,這個階段的任務就是生成分類器,主要工作是計算每個類別在訓練樣本中的出現頻率及每個特征屬性劃分對每個類別的條件概率估計,并將結果記錄。其輸入是特征屬性和訓練樣本,輸出是分類器。這一階段是機械性階段,根據前面討論的公式可以由程序自動計算完成。

第三階段——應用階段。這個階段的任務是使用分類器對待分類項進行分類,其輸入是分類器和待分類項,輸出是待分類項與類別的映射關系。這一階段也是機械性階段,由程序完成。

應用

下面我們利用樸素貝葉斯模型對股票價格趨勢進行分類預測:

屬性劃分

對屬性的確定并對屬性進行適當劃分是非常重要的。這里為了簡單起見,我們利用當日的漲跌狀態、RSI指標、RSRS指標、CCI指標做為特征屬性。而實際價格趨勢為分類標簽。根據指標的常用方法對特征屬性進行劃分,其劃分如下表:

分類訓練

本文利用股市滬深300的所有成分股N天歷史數據作為訓練樣本。以當前天的下一交易日實際價格漲跌狀態為分類標簽進行分類器訓練。訓練樣本量為:3萬。

利用2018年5月1日之前的N天的樣本數據為訓練樣本,訓練結果如下表:

分類預測

預測2018年5月2日-5月15日這10個交易日價格漲跌趨勢。利用該段時間滬深300成分股的實際價格漲跌檢驗分類預測價格漲跌趨勢的準確率,如下表所示:

總結

簡單的利用貝葉斯模型對股價進行分類預測有一定的合理性。如果想要提高貝葉斯模型分類預測的準確性,我們可以從下面兩方面出發:

1、從貝葉斯模型的特征屬性出發,深入研究和挖掘更多有用的特征屬性,并合理地劃分每一個特征屬性的范圍。

2、選擇合適的訓練樣本集進行研究,可以按行業分類選擇具有相同趨勢的股票進行訓練及預測。

拓展

波動率估計

波動率模型,尤其是隨機波動率模型在金融領域有著廣泛的應用,這就使得模型的參數估計成為一個非常重要的問題。貝葉斯估計在隨機波動率模型上是十分普遍并應用廣泛的參數估計方法。

有興趣的同學可以查閱相關資料,利用貝葉斯估計方法對波動率模型進行參數估計。

來源:金色財經

Tags:NFTSTESTEPTEPNFT2$幣stellar幣維護節點STEPI幣NEXTEP

酷幣交易所
2.4黃金反彈依舊空附黃金操作建議和白銀td走勢分析_TRA:ETH

  黃金最新走勢分析:      黃金消息面:現貨黃金在兩周低位上方盤整,潛在的看漲情緒令避險資產黃金承壓,并遏制了黃金上漲至1845美元區域的勢頭.

1900/1/1 0:00:00
NBA Top Shot 仍是巨鯨樂園,NFT 爆發尚缺東風?_NBA:NBAI幣

文?:Nancy 編輯:Tong 出品:PANews 僅用600美元該如何賺取900萬美元?年僅29歲的NFT收藏家Pranksy給出了答案.

1900/1/1 0:00:00
實戰解析幣圈:2-4 以太坊多單布局 完美斬獲93個點位 利潤是檢驗實力的唯一標準_OIN:COIN

牛市行情波動太大,做單盡量擴大止損,策略僅供參考,不構成實際操作,網絡存在延時,具體操作以實盤為主,近期老師給出的策略,都能把握30-50美刀的利潤,由于客戶太多,不一一回復,vip投資者優先.

1900/1/1 0:00:00
圣穆德社區AMA 第1期_ING:THE

主題:房地產行業如何通過區塊鏈+的發展實現數字化、智慧化轉型Howcantherealestateindustryrealizedigitalandintelligenttransformati.

1900/1/1 0:00:00
DeFi保險賽道的一匹黑馬 : 原創型保險項目INS3正式上線 將重新定義保險領域_COVER:Tribalpunk cryptoverse

Ins3保險已經于1月29日上線火幣Heco鏈,成為火幣Heco鏈和conflux鏈首個原創保險項目,也是以太坊和DeFi史上第一個使用預言機作為償付標準的保險項目.

1900/1/1 0:00:00
拇指云算力Eric:IPFS價值逐步展現 FIL未來可期_THE:GulfCoin

IPFS作為一個面向全球的、點對點的分布式版本文件系統,目標是為了補充甚至取代目前我們日常所使用的超文本傳輸協議,IPFS分布式存儲基于內容的地址替代基于域名的地址.

1900/1/1 0:00:00
ads