国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

Keras神經(jīng)網(wǎng)絡(luò)預(yù)測大樂透彩票的實現(xiàn)

2022-04-20 11:15:10高楷程
微型電腦應(yīng)用 2022年3期
關(guān)鍵詞:大樂透個球彩票

高楷程

(東北石油大學,計算機與信息技術(shù)學院,黑龍江,大慶 163000)

0 引言

隨著大樂透彩票的普及,彩民的購買熱情越來越高,反映非常熱烈。在該玩法受歡迎的同時, 各種預(yù)測的方法都出現(xiàn)了。目前, 出現(xiàn)預(yù)測方法都是基于統(tǒng)計理論提出的, 如奇偶比、遺漏期K值、區(qū)段出號碼數(shù)字、數(shù)字頻率的次數(shù)等。因為采用的是統(tǒng)計方法, 具有一定的偶然性,其結(jié)果并不完全可靠。本文采用Keras神經(jīng)網(wǎng)絡(luò)搭建預(yù)測模型,進行訓練之后預(yù)測下一期的號碼,從結(jié)果上來說提高了中獎的概率。

1 預(yù)測

首先,大樂透的中獎序列為35選5+12選2,每個球的選取是隨機的,因此,想使用機器學習精準地預(yù)測出獲獎序列是很難的??梢灶惐扔跈C器學習選股票。目前有很多機器學習應(yīng)用在股票選擇上的例子,并能夠?qū)崿F(xiàn)盈利[1-3]。但機器學習選股和選彩票有幾點顯著差異:股票的漲跌存在各種因子、K線、輿情等參數(shù)用于評估和訓練,但彩票的中獎序列是隨機產(chǎn)生的,可供參考的可能僅有時間上的序列的概率分布。

所謂的概率分布指的是,假設(shè)彩票的中獎序列是完全隨機產(chǎn)生的,序列中每一個球在一次開獎過程中出現(xiàn)的概率應(yīng)該是相同的(前區(qū)和后區(qū)要分開算),并且從時間序列上來看,連續(xù)的多次開獎中,每一個球的出現(xiàn)與否也應(yīng)當滿足某種規(guī)律(當然,這是宏觀上講,實際上肯定不會嚴格滿足,但能夠體現(xiàn)某種趨勢或傾向)[4-6]。

2 數(shù)據(jù)

2.1 獲取數(shù)據(jù)

在江蘇體彩網(wǎng)獲取數(shù)據(jù),文件格式為csv。如圖1所示。

2.2 處理數(shù)據(jù)

雖然數(shù)據(jù)已經(jīng)獲取到了,但顯然這個數(shù)據(jù)無法直接應(yīng)用于訓練。需要對數(shù)據(jù)做一下簡單的處理。

本文為中獎序列中的數(shù)字(或者說球)編號,從前往后它們的編號分別為1到7,其中1~5是前區(qū)的5個球,6~7是后區(qū)的2個球。

同理,對于給定的課題,假如我們有近一年以來的氣溫數(shù)據(jù),需要預(yù)測明天的氣溫,一般的思路是用循環(huán)神經(jīng)網(wǎng)絡(luò)做序列的預(yù)測。假設(shè)按順序給這近一年來的氣溫分別編號為1~365,其中t1表示第一天的氣溫,t365表示今天的氣溫。

氣溫的變化應(yīng)該是有規(guī)律的(一般情況下),讓機器來學習這種規(guī)律。選定一個合適的時間長度,比如30天,然后將這30天的連續(xù)數(shù)據(jù)作為輸入(x),將接下來一天的氣溫數(shù)據(jù)作為輸出(y),就構(gòu)成了一條數(shù)據(jù)。然后使用長度為31天的掃描框,對一年的數(shù)據(jù)進行一次遍歷,就得到了一組數(shù)據(jù)集。用它進行訓練,完成后,輸入30天前到今天的氣溫序列,即可預(yù)測明天的氣溫。

本文的課題和預(yù)測氣溫差不多,使用連續(xù)若干期的球1數(shù)據(jù)來預(yù)測下期球1的分布概率,球2~球7都是同樣的方法。單從輸入輸出看來就是這樣,實際上實現(xiàn)起來肯定會有更多的處理和優(yōu)化[7-9]。

和預(yù)測氣溫的例子不同,氣溫預(yù)測時只有一種因子參與,就是當天的氣溫值。而在這個例子里,輸入的是7個球,輸出的也是7個概率分布,所以這是個多輸入、多輸出的模型。

3 編寫模型

模型示意圖如圖2所示。

圖2 模型示意圖

使用連續(xù)若干期的球1數(shù)據(jù)來預(yù)測下期球1的分布概率,球2~球7都是同樣的方法,但因為這些球本身并不獨立,比如球1開出了3,球2~球5就不可能再開出3,而是在剩下的里面選。所以我們在預(yù)測最后的概率之前,對球1~球5的中間層進行了拼接,再分別預(yù)測,這樣模型可能會學習到每一期中前區(qū)的球之間的某種關(guān)系。對于球6和球7,也做了類似操作。

球1~球5在前區(qū),球6~球7在后區(qū),兩者沒什么關(guān)系,所以這兩部分之間沒有進行拼接。

最后的輸出預(yù)測層選擇了Softmax,嚴格來說,Softmax對于這個問題來說,并不是一個很好的選擇,因為開球應(yīng)該是條件概率,比如球1開了5之后,開球2的概率計算應(yīng)該是球1=5條件下的條件概率,球3~球5同理。但最終還是選擇了Softmax,原因一是Softmax實現(xiàn)起來更加簡單,二是模型輸出本身設(shè)計的就不是預(yù)測頭等獎的完全正確序列,而是盡可能多地選中球。

4 工具方法

4.1 訓練

數(shù)據(jù)和模型都已經(jīng)準備完畢,可以進行訓練了。但這個模型不同于一般的分類模型,因此選擇回測方法評估模型的效果。

劃分一部分數(shù)據(jù)(比如90%)作為訓練集的訓練模型,剩下的10%作為測試集。劃分是按照時間順序劃分的,保證后面10%的數(shù)據(jù)絕不出現(xiàn)在訓練集的結(jié)果數(shù)據(jù)或過程數(shù)據(jù)中。在使用訓練集完成模型的訓練后,對測試集進行預(yù)測,并按照預(yù)測結(jié)果購買彩票,計算支出和獎金,以最終的凈收入的多少來衡量模型效果[10-13]。

按照訓練集∶測試集=9∶1的比例劃分數(shù)據(jù)集,在訓練集上訓練模型,并使用測試集回測。訓練60輪,每一輪訓練完成后都會保存模型的參數(shù),并進行回測。在訓練結(jié)束后,將所有回測結(jié)果按時間順序繪制出折線圖和趨勢線,如圖3所示。

圖3 預(yù)測趨勢圖

多次運行的結(jié)果可能差距明顯,其原因分析如下。

(1)訓練數(shù)據(jù)的原因

彩票選號其實是沒有嚴格的規(guī)律可言的,否則,哪怕只有極少數(shù)一批人能穩(wěn)定猜中,這個游戲也沒法長期運行。如果非要強行說個規(guī)律出來,那也只有長期下來的概率分布能勉強湊合。但首先大樂透也只開了1 000多期,數(shù)據(jù)有限,其次概率這種東西從字面上來看,就知道它不是固定的(哪怕出現(xiàn)的概率最高,也不一定會出現(xiàn))。這樣,當模型的隨機初始權(quán)重不同,訓練數(shù)據(jù)又很難找到特別清晰的規(guī)律時,模型學習到的東西也會產(chǎn)生相應(yīng)的區(qū)別,它們分別傾向到了概率分布的不同表現(xiàn)形式。

(2)回測時選擇彩票號碼的原因

選擇號碼時,同樣不是一定選擇出現(xiàn)概率最大的球,只是出現(xiàn)概率越大,被選中的概率就越大,這樣保證了結(jié)果的多樣性。

兩者綜合起來,兩次的運行結(jié)果可能天差地別,但從多次運行的整體來看,還是有一定規(guī)律的。

訓練一定次數(shù)之后,虧損金額大多分布在[-1 200,-900]左右,少數(shù)情況下在(-900,-400],極少數(shù)甚至還有盈余。

大部分都滿足“隨著訓練次數(shù)的增加,損失逐步減少”的規(guī)律,即圖中擬合的一次函數(shù)(一條斜直線)因為回測的隨機性,單點結(jié)果是會出現(xiàn)起伏波動的,所以使用趨勢來衡量整體結(jié)果會更加合適。

綜上,模型應(yīng)該起到了一定作用。

4.2 基線模型

基線模型指的是一個最基礎(chǔ)、最簡單的模型,它是從概率的角度上來說隨機性最強的一個模型。

一般基線模型都是完全隨機的。從前區(qū)選出5個球,后區(qū)選出2個球,每個球都隨機選擇,這就是基線模型。類似于彩票中心的機選方案。

模擬多次購買彩票來實現(xiàn)基線模型的預(yù)測虧損,模擬結(jié)果如圖4所示。

圖4 基線模型預(yù)測結(jié)果

多次運行可以發(fā)現(xiàn),最后的平均值絕大多數(shù)落在[-1 400,-1 200]之間,其中又以-1 250左右最多。少數(shù)虧得更少或更多,極少數(shù)能夠小賺。

5 預(yù)測下期彩票序列

如果準備利用模型買彩票,可以分為2種情況。

(1)選擇在上一步訓練好的某個模型參數(shù),加載這個參數(shù),輸入倒數(shù)第MAX_STEPS期到最近一期的數(shù)據(jù)序列,預(yù)測下一期序列。

(2)使用完整數(shù)據(jù)集作為訓練集,重新訓練模型并保存。然后和第一種情況一樣,加載模型參數(shù),輸入倒數(shù)第MAX_STEPS期到最近一期的數(shù)據(jù)序列,預(yù)測下一期序列。

兩者的區(qū)別在于:

第一種情況,有回測數(shù)據(jù),在選擇訓練好的參數(shù)時有一定的參考;第二種情況,使用了完整數(shù)據(jù)集來訓練,就沒有回測數(shù)據(jù)可參考了。

第一種情況的訓練數(shù)據(jù)少于第二種的訓練數(shù)據(jù)。按理說更多的訓練數(shù)據(jù)通常會產(chǎn)生更好的效果。

運行一下,模型輸出如圖5所示。

6 總結(jié)

本文通過神經(jīng)網(wǎng)絡(luò)算法來進行大樂透彩票預(yù)測實驗,從概率的角度說明預(yù)測的可能性,分別介紹了數(shù)據(jù)的獲取、模型的搭建以及進行實驗網(wǎng)絡(luò)的訓練實驗。

將算法應(yīng)用在大樂透預(yù)測上,并且獲取最近100期開獎記錄作為樣本數(shù)據(jù),通過實驗發(fā)現(xiàn)能在一定概率上提高中獎率。對其他彩票建立預(yù)測模型也有一定的參考價值。

猜你喜歡
大樂透個球彩票
鄭州購彩者火速領(lǐng)取大樂透九百一十八萬元
少林與太極(2023年4期)2023-07-14 07:48:20
丟失的中獎彩票
踢你個球
中學生(2017年20期)2017-10-23 01:42:59
踢你個球
中學生(2017年17期)2017-08-16 05:13:53
踢你個球
中學生(2017年14期)2017-06-09 08:59:03
嚕嚕豬買彩票
踢你個球(1)
中學生(2016年29期)2016-11-18 02:57:03
彩票呀,你該飛向哪
學習月刊(2015年5期)2015-02-25 15:13:40
彩票攤
兴隆县| 浏阳市| 乐都县| 黑山县| 陆良县| 汶川县| 永春县| 宝鸡市| 睢宁县| 竹北市| 庆元县| 罗田县| 纳雍县| 苗栗市| 曲阳县| 浙江省| 阿拉善盟| 桐城市| 大庆市| 浦城县| 福州市| 山西省| 石泉县| 辉县市| 宁城县| 永昌县| 荥阳市| 江山市| 台北市| 那坡县| 突泉县| 新丰县| 阜新市| 瑞昌市| 聂拉木县| 连云港市| 喜德县| 本溪| 关岭| 安龙县| 桑日县|