遼寧省沈陽(yáng)市二中 邢城祎
在訂外賣(mài)的人群中,不同的人群所訂外賣(mài)的數(shù)量有著很大差別。本文把外賣(mài)垃圾數(shù)量—人群特點(diǎn)的關(guān)系和某地區(qū)月平均降水量—該地氣候類型的分類方式相類比,通過(guò)實(shí)地采集,得到外賣(mài)垃圾數(shù)量的第一手資料,并且查詢所需位置的降水量數(shù)據(jù),經(jīng)過(guò)數(shù)據(jù)清洗后,得到較為充分準(zhǔn)確的數(shù)據(jù)。同時(shí),在分類方法上進(jìn)行深入研究,采用深層神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練對(duì)應(yīng)的降水量—?dú)夂蝾愋蛿?shù)據(jù)。通過(guò)不斷的模型設(shè)計(jì)與超參數(shù)調(diào)節(jié),使模型在降水量—?dú)夂蝾愋秃屯赓u(mài)數(shù)量—人群種類兩個(gè)數(shù)據(jù)集上均達(dá)到較高的分類正確率。保存訓(xùn)練后的模型作為之后的預(yù)測(cè),達(dá)到使用時(shí)無(wú)需訓(xùn)練,僅需輸入該地外賣(mài)垃圾數(shù)量,就能夠以較高的正確率推測(cè)該地人群特點(diǎn)的目的。此模型在實(shí)際應(yīng)用上可以通過(guò)外賣(mài)數(shù)量推測(cè)人群特點(diǎn),從而研究更有效、更有針對(duì)性的垃圾處理方案。
2016年,全國(guó)生活垃圾年清運(yùn)量已經(jīng)高達(dá)20362萬(wàn)噸,而其中外賣(mài)垃圾所占的比例正逐年上升。根據(jù)外賣(mài)類平臺(tái)“餓了嗎”發(fā)布的數(shù)據(jù),外賣(mài)服務(wù)業(yè)每天至少會(huì)產(chǎn)生2000萬(wàn)份廢棄的一次性包裝盒、塑料袋和一次性餐具。垃圾已嚴(yán)重影響環(huán)境和人民的生活。
通過(guò)調(diào)查得出以下帶有一定普適性的分類標(biāo)準(zhǔn):
1.外賣(mài)固體廢棄物
類別舉例塑料 塑料餐具,塑料盒,塑料袋等紙紙袋,紙巾等紙皮 紙盒,宣傳單,紙杯等木頭 木制筷子等食品殘余物 各種食物殘?jiān)?/p>
2.人群種類與所處區(qū)域
所處區(qū)域 人群種類醫(yī)院 病人,醫(yī)護(hù)人員等研究所 科研人員等寫(xiě)字間 小型創(chuàng)業(yè)者等住宅區(qū) 普通居民等中學(xué)補(bǔ)課班 學(xué)生,老師等
1.采集方式
為了獲取準(zhǔn)確的第一手資料,收集數(shù)據(jù)采用實(shí)地采集的方法。因?yàn)樵诶占?,外賣(mài)垃圾與其他各種垃圾混合在一起,很難準(zhǔn)確測(cè)量出僅屬于外賣(mài)的垃圾質(zhì)量。所以,我們采用單位騎手的外賣(mài)垃圾質(zhì)量乘以外賣(mài)騎手?jǐn)?shù)量作為外賣(mài)質(zhì)量的估計(jì)值。對(duì)于單位騎手外賣(mài)垃圾質(zhì)量,我們將通過(guò)模擬預(yù)定外賣(mài)來(lái)測(cè)量每位騎手所帶來(lái)的外賣(mài)垃圾質(zhì)量。
2.各人群種類所在地區(qū)外賣(mài)固體廢棄物采集方法
通過(guò)網(wǎng)絡(luò)及實(shí)地調(diào)查,選取有代表性的人群種類所在地區(qū),確定所在地區(qū)能使外賣(mài)騎手進(jìn)入的大門(mén)數(shù)量,記錄7:30~19:30每一個(gè)小時(shí)內(nèi)各門(mén)外賣(mài)騎手的進(jìn)入數(shù)量,準(zhǔn)確測(cè)得數(shù)據(jù)后進(jìn)行統(tǒng)一的數(shù)據(jù)匯總。
1.假設(shè)外賣(mài)固體廢棄物僅分為如上類別,忽略其余垃圾種類。
2.假設(shè)人群種類僅分為如上類別,忽略其他人群種類。
3.假設(shè)所采集數(shù)據(jù)的地方具有強(qiáng)代表性,可以代表其他類似場(chǎng)所。
4.假設(shè)所調(diào)查的地方每日所產(chǎn)生的外賣(mài)固體廢棄物質(zhì)量相同。
5.假設(shè)模擬預(yù)定的外賣(mài)固體廢棄物質(zhì)量經(jīng)過(guò)平均計(jì)算,可以代表每位騎手所帶來(lái)的外 賣(mài)固體廢棄物質(zhì)量。
為估計(jì)每位騎手所帶來(lái)的外賣(mài)垃圾質(zhì)量,我們訂了不同種類的外賣(mài),分別稱量種類不同的固體廢棄物的質(zhì)量,經(jīng)多次稱量,得出如下數(shù)據(jù)(單位:g):
外賣(mài)垃圾種類 塑料 紙 紙皮 食品殘余物 木頭快餐:漢堡,圣代 28 6 22 8 0盒飯:普通飯菜 46 0 0 71 5面類:米粉 45 2 0 408 5平均質(zhì)量 40 3.6 7.3 162 3.3
1.?dāng)?shù)據(jù)采集
通過(guò)既定的方法,選取中國(guó)人民解放軍沈陽(yáng)軍區(qū)總醫(yī)院、中國(guó)科學(xué)院金屬研究所、沈陽(yáng)市華潤(rùn)大廈、豐澤花園與某補(bǔ)課班實(shí)地采集數(shù)據(jù)如下(單位:輛):
陸軍總院 金屬研究所 華潤(rùn)大廈豐澤花園 某補(bǔ)課班7:30~8:30 39 0 11 0 0 8:30~9:30 36 2 9 0 0 9:30~10:30 45 0 7 0 0 10:30~11:30 47 5 9 0 0 11:30~12:30 46 18 22 7 0 12:30~13:30 41 11 17 2 45 13:30~14:30 37 1 10 0 0 14:30~15:30 40 0 12 2 0 15:30~16:30 46 0 21 6 0 16:30~17:30 45 0 19 1 0 17:30~18:30 39 0 11 0 0 18:30~19:30 33 0 7 0 0
2.模型建立思路
實(shí)地采集各地外賣(mài)騎手?jǐn)?shù)量,發(fā)現(xiàn)各區(qū)域的每小時(shí)外賣(mài)騎手?jǐn)?shù)量分布特點(diǎn)與一些氣候類型所對(duì)應(yīng)的每月平均降水量分布特點(diǎn)極為相似,故以相似為基礎(chǔ),將各個(gè)人群特點(diǎn)所處區(qū)域一一映射至如下的氣候類型:
區(qū)域 數(shù)量特點(diǎn) 氣候類型 降水量特點(diǎn)陸軍總院 數(shù)量較平均且均較高 熱帶雨林氣候 全年多雨金屬研究所 在中午附近人群有所增加 溫帶季風(fēng)氣候 夏季濕潤(rùn)冬季干燥華潤(rùn)大廈 數(shù)量較平均且中等亞熱帶季風(fēng)氣候 全年濕潤(rùn)豐澤花園 數(shù)量較平均且很少溫帶大陸性氣候 夏季濕潤(rùn)冬季干燥某補(bǔ)課班 在中午附近有驟增熱帶季風(fēng)氣候 旱雨季節(jié)分明
選取典型氣候類型地區(qū):新加坡、哈爾濱、南京、烏魯木齊、新德里。收集歷史平均月降水量數(shù)據(jù)如下(單位:mm):
新加坡 哈爾濱 南京 烏魯木齊 新德里1 166 4 33 7 15 2 180 6 51 8 10 3 163 15 69 17 14 4 195 23 93 26 3 5 262 42 93 31 11 6 298 89 145 32 42 7 250 164 180 25 205 8 166 117 118 20 246 9 181 56 89 21 112 10 187 31 48 19 26 11 166 10 50 14 3
由此可見(jiàn),區(qū)域外賣(mài)騎手?jǐn)?shù)量分布與與其相對(duì)應(yīng)的地區(qū)降水量分布十分相似,故以此為基礎(chǔ)建立模型。
3.模型目的
通過(guò)訓(xùn)練,模型能夠接受一組從7:30~19:30每隔一小時(shí)的外賣(mài)騎手?jǐn)?shù)量,輸出五種人群特點(diǎn)的可信度。
4.?dāng)?shù)據(jù)收集及前期處理
(1)數(shù)據(jù)收集
從GHCN數(shù)據(jù)庫(kù)、環(huán)境云和Global Weather Data for SWAT上收集上述地區(qū)歷年的降水量數(shù)據(jù)作為訓(xùn)練數(shù)據(jù),選取一小部分?jǐn)?shù)據(jù)作為降水量—?dú)夂蝾愋万?yàn)證數(shù)據(jù),將區(qū)域外賣(mài)騎手?jǐn)?shù)量作為外賣(mài)騎手?jǐn)?shù)量—人群特點(diǎn)驗(yàn)證數(shù)據(jù)。
(2)數(shù)據(jù)前期處理
由于降水量數(shù)據(jù)與外賣(mài)騎手?jǐn)?shù)量量級(jí)并不相同。對(duì)于人眼,在觀測(cè)折線統(tǒng)計(jì)圖時(shí),主要觀測(cè)的是數(shù)據(jù)之間的相對(duì)大小關(guān)系以及數(shù)據(jù)(y)隨時(shí)間或者月份(x)的變化趨勢(shì)。因此,為統(tǒng)一數(shù)據(jù)量級(jí),防止深層神經(jīng)網(wǎng)絡(luò)模型出現(xiàn)學(xué)習(xí)方向的錯(cuò)誤,將每個(gè)數(shù)據(jù)除以12個(gè)單位時(shí)間或者月份(x),五種氣候類型或者人群特點(diǎn)的總共60個(gè)數(shù)據(jù)的和,使降水量數(shù)據(jù)與騎手?jǐn)?shù)據(jù)量級(jí)相似使大部分?jǐn)?shù)據(jù)在0~1之間。
5.模型建立
此模型總共有六層,分別是:批規(guī)范層(Batch Normalization),全連接層,丟棄層(Dropout),全連接層,全連接層,批規(guī)范層。
6.模型訓(xùn)練
(1)訓(xùn)練參數(shù)
經(jīng)過(guò)多次實(shí)驗(yàn)比對(duì),此模型采用全部數(shù)據(jù)以每10個(gè)為一批(Batch)輸入至網(wǎng)絡(luò),訓(xùn)練時(shí)將全部數(shù)據(jù)完整地訓(xùn)練100次(epoch=100)的方法。將模型誤差、降水量驗(yàn)證結(jié)果與外賣(mài)騎手?jǐn)?shù)量驗(yàn)證結(jié)果輸出。
(2)訓(xùn)練結(jié)果
訓(xùn)練后,保存訓(xùn)練日志。使用可視化工具TensorBoard查看模型誤差,并且使用TensorBoard畫(huà)出降水量驗(yàn)證結(jié)果與外賣(mài)騎手?jǐn)?shù)量驗(yàn)證結(jié)果折線圖。
降水量分類正確率如下(Smoothing=0):
外賣(mài)騎手?jǐn)?shù)量分類正確率如下(Smoothing=0.9):
從圖像中得出,經(jīng)過(guò)100輪(epoch)的訓(xùn)練,降水量模型的訓(xùn)練誤差在0和0.2之間,降水量的分類正確率幾乎達(dá)到了100%,外賣(mài)騎手?jǐn)?shù)量的分類正確率在75%到80%之間。
(7)模型結(jié)論
基于所處地人群特點(diǎn)與氣候類型,所處地12個(gè)小時(shí)外賣(mài)數(shù)量與特定氣候類型月平均降水量的相似性,建立深層神經(jīng)網(wǎng)絡(luò)模型,通過(guò)不斷調(diào)整超參數(shù),得出較為完善的模型,并進(jìn)行訓(xùn)練,使得此模型滿足模型目的,即,輸入12個(gè)小時(shí)的外賣(mài)騎手?jǐn)?shù)量,可以得出一個(gè)正確率在75%到80%的人群特點(diǎn)。