鄧超,梁雪霞,陳志,許良本,莫玉華*,朱博文,譚茜,廖國彬,李安,張欣
基于卷煙消費(fèi)大數(shù)據(jù)標(biāo)簽體系的六大畫像系統(tǒng)
鄧超1,梁雪霞1,陳志1,許良本1,莫玉華1*,朱博文2,譚茜1,廖國彬2,李安2,張欣1
1 廣西中煙工業(yè)有限責(zé)任公司,互聯(lián)網(wǎng)研究中心,南寧市北湖南路28號 530001;2 廣西壯族自治區(qū)煙草公司玉林市公司,營銷中心,玉林市二環(huán)東路58號 537000
為解決卷煙消費(fèi)者數(shù)據(jù)采集與分析難問題,提出了一種全新的基于時(shí)空網(wǎng)格技術(shù)的消費(fèi)人群大數(shù)據(jù)采集分析方法。通過商圈網(wǎng)格劃分和數(shù)據(jù)標(biāo)簽特征工程,實(shí)現(xiàn)企業(yè)消費(fèi)者大數(shù)據(jù)資源的高效融合,建立卷煙消費(fèi)大數(shù)據(jù)標(biāo)簽體系,提高了數(shù)據(jù)的使用價(jià)值和復(fù)用性?;诖髷?shù)據(jù)、時(shí)空網(wǎng)格、可視化技術(shù)構(gòu)建卷煙市場數(shù)字孿生體,設(shè)計(jì)實(shí)現(xiàn)了六大畫像系統(tǒng)。以玉林市場為例,實(shí)現(xiàn)了5237個(gè)商圈畫像、19544個(gè)終端畫像、42個(gè)品牌畫像、169個(gè)產(chǎn)品畫像以及12種商圈類別畫像、24種卷煙分類畫像?;谙到y(tǒng)對某卷煙品牌實(shí)施精準(zhǔn)投放實(shí)驗(yàn),該產(chǎn)品的貨源利用率從35%提升至59%。
消費(fèi)者;數(shù)字畫像;大數(shù)據(jù);標(biāo)簽體系;商圈;可視化
消費(fèi)者大數(shù)據(jù)分析是企業(yè)必須攻克的時(shí)代性課題,對企業(yè)數(shù)字化轉(zhuǎn)型具有重要意義。為順應(yīng)時(shí)代浪潮,煙草行業(yè)實(shí)施了生產(chǎn)經(jīng)營管理一體化平臺、云計(jì)算平臺、大數(shù)據(jù)中心等數(shù)字化項(xiàng)目[1],為業(yè)務(wù)數(shù)據(jù)的采集、串聯(lián)、聚合打下基礎(chǔ)。同時(shí),各煙草企業(yè)在消費(fèi)者大數(shù)據(jù)分析方面開展了大量研究,例如廣東煙草[2]基于SnowNLP情感詞典及分析庫和消費(fèi)者網(wǎng)評,動(dòng)態(tài)監(jiān)測消費(fèi)者對卷煙產(chǎn)品的情感傾向和情感指數(shù)。上海煙草[3]基于網(wǎng)絡(luò)爬蟲軟件和文本挖掘技術(shù)分析消費(fèi)者對電子煙的關(guān)注熱度及消費(fèi)行為。浙江煙草[4]結(jié)合企業(yè)宏觀經(jīng)濟(jì)、批發(fā)、零售、消費(fèi)、專賣管理數(shù)據(jù),基于多層神經(jīng)網(wǎng)絡(luò)模型進(jìn)行卷煙市場調(diào)控。福建煙草[5]利用大數(shù)據(jù)技術(shù)實(shí)現(xiàn)營銷、專賣業(yè)務(wù)數(shù)據(jù)分析。江蘇中煙[6]利用大數(shù)據(jù)和機(jī)器學(xué)習(xí)技術(shù)構(gòu)建了一種卷煙市場運(yùn)行狀態(tài)智能評價(jià)模型。河南中煙[7]基于消費(fèi)者網(wǎng)絡(luò)評價(jià)數(shù)據(jù)運(yùn)用詞頻分析法及關(guān)聯(lián)規(guī)則挖掘方法分析消費(fèi)者的斗煙市場偏好。廣西中煙[8-10]基于圖像識別技術(shù)構(gòu)建消費(fèi)者卷煙購買行為的識別方法;基于數(shù)據(jù)挖掘技術(shù)實(shí)現(xiàn)了卷煙掃碼消費(fèi)數(shù)據(jù)的熱力圖分析;基于時(shí)空網(wǎng)格技術(shù)實(shí)現(xiàn)了煙草市場大數(shù)據(jù)的可視分析。但總體而言,各煙草企業(yè)在卷煙消費(fèi)者數(shù)據(jù)采集與分析方面依舊存在不足。一是消費(fèi)者數(shù)據(jù)采集手段比較單一,消費(fèi)者信息不全、數(shù)據(jù)維度不夠豐富;二是缺乏一種行之有效的通用化方法對企業(yè)獲得的多源消費(fèi)者大數(shù)據(jù)進(jìn)行融合、分析、挖掘。
隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展,互聯(lián)網(wǎng)公司基于各種應(yīng)用軟件獲取了海量的消費(fèi)者數(shù)據(jù),為傳統(tǒng)企業(yè)研究市場消費(fèi)行為提供了新路徑。本文基于大數(shù)據(jù)技術(shù)和時(shí)空網(wǎng)格技術(shù)實(shí)現(xiàn)企業(yè)多源消費(fèi)者大數(shù)據(jù)融合,用商圈的地理屬性來聚合卷煙銷售業(yè)務(wù)數(shù)據(jù)和互聯(lián)網(wǎng)消費(fèi)人群數(shù)據(jù),提出了市場畫像、商圈畫像、終端畫像、消費(fèi)者畫像、品牌畫像、產(chǎn)品畫像(簡稱“六大畫像”)的技術(shù)實(shí)現(xiàn)方法,以期為行業(yè)卷煙市場銷售分析、消費(fèi)洞察、品牌培育、營銷策劃、卷煙投放、產(chǎn)品研發(fā)等核心業(yè)務(wù)提供消費(fèi)者大數(shù)據(jù)分析方法及范式。
為了能夠統(tǒng)籌兼顧煙草“工、商、零、消”各種應(yīng)用需求,建立以商圈為核心的“市場-商圈-終端”一體化卷煙消費(fèi)大數(shù)據(jù)標(biāo)簽體系。
卷煙消費(fèi)市場包括商圈、終端、消費(fèi)者、品牌、產(chǎn)品等多種要素,不同要素之間相互影響、相互作用,共同構(gòu)成了一個(gè)非常復(fù)雜的關(guān)系網(wǎng)絡(luò)?;诓煌姆治瞿康臅?huì)得到不同的分析脈絡(luò),在不同的業(yè)務(wù)場景中,消費(fèi)者分析需求各不相同。從“人、貨、場”維度出發(fā)得到卷煙消費(fèi)分析的3條主線:
(1)“人→場+貨”:這類人群在什么場所消費(fèi)了哪些卷煙?
(2)“貨→場+人”:這類卷煙(品牌、產(chǎn)品)在什么場所賣給了哪些人群?
(3)“場→貨+人”:這類零售終端訂購了什么卷煙賣給了哪些人群?
盡管“人、貨、場”同時(shí)出現(xiàn)在三條分析脈絡(luò)中,但是其含義和價(jià)值是不同的。不同分析脈絡(luò)決定了不同數(shù)據(jù)分析模型的“輸入”和“輸出”,而“輸入”和“輸出”之間往往是“一對多”的關(guān)系,例如一類人群會(huì)對應(yīng)多種卷煙消費(fèi),一個(gè)卷煙產(chǎn)品會(huì)對應(yīng)多個(gè)消費(fèi)人群。換言之,要確定基于哪些假設(shè)條件去推導(dǎo)求解畫像結(jié)果。
煙草工業(yè)企業(yè)在做品牌發(fā)展規(guī)劃和新產(chǎn)品研發(fā)時(shí)按“人→場+貨”主線,分析挖掘市場消費(fèi)行為規(guī)律和趨勢,精準(zhǔn)捕捉卷煙消費(fèi)需求進(jìn)行產(chǎn)品設(shè)計(jì),以提高產(chǎn)品研發(fā)成功率;在做市場營銷時(shí)按“貨→場+人”主線,制定符合消費(fèi)者興趣和習(xí)慣的營銷策略,為消費(fèi)者提供增值服務(wù)和舒適體驗(yàn)。
煙草商業(yè)企業(yè)開展品牌培育時(shí)需要按“人→場+貨”主線,研究當(dāng)?shù)厥袌龅木頍熛M(fèi)潮流和趨勢,從而更有針對性的制定品牌培育戰(zhàn)略,提升銷售結(jié)構(gòu);卷煙投放時(shí)按“貨→場+人”主線,根據(jù)實(shí)際消費(fèi)需求來統(tǒng)籌均衡投放策略,把貨源投放到有消費(fèi)需求的地方;終端服務(wù)時(shí)按“場→貨+人”主線,分析終端所處商圈的位置和消費(fèi)能力,為終端提供個(gè)性化銷售指導(dǎo)及建議。
地理學(xué)第一定律認(rèn)為,任何事物都是與其他事物相關(guān)的,但相近的事物關(guān)聯(lián)更緊密,地理事物或?qū)傩栽诳臻g上存在聚集、隨機(jī)、規(guī)則分布特征[11-12]。卷煙零售具有典型的線下零售特征,絕大部分消費(fèi)者都會(huì)遵循就近購買原則,為“以商圈為載體串聯(lián)消費(fèi)人群和產(chǎn)品”提供了理論基礎(chǔ)。由于煙草行業(yè)記錄了所有卷煙訂購及配送信息,可以精準(zhǔn)定位每一條卷煙銷售發(fā)生的地理位置,而互聯(lián)網(wǎng)服務(wù)商可以提供指定區(qū)域內(nèi)的消費(fèi)人群畫像等多維度信息。通過空間自相關(guān)分析方法[11-12],將同一個(gè)商圈范圍內(nèi)的消費(fèi)人群畫像與卷煙產(chǎn)品銷售信息進(jìn)行關(guān)聯(lián),進(jìn)而獲得“場+人+貨”數(shù)據(jù)樣本。
如圖1所示,以城市為單位,采用空間網(wǎng)格技術(shù)[10]將整個(gè)城市均勻劃分成若干個(gè)網(wǎng)格(750 m×750 m)。根據(jù)終端的經(jīng)緯度信息,將其映射到網(wǎng)格中,并統(tǒng)計(jì)每一個(gè)終端訂購各個(gè)卷煙規(guī)格的數(shù)量及金額。再根據(jù)終端的商圈ID,統(tǒng)計(jì)每一個(gè)商圈網(wǎng)格訂購各個(gè)卷煙規(guī)格的數(shù)量及金額,構(gòu)成商圈卷煙銷售屬性;采集(采購)每一個(gè)商圈的經(jīng)濟(jì)消費(fèi)、人群畫像、POI信息,構(gòu)成商圈外部消費(fèi)屬性。最終建立從卷煙產(chǎn)品到銷售場所再到消費(fèi)人群的數(shù)據(jù)分析鏈路。
本方法主要是基于地理空間特征來聚合經(jīng)濟(jì)人口和消費(fèi)人群信息,而非逐一追蹤消費(fèi)個(gè)體的消費(fèi)行為,用數(shù)萬個(gè)商圈的消費(fèi)人群畫像替代海量的消費(fèi)者個(gè)體畫像,把大數(shù)據(jù)樣本問題轉(zhuǎn)化為小數(shù)據(jù)樣本問題。城市商圈采用網(wǎng)格劃分,實(shí)現(xiàn)了卷煙銷售區(qū)域的全覆蓋,能夠更加高效的建立卷煙產(chǎn)品銷售與消費(fèi)場所周邊環(huán)境、消費(fèi)人群畫像之間的關(guān)聯(lián),有效補(bǔ)齊企業(yè)內(nèi)部消費(fèi)者數(shù)據(jù)采集的不足,提高了數(shù)據(jù)樣本的通用性和復(fù)用性,降低了卷煙消費(fèi)者數(shù)據(jù)采集的成本。
圖1 城市商圈網(wǎng)格示意圖
將數(shù)字孿生概念引入卷煙消費(fèi)者大數(shù)據(jù)分析領(lǐng)域,基于時(shí)空網(wǎng)格技術(shù)實(shí)現(xiàn)卷煙市場、商圈、終端、消費(fèi)者、品牌、產(chǎn)品信息與物理世界的一一對應(yīng),構(gòu)建卷煙市場數(shù)字孿生體,挖掘卷煙消費(fèi)市場中“人、貨、場”三者之間關(guān)聯(lián)關(guān)系。
六大畫像系統(tǒng)架構(gòu)總共分為5層,依次是數(shù)據(jù)層、算法層、技術(shù)層、部署層和應(yīng)用層(如圖2所示)。數(shù)據(jù)層主要是負(fù)責(zé)原始數(shù)據(jù)的采集、存儲(chǔ)、清洗、預(yù)處理、聚合。由于原始數(shù)據(jù)的體量大、維度多,不利于上層應(yīng)用的實(shí)時(shí)計(jì)算和快速交互,因此需要通過算法層進(jìn)行數(shù)據(jù)特征提取,將海量的原始數(shù)據(jù)加工成為應(yīng)用層可以直接調(diào)用的統(tǒng)計(jì)數(shù)據(jù)。算法層主要包括特征提取工程中涉及的各種大數(shù)據(jù)批處理算法、數(shù)據(jù)挖掘算法和商業(yè)分析模型,負(fù)責(zé)將海量原始數(shù)據(jù)加工成各種數(shù)據(jù)標(biāo)簽,建立消費(fèi)人群大數(shù)據(jù)標(biāo)簽體系,為應(yīng)用層提供數(shù)據(jù)調(diào)用基礎(chǔ)。技術(shù)層主要包括用于系統(tǒng)功能實(shí)現(xiàn)的前后端、中間件和數(shù)據(jù)庫技術(shù)。部署層主要采用了私有云架構(gòu),負(fù)責(zé)系統(tǒng)承載和安全防護(hù)。應(yīng)用層主要負(fù)責(zé)以一種交互、高效、便捷、友好的方式,向用戶提供系統(tǒng)操作界面和應(yīng)用功能呈現(xiàn),將各種標(biāo)簽信息及數(shù)字畫像向用戶進(jìn)行可視化展示。
圖2 系統(tǒng)架構(gòu)圖
為實(shí)現(xiàn)企業(yè)內(nèi)外部大數(shù)據(jù)資源融合,從商圈的基礎(chǔ)屬性、人群特征、消費(fèi)能力、銷售狀態(tài)、產(chǎn)品偏好等維度出發(fā)建立卷煙消費(fèi)大數(shù)據(jù)標(biāo)簽體系,分別對每個(gè)商圈和終端進(jìn)行數(shù)字化描述和評價(jià),共建立了60多項(xiàng)一級指標(biāo)和400多項(xiàng)二級指標(biāo)。為了高效的從海量數(shù)據(jù)中挖掘“人、貨、場”三者之間的關(guān)聯(lián)關(guān)系,需要先進(jìn)行批量化、自動(dòng)化的標(biāo)簽特征工程。分別以終端和網(wǎng)格為單位,按規(guī)則對終端數(shù)據(jù)表、商圈數(shù)據(jù)表中的每一列屬性打標(biāo)簽:
(1)定性分析:是或不是、有或沒有,匹配記為“1”,不匹配記為“0”。
(2)定量分析:采用管理學(xué)中的“二八原則”,篩選排名靠前的20%記為“1”,其余記為“0”。例如針對“某品牌”這個(gè)規(guī)格進(jìn)行打標(biāo)簽,銷量排名前20%的終端記“1”,其余記“0”。
基于標(biāo)簽進(jìn)行數(shù)據(jù)挖掘:
(1)“人→場+貨”主線:首先確定目標(biāo)人群,例如“高收入”人群,根據(jù)商圈中的“高收入”屬性進(jìn)行分組,值為“1”的商圈納入“高收入組”,值為“0”的商圈納入“普通收入組”,然后分別對2個(gè)組中所有商圈的其它屬性求平均值。通過“高收入組”和“普通收入組”之間各個(gè)屬性之間的差異分析,差異顯著的屬性即為我們重點(diǎn)關(guān)注的特征。例如“高收入組”中“某品牌”這個(gè)屬性為“1”的比例遠(yuǎn)高于“普通收入組”,那么得到推論:“高收入”人群與“某品牌”規(guī)格卷煙的銷量具有正相關(guān)關(guān)系。
(2)“貨→場+人”主線:首先確定目標(biāo)產(chǎn)品(或品牌)。例如對所有的商圈進(jìn)行分組(1或0,1代表高銷量,0代表普通)。然后以商圈銷量值作為權(quán)重,分別對2個(gè)組中所有商圈的其余屬性求加權(quán)平均值。通過2個(gè)組各個(gè)屬性之間的差異分析,獲得品牌規(guī)格銷量較高的商圈特征和人群特征。同理可應(yīng)用于卷煙品牌、卷煙類別(如“細(xì)支”、“一類煙”)與消費(fèi)場所、消費(fèi)人群的關(guān)聯(lián)關(guān)系分析。
(3)“場→貨+人”主線:終端繼承了所屬商圈的外部消費(fèi)屬性,而商圈聚合了所含終端的卷煙銷售屬性。大數(shù)據(jù)標(biāo)簽體系中的400多項(xiàng)二級指標(biāo)是對商圈和終端的數(shù)字畫像,而市場畫像是一種宏觀視角的畫像,它由多個(gè)終端微觀畫像和商圈中觀畫像聚合而成。例如可根據(jù)檔位、星級、市場類型、區(qū)縣等維度對終端進(jìn)行分類,然后對組內(nèi)所有終端的各個(gè)屬性求平均值,獲得不同終端類別的數(shù)字畫像。同理,也可根據(jù)商圈類型進(jìn)行聚合,獲得不同商圈類別的數(shù)字畫像。通過不同類別終端(或商圈)的各項(xiàng)屬性之間的差異分析,挖掘市場潛在規(guī)律。
該方法的本質(zhì)是采用“二分類”思想進(jìn)行數(shù)據(jù)樣本分組,然后通過數(shù)據(jù)關(guān)聯(lián)和統(tǒng)計(jì)分析尋找兩類樣本之間的差異。這些差異是基于事實(shí)大數(shù)據(jù)的總結(jié)和歸納,讓人對市場的認(rèn)知更加直觀、更加精準(zhǔn)、更加深刻,為實(shí)際工作提供重要思路和線索。當(dāng)數(shù)據(jù)樣本量越大,個(gè)體樣本誤差對計(jì)算結(jié)果的影響越小,數(shù)字畫像越精準(zhǔn)。數(shù)據(jù)分析結(jié)果與人的經(jīng)驗(yàn)之間反差越大,發(fā)現(xiàn)的數(shù)據(jù)價(jià)值就越大,此時(shí)舊的觀念會(huì)被顛覆,新的認(rèn)知隨之產(chǎn)生。
基于大數(shù)據(jù)、時(shí)空網(wǎng)格、可視化等技術(shù)構(gòu)建六大畫像系統(tǒng),實(shí)現(xiàn)面向卷煙市場數(shù)字孿生體的可視化呈現(xiàn)和交互式分析。結(jié)合廣西中煙某品牌發(fā)展需要,與廣西玉林市公司進(jìn)行合作,對新上市卷煙產(chǎn)品—某品牌(中支)開展市場培育和卷煙投放工作。
系統(tǒng)采用大數(shù)據(jù)可視分析技術(shù)[10]對六大畫像進(jìn)行空間化、可視化組織及索引,用戶可以一眼洞察卷煙消費(fèi)的空間分布規(guī)律,并通過電子地圖漫游查看商圈畫像和終端畫像。圖3從“宏觀-中觀-微觀”三種視角展現(xiàn)了玉林卷煙消費(fèi)市場的立體式畫像。市場畫像(如圖3(a))展示了玉林卷煙消費(fèi)市場的宏觀經(jīng)濟(jì)總覽,從人口密度、消費(fèi)水平、卷煙銷售能力、卷煙銷售潛力、基礎(chǔ)屬性等方面體現(xiàn)卷煙消費(fèi)市場的總量、環(huán)境及結(jié)構(gòu)。玉林市場畫像中涵蓋12種商圈類別、19544個(gè)終端、42個(gè)品牌、169個(gè)品規(guī)、14類基礎(chǔ)設(shè)施,以及超過12萬個(gè)POI信息,還包括城市面積、GDP、居民可支配收入等城市宏觀經(jīng)濟(jì)數(shù)據(jù)。
終端的卷煙銷售數(shù)量及結(jié)構(gòu)主要取決于所在商圈的消費(fèi)環(huán)境及人群結(jié)構(gòu)。整個(gè)玉林市包含5237個(gè)商圈格子,每個(gè)格子對應(yīng)著不同的商圈畫像。商圈畫像(如圖3(b))從產(chǎn)品偏好、基礎(chǔ)屬性、人群畫像、消費(fèi)能力4個(gè)維度、共61項(xiàng)指標(biāo)對商圈進(jìn)行數(shù)字化評價(jià)。終端畫像(如圖3(c))從門店信息、人群畫像、訂貨詳情、周邊對比4個(gè)維度、共37項(xiàng)指標(biāo)對終端進(jìn)行數(shù)字化評價(jià)。用戶可以自由切換各種畫像展示,全方位掌握市場銷售狀態(tài)。
圖3 市場-商圈-終端畫像
為了尋找適合某品牌(中支)的目標(biāo)消費(fèi)人群及目標(biāo)銷售場所,基于“貨→場+人”主線從品牌、價(jià)位、類型、競品等維度出發(fā),查看玉林市場上已有相關(guān)卷煙品牌及產(chǎn)品的畫像,包括其消費(fèi)場所、消費(fèi)人群的各種標(biāo)簽及統(tǒng)計(jì)分析。其中,某品牌(中支)和某品牌屬于同系列產(chǎn)品,具有相似的感官體驗(yàn)和價(jià)位。如圖4所示,某品牌銷量較高的商圈類型依次是CBD、高消費(fèi)、醫(yī)院、Z時(shí)代。而中支卷煙銷售也表現(xiàn)出相似的規(guī)律,這4類商圈的中支卷煙銷量占全市總銷量的73.3%(如圖5(a))。因此,某品牌(中支)的市場培育應(yīng)該重點(diǎn)鎖定CBD、高消費(fèi)、醫(yī)院、Z時(shí)代種類型商圈。
圖4 品牌-產(chǎn)品-消費(fèi)者畫像
可視化有助于實(shí)現(xiàn)信息的高效傳遞,而交互式分析有助于發(fā)揮人的主觀分析能力。針對某品牌(中支)的選點(diǎn)投放問題,用戶可以點(diǎn)擊“品規(guī)詳情”模塊中的中支卷煙畫像(如圖5(a)),查看市場上最暢銷的10款中支卷煙產(chǎn)品以及年度銷量變化趨勢。如5(b)所示,系統(tǒng)右側(cè)數(shù)據(jù)面板中可以看到整個(gè)城市宏觀的經(jīng)濟(jì)數(shù)據(jù)、基礎(chǔ)屬性和各個(gè)類型商圈的數(shù)量。在系統(tǒng)左側(cè)導(dǎo)航欄中勾選商圈類型,會(huì)用對應(yīng)的顏色展示該類型商圈在市場上的分布,通過縮放、點(diǎn)選地圖方格可以查看所選商圈的人口屬性、基礎(chǔ)屬性、人群畫像、消費(fèi)能力、產(chǎn)品偏好等信息,如圖5(c)所示?!盁崃D”功能可以針對400多個(gè)標(biāo)簽進(jìn)行條件篩選,并通過熱力地圖方式呈現(xiàn)。此外,可以根據(jù)“檔位、商圈、業(yè)態(tài)、區(qū)位”篩選終端,點(diǎn)擊商圈中的終端圖標(biāo)可以查看終端畫像(如圖5(d)),對該終端銷售某品牌(中支)的潛力進(jìn)行評估,最終選擇有潛力的終端進(jìn)行市場培育。
2021年9—12月,玉林市公司開展了基于消費(fèi)人群大數(shù)據(jù)標(biāo)簽的某品牌(中支)市場投放實(shí)驗(yàn),該產(chǎn)品的貨源利用率從35%提升至59%,市場培育效果提升明顯,全年共實(shí)現(xiàn)銷量5.35萬條。六大畫像系統(tǒng)獲得廣西煙草業(yè)界同行的一致好評,并在“廣西全區(qū)煙草商業(yè)農(nóng)網(wǎng)建設(shè)暨數(shù)據(jù)營銷現(xiàn)場會(huì)”上進(jìn)行重點(diǎn)展示和推廣應(yīng)用。
圖5 六大畫像系統(tǒng)演示
為解決我國煙草企業(yè)消費(fèi)者數(shù)據(jù)采集難、分析難等問題,提出了一種基于消費(fèi)人群大數(shù)據(jù)標(biāo)簽體系的六大畫像方法及系統(tǒng),為煙草行業(yè)提供了一種全新的卷煙消費(fèi)大數(shù)據(jù)采集與分析方法。其特點(diǎn)是通過標(biāo)簽特征工程將多源大數(shù)據(jù)進(jìn)行網(wǎng)格化、時(shí)空化、密度化處理,形成卷煙消費(fèi)大數(shù)據(jù)標(biāo)簽體系,實(shí)現(xiàn)了涵蓋卷煙市場、商圈、終端、消費(fèi)者、品牌、產(chǎn)品等400多個(gè)維度信息的高度集成,以及卷煙市場消費(fèi)規(guī)律的高效挖掘。提高了企業(yè)數(shù)據(jù)資源的使用價(jià)值、復(fù)用性和分析效率,降低了卷煙消費(fèi)者信息采集與分析的成本。基于大數(shù)據(jù)、時(shí)空網(wǎng)格、可視化等技術(shù)實(shí)現(xiàn)六大畫像系統(tǒng),從多種視角展現(xiàn)消費(fèi)者、卷煙產(chǎn)品和消費(fèi)場所之間的關(guān)聯(lián)關(guān)系與規(guī)律。
以廣西玉林市場為案例進(jìn)行系統(tǒng)展示,共實(shí)現(xiàn)了5237個(gè)商圈畫像、19544個(gè)終端畫像、42個(gè)品牌畫 像、169個(gè)產(chǎn)品畫像以及12種商圈類別畫像、24種卷煙分類畫像?;诹螽嬒耖_展某品牌(中支)新品上市培育工作,從多個(gè)視角進(jìn)行終端投放選點(diǎn)分析。最終,該產(chǎn)品的貨源利用率從35%提升至59%,系統(tǒng)應(yīng)用效果良好。下一步,將會(huì)擴(kuò)大系統(tǒng)的推廣范圍,并在終端經(jīng)營分析指導(dǎo)和卷煙精準(zhǔn)投放等領(lǐng)域進(jìn)行應(yīng)用擴(kuò)展。
[1] 謝劍平,王元英,鄭新章,等. 中國煙草科學(xué)與技術(shù)(1982- 2020)[M]. 北京:中國輕工業(yè)出版社,2021.
XIE Jianpin, WANG Yuanying, ZHENG Xinzhang, et al. China tobacco science and technology(1982-2020)[M]. Beijing: China Light Industry Press, 2021.
[2] 楊春曉,張鶴馨,黃家雯,等. 卷煙在線評論的文本情感分析[J]. 中國煙草學(xué)報(bào),2020, 26(02): 92-100.
YANG Chunxiao, ZHANG Hexin, HUANG Jiawen, et al. Text sentiment analysis of online cigarette reviews[J]. Acta Tabacaria Sinica, 2020, 26(02): 92-100.
[3] 金吉瓊,劉鴻,鄭賽晶. 基于在線評論文本挖掘技術(shù)的電子煙市場消費(fèi)熱點(diǎn)分析[J]. 煙草科技,2019, 52(12): 106-114.
JIN Jiqiong, LIU Hong, ZHENG Saijing. Analysis of consumption hotspots of electronic cigarette market based on online comment text mining technology[J]. Tobacco Science & Technology, 2019,52(12):106-114.
[4] 林少華,倪震海,周飛. 數(shù)據(jù)驅(qū)動(dòng)卷煙市場調(diào)控的探索與實(shí)踐[J]. 中國煙草學(xué)報(bào),2019, 25(04): 93-100.
LIN Shaohua, NI Zhenhai, ZHOU Fei. Exploration and practice of data-driven cigarette market regulation[J]. Acta Tabacaria Sinica, 2019, 25(04): 93-100.
[5] 章惠民. 福建煙草商業(yè)系統(tǒng)大數(shù)據(jù)技術(shù)研究與應(yīng)用[J]. 中國煙草學(xué)報(bào),2019, 25(06): 98-104.
ZHANG Huimin. Research and application of big data technology in Fujian Tobacco's commercial section[J]. Acta Tabacaria Sinica, 2019, 25(06): 98-104.
[6] 邢陽,黃旭峰,董曉萍,等. 卷煙市場運(yùn)行狀態(tài)智能評價(jià)模型的研究與應(yīng)用[J]. 煙草科技,2018, 51(7): 96-102.
XING Yang, HUANG Xufeng, DONG Xiaoping, et al. Research and application of intelligent assessment model for operation status of cigarette market[J]. Tobacco Science & Technology, 2018, 51(7): 96-102.
[7] 蘇凱,付博,楊永鋒,等. 基于互聯(lián)網(wǎng)數(shù)據(jù)的斗煙市場偏好性分析[J]. 煙草科技,2019, 52(08): 106-113.
SU Kai, FU Bo, YANG Yongfeng, et al. Internet data sourced market preference analysis for pipe tobacco[J]. Tobacco Science & Technology, 2019, 52(08): 106-113.
[8] 梁冬,陳智斌,農(nóng)英雄,等. 基于圖像識別技術(shù)的卷煙零售數(shù)據(jù)采集方法[J]. 中國煙草學(xué)報(bào),2021, 27(05): 81-89.
LIANG Dong, CHEN Zhibin, NONG Yingxiong, et al. Cigarette retail sales data collection method based on image recognition technology[J]. Acta Tabacaria Sinica, 2021, 27(5): 81-89.
[9] 鄧超,宋金偉,孫瑞志,等. 基于熱力圖的卷煙市場數(shù)據(jù)可視分析系統(tǒng)[J]. 煙草科技,2016, 49(12): 91-97.
DENG Chao, SONG Jinwei, SUN Ruizhi, et al. Visual analysis system of cigarette marketing data based on thermodynamic diagram[J]. Tobacco Science & Technology, 2016, 49(12): 91-97.
[10] 鄧超,宋金偉,孫瑞志,等. 基于時(shí)空網(wǎng)格的煙草市場大數(shù)據(jù)可視化[J]. 煙草科技,2018, 51(6): 106-112.
DENG Chao, SONG Jinwei, SUN Ruizhi, et al. Visual analysis of tobacco market big data based on spatial-temporal grid[J]. Tobacco Science & Technology, 2018, 51(6): 106-112.
[11] 禹文豪,艾廷華,楊敏,等. 利用核密度與空間自相關(guān)進(jìn)行城市設(shè)施興趣點(diǎn)分布熱點(diǎn)探測[J]. 武漢大學(xué)學(xué)報(bào)(信息科學(xué)版),2016, 41(02): 221-227.
YU Wenhao, AI Tinghua, YANG Min, et al. Detecting “hot spots” of facility POIs based on Kernel density estimation and spatial autocorrelation technique. Geomatics and Information Science of Wuhan University. 2016, 41(02): 221-227.
[12] 郝斌,董碩,胡引翠,等. 多維特征融合的城市商圈劃分方法[J]. 地理與地理信息科學(xué),2017, 33(05): 56-62.
HAO Bin, DONG Shuo, HU Yincui, et al. Urban business zones delimitation method based on the fusion of multidimensional characteristics[J]. Geography and Geo-Information Science. 2017, 33(05): 56-62.
Six portrait system based on cigarette consumption big data label system
DENG Chao1, LIANG Xuexia1,CHEN Zhi1, XU Liangben1, MO Yuhua1*, ZHU Bowen2, TAN Qian1, LIAO Guobin2, LI An2, ZHANG Xin1
1 Internet Research Center, China Tobacco Guangxi Industrial Co., Ltd., Nanning 530001, China;2 Marketing Center, Guangxi Tobacco Corporation Yulin Branch, Yulin 537000, China
A new big data collection and analysis method of cigarette consumer groups based on spatio-temporal grid technology is proposed in this paper. Through business district grid division and data label feature engineering, the efficient integration of big data resources of enterprise consumers is realized, and the cigarette consumption big data label system is established, which improves the use value and reusability of data. Based on technologies of big data, spatio-temporal grid and visualization, the digital twin of cigarette market is constructed, and the six portrait system is designed and implemented. Taking Yulin market as an example, 5237 business district portraits, 19544 terminal portraits, 42 brand portraits, 169 product portraits, 12 business district category portraits and 24 cigarette classification portraits have been realized. Based on the accurate delivery experiment of the Zhenlong (Haiyun middle branch) cigarette based on the system, the utilization rate of the product's supply increased from 35% to 59%, and the annual sales volume exceeded 53500 cartons per cigarette type. The application effect of the system has been highly praised by Guangxi tobacco peers.
consumer; digital portrait; big data; label system; business district; visualization
. Email:1351401656@qq.com
中國煙草總公司科技項(xiàng)目“面向研發(fā)營銷一體化的消費(fèi)者大數(shù)據(jù)分析關(guān)鍵技術(shù)研究”(No. 110202102029)
鄧超(1984—),博士,高級工程師,主要研究方向:大數(shù)據(jù)、人工智能、軟件工程,Email:154309865@qq.com
莫玉華(1995—),Email:1351401656@qq.com
2022-04-11;
2023-06-27
鄧超,梁雪霞,陳志,等. 基于卷煙消費(fèi)大數(shù)據(jù)標(biāo)簽體系的六大畫像系統(tǒng)[J]. 中國煙草學(xué)報(bào),2024,30(1). DENG Chao, LIANG Xuexia, CHEN Zhi, et al. Six portrait system based on cigarette consumption big data label system[J]. Acta Tabacaria Sinica, 2024, 30(1). doi:10.16472/j.chinatobacco.2022.063