国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

垃圾短信分析及治理技術(shù)研究

2022-07-16 13:11劉誠陳曦吳文波
廣東通信技術(shù) 2022年6期
關(guān)鍵詞:網(wǎng)址短信詐騙

[劉誠 陳曦 吳文波]

1 引言

垃圾短信多年來一直是社會頑疾,詐騙、賭博、色情、騷擾、報(bào)復(fù)、暴力、廣告等垃圾短信的泛濫,擾亂他人安寧生活、敗壞社會風(fēng)氣,給用戶、運(yùn)營商和社會帶來很大的危害。

電信運(yùn)營商作為垃圾短信治理的主體,近年來一直在與垃圾短信進(jìn)行斗爭,并取得了一定的成效,有效遏制了垃圾短信泛濫的局面。但目前的整治效果離用戶、社會和政府的期望還有一定的差距,需要電信運(yùn)營商擔(dān)負(fù)起更大的社會責(zé)任,在現(xiàn)有治理成果的基礎(chǔ)上進(jìn)一步加大整治力度,更好地保護(hù)民眾的隱私和財(cái)產(chǎn)安全,還用戶一個(gè)清朗空間。

2 垃圾短信的概念和類型

2.1 垃圾短信的概念

垃圾短信是指未經(jīng)用戶同意而發(fā)送的用戶不愿意接收的短信,或用戶不能根據(jù)自己的意愿拒絕接收的短信。垃圾短信有以下4 個(gè)方面特點(diǎn)。

(1)短信內(nèi)容不合法。短信中含有詐騙內(nèi)容、暴力色情內(nèi)容、釣魚網(wǎng)站鏈接等違反法律、法規(guī)的內(nèi)容。

(2)短信成批量發(fā)送。垃圾短信發(fā)送者通過手機(jī)、互聯(lián)網(wǎng)或者消息群發(fā)器,針對一個(gè)或者大批量的手機(jī)號碼批量群發(fā),實(shí)現(xiàn)廣告推廣或轟炸騷擾的目的。

(3)違背接收者的主觀意志。部分商業(yè)短信未經(jīng)過短信接收者的同意而發(fā)送,且含有強(qiáng)制性的服務(wù)條款,違反了《通信短息服務(wù)管理規(guī)定》的規(guī)定。《通信短息服務(wù)管理規(guī)定》明確規(guī)定商業(yè)短信服務(wù)提供者必須給與短信接收者選擇權(quán),明確清楚告知用戶如何拒收此短信,也就是我們?nèi)粘T诮拥礁黝惥W(wǎng)購或商家短信最后顯示的“回復(fù)TD 退訂”此類字眼。

(4)客觀上對信息接收者造成騷擾。大量垃圾短信,不但影響用戶正常工作和生活,還會影響手機(jī)的正常使用。

2.2 垃圾短信的類型

垃圾短信形勢、內(nèi)容復(fù)雜多樣,大致可分以下幾類。

(1)政治類

政治類短信主要是境外反華勢力為實(shí)現(xiàn)分裂中華民族所采用的手段,發(fā)送號碼多為境外號碼,通過發(fā)送的顛倒黑白、詆毀國家、破壞民族團(tuán)結(jié)等信息,影響社會安定、民族團(tuán)結(jié)。

(2)欺詐類

欺詐類短信以騙取用戶錢財(cái)為目的,主要手段為冒充領(lǐng)導(dǎo)、親人、朋友加微信、冒充銀行政務(wù)平臺、編造中獎信息等,短信內(nèi)容一般附帶微信、QQ、電話號碼、非法網(wǎng)絡(luò)鏈接。用戶一旦中了圈套,輕則泄露個(gè)人身份和銀行卡等信息,重則面臨巨大的財(cái)產(chǎn)損失。此類短信危害最大,是治理的重中之重。

(3)騷擾類

騷擾類短信內(nèi)容主要是催還款、教育推廣、淘寶求好評、房產(chǎn)裝修廣告等,發(fā)送號碼多為點(diǎn)對點(diǎn)。此類短信危害性相對詐騙短信要輕,但特別讓人反感且容易引起用戶投訴。

3 垃圾短信治理技術(shù)研究

針對目前垃圾短信形式多樣、快速變化且危害巨大的情況,某運(yùn)營商在傳統(tǒng)的主叫號碼黑名單屏蔽、短信內(nèi)容關(guān)鍵字過濾的基礎(chǔ)上,還使用了以下幾種新技術(shù)進(jìn)行垃圾短信治理,并取得了很好的治理效果。

3.1 實(shí)時(shí)滑動窗口分析技術(shù)研究

在垃圾短信防治工作中,短信行為是判斷一條短信是否為垃圾短信的重要依據(jù)。以前的技術(shù)只能對過去1 小時(shí)甚至更長時(shí)間內(nèi)的短信行為進(jìn)行分析和聚類,但此技術(shù)有兩大缺點(diǎn),①計(jì)算效率低下;② 因?yàn)橛?jì)算滯后導(dǎo)致錯(cuò)過最佳治理時(shí)效,所以治理效果很一般,很容易讓垃圾短信群發(fā)者找到攔截漏洞。

為了解決此問題,某運(yùn)營商在垃圾短信防治系統(tǒng)新采用了實(shí)時(shí)滑動窗口分析技術(shù),將原本需要1 小時(shí)后才能準(zhǔn)確計(jì)算的發(fā)送行為,壓縮至分鐘級甚至秒級,極大減少行為分析采樣所需要的時(shí)間,有效縮短計(jì)算延后窗口時(shí)長,為治理詐騙短信爭取到寶貴時(shí)間。

實(shí)時(shí)滑動窗口分析是一種改善海量數(shù)據(jù)時(shí)間窗口計(jì)算的優(yōu)化算法。其基本原理是,系統(tǒng)將時(shí)間窗口拆分成固定個(gè)數(shù)的小時(shí)間窗口,且通常將時(shí)間窗口及計(jì)算結(jié)果保存在內(nèi)存中以提高系統(tǒng)性能。以5 分鐘時(shí)間窗口為例,假定單位時(shí)間窗口時(shí)長度為1 分鐘,系統(tǒng)計(jì)算5 分鐘短信發(fā)送行為需要在保留5 個(gè)單位時(shí)間窗口,當(dāng)系統(tǒng)計(jì)數(shù)到第6 個(gè)時(shí)間窗口時(shí),從前5 個(gè)單位時(shí)間窗口快速匯總分析計(jì)算出5分鐘短信發(fā)送行為后并丟棄第一個(gè)時(shí)間窗口,后面的分析依此類推。滑動窗口實(shí)時(shí)分析技術(shù)原理,如圖1 所示。

圖1 基于時(shí)間窗口的滾動計(jì)算示意圖(滑動窗口)

采用滑動窗口實(shí)時(shí)分析技術(shù)從全量信息中動態(tài)計(jì)算主被叫號碼離散系數(shù)、發(fā)送時(shí)序、歸屬地分布、內(nèi)容特征等,實(shí)時(shí)分析高達(dá)數(shù)十萬維特征信息,系統(tǒng)通過決策樹等多個(gè)智能算法綜合判斷疑似詐騙短信行為及發(fā)送號碼。系統(tǒng)不內(nèi)置任何特定關(guān)鍵詞、號碼及詐騙信息判斷標(biāo)準(zhǔn),而是實(shí)時(shí)從當(dāng)前海量發(fā)送信息中分析和學(xué)習(xí)信息發(fā)行為及特征并聚類分析,進(jìn)而實(shí)時(shí)發(fā)現(xiàn)全新的詐騙短信內(nèi)容及號碼源。某運(yùn)營商基于自研的實(shí)時(shí)大數(shù)據(jù)分析框架,實(shí)現(xiàn)實(shí)時(shí)攔截與主動發(fā)現(xiàn)并行分析,高效解決詐騙短彩實(shí)時(shí)治理中的趨勢分析與策略發(fā)現(xiàn)及時(shí)性等關(guān)鍵問題。

3.2 木馬病毒短信防治技術(shù)研究

木馬病毒短信有兩個(gè)基本特征:①內(nèi)容中含有網(wǎng)址;②群發(fā)傳播行為。用戶點(diǎn)擊病毒短信中的網(wǎng)址,將觸發(fā)病毒短信執(zhí)行其后續(xù)破壞策略,如惡意扣費(fèi)、耗盡流量、讀取通訊錄自我擴(kuò)散等。

某運(yùn)營商根據(jù)木馬病毒短信上述兩個(gè)特征,通過判斷網(wǎng)址是否正常、木馬病毒智能攔截、病毒短信聯(lián)動封堵、病毒短信智能提醒和病毒短信聯(lián)動協(xié)同手段,如圖2 所示。

圖2 智能預(yù)警、智能攔截、智能聯(lián)封、智能提醒和智能協(xié)同等5 個(gè)智能化模型

下面就這幾種手段進(jìn)行說明。

(1)對短信中的網(wǎng)址進(jìn)行分析,判斷網(wǎng)址是否包含木馬病毒

① 網(wǎng)址提?。禾崛《绦艃?nèi)容中的網(wǎng)址,積累成網(wǎng)址標(biāo)簽庫,初步評定這個(gè)網(wǎng)址的嫌疑級別;

② 行為分析:針對上述網(wǎng)址,根據(jù)其初定嫌疑級別,進(jìn)行行為跟蹤分析,若呈現(xiàn)“網(wǎng)狀發(fā)送形態(tài)”,則可標(biāo)定其嫌疑級別為“高”;

③ 網(wǎng)址檢測:若含有網(wǎng)址短信發(fā)送不具有“網(wǎng)狀發(fā)送形態(tài)”,或者不明顯,則通過網(wǎng)絡(luò)爬蟲爬取相應(yīng)網(wǎng)址網(wǎng)站內(nèi)容并進(jìn)行檢測(或通過接口調(diào)用具備此功能的系統(tǒng))。

(2)木馬病毒智能攔截

根據(jù)病毒短信分析預(yù)警結(jié)果,建立兩個(gè)針對病毒短信的樣本攔截樣本庫:

① 利用嫌疑級別為“高”的病毒短信告警信息構(gòu)建黑內(nèi)容樣本庫,實(shí)現(xiàn)基于與庫樣本文字匹配分析攔截;

② 利用嫌疑級別為“高”、“中”的病毒短信告警信息構(gòu)建智能分詞樣本庫,實(shí)現(xiàn)基于與庫樣本相識程度分析攔截。

(3)病毒短信聯(lián)動封堵

根據(jù)病毒短信分析預(yù)警結(jié)果,把嫌疑級別為“高”的網(wǎng)址推送至WAP 網(wǎng)關(guān),實(shí)現(xiàn)聯(lián)動封堵,避免網(wǎng)址被更多用戶訪問,從而掐斷手機(jī)病毒破壞性觸發(fā)的途徑。

(4)病毒短信智能提醒

根據(jù)所建立的網(wǎng)址標(biāo)簽庫,分析識別出手機(jī)中毒用戶,并主動向該用戶發(fā)送一條告知信息(含中毒情況和處理方法等),以提升用戶感知。

(5)病毒短信聯(lián)動協(xié)同

通過郵件、短信等方式把病毒短信預(yù)警信息、智能攔截情況、聯(lián)動封堵情況、智能提醒情況等推送至10000 號、12321 等部門實(shí)現(xiàn)信息共享。

通過構(gòu)建智能預(yù)警、智能攔截、智能聯(lián)封、智能提醒和智能協(xié)同等5 個(gè)智能化模型,實(shí)現(xiàn)全流程一體化,自動發(fā)現(xiàn)并過濾病毒短信,消除用戶手機(jī)中毒的安全隱患,降低社會危害。在各類消息安全監(jiān)控系統(tǒng)應(yīng)用場景中,極大提高了病毒短信的識別準(zhǔn)確率,為遏制病毒短信傳播提供了可靠的技術(shù)保障。

3.3 基于貝葉斯算法內(nèi)容分類技術(shù)研究

詐騙短信發(fā)送者通常會囤積大量號碼,在群發(fā)詐騙信息時(shí),會依據(jù)短信回執(zhí)或發(fā)送至內(nèi)部測試卡中測試是否可成功發(fā)送,如發(fā)送失敗及時(shí)調(diào)整發(fā)送內(nèi)容,因此使得傳統(tǒng)的黑名單策略、流量限制策略和關(guān)鍵詞策略收效甚微。

針對這種情況,人工首先收集大量詐騙樣本信息,然后根據(jù)樣本信息進(jìn)行分類(貸款類、ETC 類、招聘類、中獎詐騙、冒充熟人、航空詐騙等),在垃圾短信防治平臺中建立豐富的詐騙信息樣本庫。在詐騙信息樣本庫建立完成后,平臺對新收到的短彩信,通過貝葉斯算法、詞向量等文本語義分類算法與樣本庫進(jìn)行相似度匹配,識別詐騙信息,通過設(shè)置不同的攔截相似度,實(shí)現(xiàn)對類型相同但內(nèi)容頻繁變換的短信實(shí)行智能攔截,如圖3 所示。

圖3 詐騙信息智能攔截處理示意圖

根據(jù)條件概率和樸素貝葉斯算法的假定,計(jì)算未知樣本在各類中的后驗(yàn)概率:

后驗(yàn)概率的最大值所對應(yīng)的類即為該未知樣本的分類:

由以上步驟可知,樸素貝葉斯分類模型的實(shí)現(xiàn),主要分為4 個(gè)部分:

因此,可以根據(jù)訓(xùn)練集來計(jì)算某已知文本類的先驗(yàn)概率,再計(jì)算其后驗(yàn)概率,對后續(xù)新的文本類進(jìn)行分析預(yù)測,在已知的分類概率的條件下,由此可得待處理文本屬于某一類概率值,最后取其中的最大值,將待處理文本歸類到最大值的那類中。需要說明的是,類別之間是相互獨(dú)立的,模型具有收斂性。樸素貝葉斯算法閾值分類流程如圖4 所示。

圖4 樸素貝葉斯算法閾值分類流程圖

貝葉斯算法速度較快、正確率較高,但也存在誤判的情況。算法基于條件獨(dú)立性假設(shè),認(rèn)為每個(gè)屬性對類屬性影響相同,但事實(shí)并非如此,有些屬性對分類影響大而有些屬性對分類影響較小。如果把與分類無關(guān)的、冗余的以及被噪聲污染的屬性和其他屬性視為同等地位,將會導(dǎo)致分類的準(zhǔn)確率下降。

為減少屬性間的影響,引入以基本短語為單位的分詞方法。結(jié)合基本短語構(gòu)成算法,并根據(jù)基本短語的定義實(shí)現(xiàn)由詞到基本短語的轉(zhuǎn)換。

實(shí)驗(yàn)結(jié)果:

為清晰表達(dá)比較結(jié)果,引入了幾個(gè)參數(shù),定義如下。

SP 反映垃圾短信過濾系統(tǒng)的可靠性,側(cè)重安全性;SR 反映垃圾短信過濾系統(tǒng)的效率,側(cè)重有效性;F 則綜合兩者的指標(biāo),側(cè)重綜合性能。

以短信為例進(jìn)行試驗(yàn),其中正常短信1032 條,垃圾短信375 條。以短語為單位得到特征項(xiàng)數(shù)為20783,其中BaseNP(基本名詞短語)為13 542,BaseVP(基本動詞短語)有7241 個(gè),而以詞為單位得到特征項(xiàng)數(shù)為173 657。這樣降低樣本空間規(guī)模,縮減計(jì)算量,提高系統(tǒng)效率,如圖5所示。

圖5 按詞分析、按短語分析效果對比圖

4 結(jié)束語

本文介紹了垃圾短信概念和類型,并詳細(xì)介紹了某運(yùn)營商在垃圾短信治理中所使用的技術(shù)。某運(yùn)營商判斷今后垃圾短信發(fā)送會呈現(xiàn)出的場景化、精準(zhǔn)化、智能化的特點(diǎn),此外隨著5G 消息的商用,融合語音、圖片、視頻等內(nèi)容的短信越來越多,這也給治理帶來了更大的挑戰(zhàn)和困難。某運(yùn)營商在今后的垃圾短信治理工作中,將引入人工智能等技術(shù),提高場景化語義分析能力,并增加語音、圖片、視頻的分析能力。

猜你喜歡
網(wǎng)址短信詐騙
中老年保健(2022年5期)2022-11-25
啟 示
本刊網(wǎng)址變更通知
詐騙
火眼金睛快速顯示鏈接的網(wǎng)址
道歉短信
遠(yuǎn)程詐騙
代發(fā)短信
短網(wǎng)址服務(wù)系統(tǒng)的實(shí)現(xiàn)及相關(guān)技術(shù)研究
詐騙
同江市| 潞西市| 崇礼县| 习水县| 贵州省| 遂昌县| 清涧县| 晋城| 绥芬河市| 申扎县| 朔州市| 镇江市| 青岛市| 缙云县| 新昌县| 冷水江市| 韶关市| 宝兴县| 鹤峰县| 宜黄县| 阜城县| 舟曲县| 万源市| 古田县| 环江| 长葛市| 富阳市| 理塘县| 西乌珠穆沁旗| 三都| 惠州市| 赤峰市| 翁源县| 桃园市| 蒙城县| 丹江口市| 阿勒泰市| 五原县| 丰台区| 澄城县| 昆明市|