国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

鴻蒙音視頻監(jiān)測(cè)系統(tǒng)在廣告?zhèn)髅街械膽?yīng)用

2022-12-26 09:57鄭世寶楊健雄
關(guān)鍵詞:音視頻監(jiān)測(cè)模型

鄭世寶,楊健雄

(1.北京鴻蒙網(wǎng)科技有限公司,北京 100036;2.中國(guó)信息產(chǎn)業(yè)商會(huì)廣電協(xié)作委,北京 100866)

1 引言

中國(guó)正在進(jìn)行的治理現(xiàn)代化和深化行業(yè)改革,特別是廣播電視行業(yè)正在全面實(shí)施智慧廣電戰(zhàn)略,加快推進(jìn)媒體深度融合,結(jié)合實(shí)際與市場(chǎng)監(jiān)管部門一起對(duì)市場(chǎng)秩序、市場(chǎng)環(huán)境進(jìn)行綜合監(jiān)管,為廣播電視及融媒體市場(chǎng)監(jiān)管提供一個(gè)明確的技術(shù)框架,建立綜合監(jiān)管與行業(yè)領(lǐng)域?qū)I(yè)監(jiān)測(cè)、社會(huì)協(xié)同監(jiān)督,形成優(yōu)勢(shì)互補(bǔ)、相互促進(jìn)的廣電行業(yè)市場(chǎng)監(jiān)管格局。今后的市場(chǎng)監(jiān)管工作應(yīng)當(dāng)堅(jiān)持以技術(shù)為引領(lǐng),以設(shè)施和數(shù)據(jù)為基礎(chǔ),在完善監(jiān)管體系和機(jī)制中提升智慧監(jiān)管效率。智慧監(jiān)管不僅是監(jiān)管技術(shù)、監(jiān)管手段的創(chuàng)新,更是監(jiān)管理念的創(chuàng)新。在市場(chǎng)治理參與主體日趨多元化的當(dāng)下,應(yīng)進(jìn)一步降低市場(chǎng)主體的制度性交易成本,加強(qiáng)信息共享、數(shù)據(jù)互通,促進(jìn)政府部門、行業(yè)組織、市場(chǎng)主體以及消費(fèi)者的協(xié)同共治。

鴻蒙音視頻監(jiān)測(cè)系統(tǒng)采用鴻蒙首個(gè)云平臺(tái)系列核心技術(shù),包含無限分層信息遺傳集群專利技術(shù),北斗衛(wèi)星和IP雙定位校正專利技術(shù),智能云終端中央控制萬物互聯(lián)專利技術(shù),云服務(wù)器專利技術(shù)??蛇\(yùn)用到普通網(wǎng)絡(luò)音視頻、電視、電臺(tái)、戶外LED大小屏等廣告播放監(jiān)管場(chǎng)景,提供高效監(jiān)測(cè),實(shí)現(xiàn)減輕工作人員原有的勞動(dòng)強(qiáng)度,提高工作效率,節(jié)省勞動(dòng)力的成本,大幅提升監(jiān)測(cè)任務(wù)的完成質(zhì)量。

2 系統(tǒng)架構(gòu)設(shè)計(jì)

系統(tǒng)整體采用鴻蒙云系統(tǒng)(Hong Meng Cloud System,HMCS)作平臺(tái)支撐,按照中國(guó)行政區(qū)劃為節(jié)點(diǎn)進(jìn)行本地化部署,構(gòu)建了云平臺(tái)集群體系。采用云計(jì)算、大數(shù)據(jù)、區(qū)塊鏈以及人工智能等新興技術(shù)[1-4],與本地市場(chǎng)監(jiān)管及治理模式緊密結(jié)合,建立了一套從中央到省到市到區(qū)縣局的完整、統(tǒng)一、規(guī)范的大市場(chǎng)監(jiān)管平臺(tái),集成多系統(tǒng)間既相互獨(dú)立,又相互關(guān)聯(lián)。遵循“分級(jí)負(fù)責(zé),屬地監(jiān)測(cè),上下協(xié)同”的總原則,保障市場(chǎng)監(jiān)管部門工作有序開展,完成區(qū)域大數(shù)據(jù)自動(dòng)收集、智能分析尋找線索并提交報(bào)告工作,推動(dòng)國(guó)務(wù)院“智慧監(jiān)管”政策的落實(shí)。

系統(tǒng)針對(duì)平臺(tái)的網(wǎng)絡(luò)環(huán)境運(yùn)用分層遺傳專利技術(shù)架構(gòu)實(shí)現(xiàn)信息資源共享的同時(shí),必須進(jìn)行信息資源的有效保護(hù)和安全隔離,針對(duì)不同的應(yīng)用需求,采取不同強(qiáng)度的安全保密方式,包括數(shù)據(jù)加密存儲(chǔ)/傳輸、身份認(rèn)證和存取控制,實(shí)現(xiàn)負(fù)載均衡,結(jié)合國(guó)家等級(jí)保護(hù)的建設(shè)規(guī)范和技術(shù)要求,形成多系統(tǒng)復(fù)雜環(huán)境的等級(jí)保護(hù)建設(shè)方法。通過本地部署實(shí)施對(duì)平臺(tái)各類信息系統(tǒng)進(jìn)行全方位的安全防護(hù),有效降低平臺(tái)運(yùn)行當(dāng)中存在的安全風(fēng)險(xiǎn)。

為確保系統(tǒng)的建設(shè)成功與可持續(xù)發(fā)展,在系統(tǒng)的建設(shè)與技術(shù)方案設(shè)計(jì)時(shí)遵循如下原則:

(1)中國(guó)特色原則。尤其是音視頻應(yīng)用系統(tǒng)采集、數(shù)據(jù)模型、數(shù)據(jù)存儲(chǔ)以及系統(tǒng)擴(kuò)展規(guī)劃等內(nèi)容,均從國(guó)情出發(fā)對(duì)廣告和傳媒特點(diǎn)進(jìn)行深入研究。

(2)標(biāo)準(zhǔn)化原則。在設(shè)計(jì)過程中充分依照國(guó)際上的規(guī)范、標(biāo)準(zhǔn),保證系統(tǒng)具有先進(jìn)性,部署符合國(guó)際發(fā)展趨勢(shì)的技術(shù)、軟件產(chǎn)品和設(shè)備。

(3)高可靠安全性。系統(tǒng)架構(gòu)設(shè)計(jì)和應(yīng)用設(shè)計(jì)中充分考慮系統(tǒng)的安全和可靠,排除非可用因素,采用目前最高的安全標(biāo)準(zhǔn)和多重防護(hù)措施。

(4)實(shí)用可擴(kuò)展。保護(hù)已有資源,急用先行,在滿足應(yīng)用需求的前提下,盡量降低建設(shè)成本。信息系統(tǒng)設(shè)計(jì)要考慮到業(yè)務(wù)未來發(fā)展的需要,盡可能設(shè)計(jì)的兼容性好,降低各功能模塊耦合度,能夠支持對(duì)多種格式數(shù)據(jù)的存儲(chǔ)。

系統(tǒng)提供了基于云平臺(tái)的虛擬集群構(gòu)建,實(shí)現(xiàn)了靈活構(gòu)建高性能計(jì)算集群,并根據(jù)用戶作業(yè)需求,提供彈性的計(jì)算資源以提高物理機(jī)器的利用率。HMCS 虛擬集群各個(gè)服務(wù)之間通過統(tǒng)一的API 調(diào)用,實(shí)現(xiàn)系統(tǒng)的松耦合。它內(nèi)部組件的工作過程是一個(gè)有序的整體,諸如計(jì)算資源分配、控制調(diào)度、網(wǎng)絡(luò)通信等都通過 AMQP(Advanced Message Queuing Proto‐col)來實(shí)現(xiàn)。各個(gè)組件之間通過AMQP 進(jìn)行互相調(diào)用,它們共同利用底層的虛擬資源為上層用戶和程序提供云計(jì)算服務(wù)。采用數(shù)據(jù)多副本技術(shù)、虛擬機(jī)備份技術(shù)、應(yīng)用數(shù)據(jù)備份、網(wǎng)絡(luò)行為管理等多項(xiàng)技術(shù)保障數(shù)據(jù)可靠。

系統(tǒng)采用 HMCS 的 HMFS(Hong Meng File Sys‐tem)分布式存儲(chǔ),區(qū)域編碼尋址,整體無狀態(tài)、系統(tǒng)無單點(diǎn),無性能瓶頸,支持靈活彈性擴(kuò)容。根據(jù)不同的業(yè)務(wù)需求及數(shù)據(jù)特點(diǎn),HMFS 提供了對(duì)象存儲(chǔ)、文件存儲(chǔ)、塊存儲(chǔ)??捎糜谄髽I(yè)網(wǎng)盤、影像數(shù)據(jù)、互聯(lián)網(wǎng)應(yīng)用、數(shù)據(jù)備份等各種非結(jié)構(gòu)化數(shù)據(jù)存儲(chǔ)場(chǎng)景,為“智慧監(jiān)管”海量非結(jié)構(gòu)化數(shù)據(jù)提供了數(shù)據(jù)存儲(chǔ)。HMCS 可支持建立時(shí)序數(shù)據(jù)庫,支持時(shí)序數(shù)據(jù)的快速寫入、持久化、多維度的聚合查詢等基本功能。提供HMAI(Hong Meng Artificial Intelligence)大數(shù)據(jù)分析,機(jī)器深度學(xué)習(xí),實(shí)現(xiàn)預(yù)測(cè)和預(yù)警,可生成多維度報(bào)表,揭示其趨勢(shì)性、規(guī)律性、異常性。

鴻蒙音視頻監(jiān)測(cè)系統(tǒng)主要包括:基礎(chǔ)設(shè)施層、應(yīng)用支撐層、智網(wǎng)應(yīng)用層、用戶服務(wù)層和系統(tǒng)運(yùn)維管理平臺(tái),如圖1所示。

圖1 智網(wǎng)監(jiān)測(cè)系統(tǒng)架構(gòu)

基礎(chǔ)設(shè)施層:主要包括基礎(chǔ)網(wǎng)絡(luò)、云主機(jī)系統(tǒng)、服務(wù)器集群、數(shù)據(jù)庫、環(huán)境監(jiān)測(cè)、網(wǎng)絡(luò)交換設(shè)備、安全防護(hù)設(shè)備等;

應(yīng)用支撐層:主要包括網(wǎng)站建設(shè)服務(wù)、平臺(tái)資源服務(wù)、平臺(tái)計(jì)算服務(wù)、鴻蒙AI、HMCS-IOT等;

智網(wǎng)應(yīng)用層:主要包括音視頻廣告監(jiān)測(cè)、網(wǎng)絡(luò)交易監(jiān)測(cè)、食品藥品監(jiān)測(cè)、特種設(shè)備監(jiān)測(cè)、環(huán)境部署采集、部門協(xié)同辦公、公共服務(wù)等;

用戶服務(wù)層:主要包括云終端、智能控制、感知設(shè)備、手機(jī)、電腦、攝像機(jī)、監(jiān)控等。

鴻蒙音視頻監(jiān)測(cè)系統(tǒng)包括電視廣告監(jiān)測(cè)、電臺(tái)廣告監(jiān)測(cè)、互聯(lián)網(wǎng)音視頻監(jiān)測(cè)、互聯(lián)網(wǎng)文本監(jiān)測(cè)、LED音視頻監(jiān)測(cè)等,涵蓋了目前廣告?zhèn)髅叫袠I(yè)的所有音視頻主體和新業(yè)態(tài)。鴻蒙音視頻監(jiān)測(cè)系統(tǒng)運(yùn)行界面如圖2所示。

圖2 鴻蒙音視頻監(jiān)測(cè)系統(tǒng)主界面圖

系統(tǒng)根據(jù)全國(guó)基層局監(jiān)測(cè)需求,支持本地化部署數(shù)據(jù)中心和服務(wù)器,以及實(shí)施數(shù)據(jù)挖掘平臺(tái)客戶端本地區(qū)業(yè)務(wù)數(shù)據(jù)和第三方數(shù)據(jù)的全端采集和建模,是一套包括智能數(shù)據(jù)采集、業(yè)務(wù)應(yīng)用、數(shù)據(jù)接入、分布式存儲(chǔ)、數(shù)據(jù)離線計(jì)算、數(shù)據(jù)實(shí)時(shí)計(jì)算、精準(zhǔn)分析、集群資源調(diào)度、集群任務(wù)調(diào)度、全局管控管理為核心的系統(tǒng)監(jiān)管體系。HMCS 支持分布式監(jiān)控,能監(jiān)視各種參數(shù),保證服務(wù)器系統(tǒng)的安全運(yùn)營(yíng);并提供靈活的通知機(jī)制以讓系統(tǒng)管理員快速定位,解決存在的各種問題。

HMCS 虛擬化技術(shù)可有效解決傳統(tǒng)數(shù)據(jù)中心的資源浪費(fèi)、管理困難等問題,通過建立虛擬機(jī)共享物理設(shè)備資源,利用有限的物理資源運(yùn)行多個(gè)獨(dú)立操作系統(tǒng)實(shí)現(xiàn)不同功能及任務(wù)的分配。虛擬機(jī)在多臺(tái)物理主機(jī)之間的遷移可以達(dá)到負(fù)載均衡、熱點(diǎn)解除等目標(biāo)。但是在實(shí)際應(yīng)用中,在創(chuàng)建虛擬機(jī)時(shí)分配固定的資源,運(yùn)行過程中無法根據(jù)負(fù)載需求進(jìn)行動(dòng)態(tài)調(diào)控,會(huì)造成資源不足的現(xiàn)象;并且隨著集群規(guī)模的增大,人工管理的效率大大降低。因此,建立集群的實(shí)時(shí)監(jiān)控系統(tǒng),自動(dòng)監(jiān)測(cè)各節(jié)點(diǎn)和虛擬機(jī)的運(yùn)行狀態(tài),根據(jù)實(shí)際需求進(jìn)行合理的資源分配管理,保證數(shù)據(jù)中心運(yùn)行時(shí)的服務(wù)質(zhì)量,節(jié)約人力資源。

3 常規(guī)監(jiān)測(cè)和定向監(jiān)測(cè)

系統(tǒng)通過市場(chǎng)主體庫和標(biāo)準(zhǔn)庫可自動(dòng)采集數(shù)據(jù),使用數(shù)據(jù)挖掘技術(shù)工具對(duì)監(jiān)測(cè)的PC 網(wǎng)站、APP、微博、公眾號(hào)、小程序進(jìn)行定向監(jiān)測(cè);通過信號(hào)源針對(duì)網(wǎng)絡(luò)電視、音視頻網(wǎng)站、直播電視及傳統(tǒng)廣播電視、報(bào)刊雜志、DM、LED 戶外廣告等監(jiān)測(cè)目標(biāo)進(jìn)行常規(guī)監(jiān)測(cè)。通過采集各種內(nèi)容及行為數(shù)據(jù),可以充分利用數(shù)字化關(guān)聯(lián)分析、數(shù)字建模及人工智能等技術(shù),對(duì)海量數(shù)據(jù)進(jìn)行模塊化分析和政策模擬訓(xùn)練,為政策規(guī)劃和決策提供更加精確的依據(jù),為政策實(shí)施提供更為全面、可靠的實(shí)時(shí)跟蹤,為政策效果的評(píng)估提供更加科學(xué)全面的方法。

系統(tǒng)通過國(guó)家相關(guān)政府部門授權(quán),對(duì)網(wǎng)絡(luò)數(shù)據(jù)實(shí)行有效采集。具體包括:

(1)接入或?qū)胧袌?chǎng)主體數(shù)據(jù)庫

國(guó)家市場(chǎng)監(jiān)管總局授權(quán)獲取全國(guó)市場(chǎng)主體信息,能夠?qū)θ珖?guó)市場(chǎng)主體數(shù)據(jù)進(jìn)行合法合規(guī)采集。

(2)接入或分析市場(chǎng)主體信用

國(guó)家發(fā)改委國(guó)家信息中心全國(guó)市場(chǎng)主體“雙公示”數(shù)據(jù),支持定期更新。

(3)網(wǎng)站ICP備案信息

工信部授權(quán)獲取全國(guó)網(wǎng)站ICP備案數(shù)據(jù),內(nèi)容包括網(wǎng)站名稱、網(wǎng)站鏈接、經(jīng)營(yíng)主體信息等關(guān)鍵信息。

(4)挖掘市場(chǎng)主體數(shù)據(jù)

按照《征信業(yè)管理?xiàng)l例》,可以合法地采集并保存企業(yè)主體相關(guān)數(shù)據(jù),保證企業(yè)主體數(shù)據(jù)的合規(guī)性、持續(xù)性。

(5)接入第三方服務(wù)

通過知名互聯(lián)網(wǎng)公司渠道合法合規(guī)分析用戶上網(wǎng)行為,得到互聯(lián)網(wǎng)電商網(wǎng)站的主體及商品等相關(guān)數(shù)據(jù),保證數(shù)據(jù)的有效性和時(shí)效性。

數(shù)據(jù)質(zhì)量管理包含對(duì)數(shù)據(jù)的絕對(duì)質(zhì)量管理、過程質(zhì)量管理。絕對(duì)質(zhì)量即數(shù)據(jù)的真實(shí)性、完備性、自治性,是數(shù)據(jù)本身應(yīng)具有的屬性。過程質(zhì)量即使用質(zhì)量、存儲(chǔ)質(zhì)量和傳輸質(zhì)量。數(shù)據(jù)的使用質(zhì)量是指數(shù)據(jù)被正確的使用,再正確的數(shù)據(jù),如果被錯(cuò)誤的使用,就不可能得出正確的結(jié)論。數(shù)據(jù)的存貯質(zhì)量指數(shù)據(jù)被安全的存貯在適當(dāng)?shù)慕橘|(zhì)上。所謂存貯在適當(dāng)?shù)慕橘|(zhì)上是指當(dāng)需要數(shù)據(jù)的時(shí)候能及時(shí)方便的取出。數(shù)據(jù)的傳輸質(zhì)量是指數(shù)據(jù)在傳輸過程中的效率和正確性:在轉(zhuǎn)換、分析、存儲(chǔ)、傳輸、應(yīng)用流程中不存在錯(cuò)誤;數(shù)據(jù)庫應(yīng)用或要求的所有記錄、字段都存在;體現(xiàn)在整個(gè)數(shù)據(jù)庫的定義和維護(hù)方面,確保數(shù)據(jù)在使用的整個(gè)過程中是一致的;提供數(shù)據(jù)的數(shù)據(jù)源必須能夠可靠穩(wěn)定地提供數(shù)據(jù)。

4 “在線監(jiān)測(cè)”大數(shù)據(jù)分析和安全管理

系統(tǒng)運(yùn)用“在線監(jiān)測(cè)”方式可實(shí)現(xiàn)實(shí)時(shí)動(dòng)態(tài)監(jiān)測(cè),具體包括文本監(jiān)測(cè)、圖片監(jiān)測(cè)、網(wǎng)址監(jiān)測(cè)、音視頻監(jiān)測(cè)和特殊專項(xiàng)行動(dòng)監(jiān)測(cè),實(shí)現(xiàn)智能識(shí)別監(jiān)測(cè)圖片和音視頻,同時(shí)進(jìn)行智能審核并自動(dòng)生成涉嫌違法違規(guī)廣告線索,判定生成報(bào)告,進(jìn)行上報(bào)派發(fā)。

系統(tǒng)執(zhí)行各項(xiàng)監(jiān)管指令,通過協(xié)同處理,運(yùn)用定向監(jiān)測(cè)和常規(guī)監(jiān)測(cè)將數(shù)據(jù)進(jìn)行采集、識(shí)別、分析、匯總,從而形成本地監(jiān)測(cè)系統(tǒng)掃描數(shù)據(jù)庫。對(duì)采集數(shù)據(jù)進(jìn)行清洗和轉(zhuǎn)換,實(shí)現(xiàn)對(duì)各類數(shù)據(jù)信息自動(dòng)識(shí)別、去重。對(duì)所采集的線索進(jìn)行取證,記錄包含發(fā)布網(wǎng)站、市場(chǎng)主體、網(wǎng)站ICP備案信息和IP地址等信息頁面的證據(jù)鏈,對(duì)廣播電視和融媒體實(shí)現(xiàn)同一個(gè)用戶不同來源數(shù)據(jù)的打通,這些數(shù)據(jù)來源包括iOS、Android、Web、H5、小程序、業(yè)務(wù)數(shù)據(jù)、歷史數(shù)據(jù)、第三方平臺(tái)數(shù)據(jù)和線下數(shù)據(jù)等,實(shí)現(xiàn)針對(duì)客戶的全端數(shù)據(jù)采集。同時(shí),為了解決跨平臺(tái)貫通一個(gè)用戶的問題,監(jiān)測(cè)系統(tǒng)也提供對(duì)企業(yè)用戶的介紹、所作所為、產(chǎn)品質(zhì)量、廣告內(nèi)容和銷售行為等信息進(jìn)行多維度精準(zhǔn)畫像[5]的解決方案。實(shí)現(xiàn)大數(shù)據(jù)線性回歸、神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)、聚類、降維等智能計(jì)算分析常態(tài)化,如圖3所示。

圖3 音視頻監(jiān)測(cè)原理框圖

在業(yè)務(wù)處理過程中,涉及到多方協(xié)作、案件移轉(zhuǎn)等協(xié)同業(yè)務(wù)?;诖朔N情況,保障系統(tǒng)的數(shù)據(jù)安全性就顯得尤為重要。平臺(tái)具備權(quán)限認(rèn)證與隔離機(jī)制,支持讀寫鑒權(quán),充分保障用戶數(shù)據(jù)的私密性,杜絕數(shù)據(jù)泄漏。結(jié)合數(shù)據(jù)特征,提供數(shù)據(jù)分類分級(jí)模板,支持細(xì)粒度的數(shù)據(jù)劃分。結(jié)合實(shí)際需求,靈活提供細(xì)粒度訪問控制、數(shù)據(jù)加密、解密和數(shù)據(jù)脫敏方案。對(duì)平臺(tái)中的數(shù)據(jù)進(jìn)行加密和數(shù)據(jù)加密級(jí)別管理,所有數(shù)據(jù)加密存儲(chǔ)、加密傳輸,實(shí)現(xiàn)數(shù)據(jù)加密級(jí)別管理體系,根據(jù)不同密級(jí)的數(shù)據(jù)選擇不同強(qiáng)度的加密算法、數(shù)據(jù)多層加密?;诜植际綌?shù)據(jù)復(fù)制、校驗(yàn)等技術(shù)實(shí)現(xiàn)數(shù)據(jù)的完整性、可用性,通過網(wǎng)關(guān)敏感信息監(jiān)測(cè)、終端敏感信息監(jiān)測(cè)、終端數(shù)據(jù)加密實(shí)現(xiàn)數(shù)據(jù)的安全可控和防泄漏。將動(dòng)態(tài)脫敏系統(tǒng)部署在數(shù)據(jù)的共享、交換、應(yīng)用、運(yùn)維區(qū),與數(shù)據(jù)庫之間;形成自動(dòng)化的敏感數(shù)據(jù)匿名化邊界,防止隱私數(shù)據(jù)在未脫敏的情況下從數(shù)據(jù)區(qū)域流出。提供基于數(shù)據(jù)庫訪問來源IP、數(shù)據(jù)庫應(yīng)用系統(tǒng)、應(yīng)用系統(tǒng)賬戶、時(shí)間等因素的策略,對(duì)需要共享的敏感數(shù)據(jù),可根據(jù)數(shù)據(jù)的敏感級(jí)別和應(yīng)用的需要,配置動(dòng)態(tài)脫敏策略,從而實(shí)現(xiàn)外部應(yīng)用能夠安全可控地使用共享的敏感數(shù)據(jù),防敏感數(shù)據(jù)泄露。根據(jù)不同的數(shù)據(jù)特征,使用動(dòng)態(tài)脫敏算法,并支持自定義脫敏算法。

靜態(tài)脫敏直接通過屏蔽、變形、替換、隨機(jī)、格式保留加密和強(qiáng)加密算法等多種脫敏算法,針對(duì)不同數(shù)據(jù)類型進(jìn)行數(shù)據(jù)掩碼擾亂。利用數(shù)據(jù)的靜態(tài)脫敏技術(shù),有效地防止平臺(tái)內(nèi)部對(duì)隱私數(shù)據(jù)的濫用。同時(shí)也保持監(jiān)管合規(guī),滿足政府及企業(yè)的合規(guī)性要求。

動(dòng)態(tài)感知和預(yù)測(cè)業(yè)務(wù)安全風(fēng)險(xiǎn),實(shí)時(shí)監(jiān)控應(yīng)用系統(tǒng)的訪問情況、數(shù)據(jù)流向和數(shù)據(jù)處理過程;對(duì)敏感數(shù)據(jù)的訪問行為和敏感業(yè)務(wù)進(jìn)行機(jī)器學(xué)習(xí),對(duì)用戶行為進(jìn)行分析,感知和預(yù)測(cè)業(yè)務(wù)安全風(fēng)險(xiǎn)。將大數(shù)據(jù)技術(shù)用于安全,通過大數(shù)據(jù)建模進(jìn)行攻擊的預(yù)測(cè)、安全態(tài)勢(shì)分析,安全威脅的監(jiān)控和提前消除,建立APT 防護(hù)。

一個(gè)高效的數(shù)據(jù)傳輸系統(tǒng)必須保證數(shù)據(jù)在傳輸過程中的安全性和可靠性,包括信息的保密性、完整性,同時(shí)在實(shí)現(xiàn)數(shù)據(jù)傳輸中占用更少的資源。所以數(shù)據(jù)加密傳輸?shù)姆桨钢袘?yīng)包括對(duì)發(fā)送端數(shù)據(jù)的有效加密、密鑰的分配、傳輸數(shù)據(jù)的壓縮。主要從信息的壓縮、保密性等幾個(gè)方面來考慮數(shù)據(jù)加密傳輸系統(tǒng)中的加密方案。從哈夫曼編碼壓縮的過程可以看出,經(jīng)過該方法壓縮的數(shù)據(jù)必須使用壓縮形成的哈夫曼編碼樹才能解壓縮。對(duì)于不同的源文件,由于文件內(nèi)容的不同,形成的哈夫曼編碼樹不同。數(shù)據(jù)傳輸?shù)倪^程中需要同時(shí)傳輸壓縮數(shù)據(jù)包和相應(yīng)的哈夫曼編碼樹結(jié)構(gòu)。相對(duì)于壓縮數(shù)據(jù)包,哈夫曼編碼樹的節(jié)點(diǎn)數(shù)大大小于數(shù)據(jù)文件的數(shù)據(jù)量,如果只對(duì)哈夫曼編碼樹進(jìn)行加密,加密和解密需要處理的數(shù)據(jù)量將大大減少,對(duì)于不對(duì)稱加密算法無法處理大量數(shù)據(jù)的限制也可被克服。在數(shù)據(jù)傳輸中需要傳輸?shù)臄?shù)據(jù)量比壓縮之前需要傳輸?shù)臄?shù)據(jù)量大大降低,可以節(jié)省大量的網(wǎng)絡(luò)資源。在大規(guī)模的數(shù)據(jù)安全傳輸中,可以提高數(shù)據(jù)傳輸?shù)男屎桶踩?。在信息的保密性方面選擇RSA 作為哈夫曼編碼加密傳輸系統(tǒng)中傳輸信息的加密算法,采用公鑰加密來發(fā)送哈夫曼編碼。

從數(shù)據(jù)存儲(chǔ)上,數(shù)據(jù)存儲(chǔ)在政府客戶自己的機(jī)器上,從查詢接口上,可以只對(duì)內(nèi)網(wǎng)提供查詢服務(wù),并且有登錄權(quán)限認(rèn)證;從數(shù)據(jù)傳輸上,如果選擇后端傳輸數(shù)據(jù),則是內(nèi)網(wǎng)到內(nèi)網(wǎng)的傳輸,如果是前端埋點(diǎn),支持https 上報(bào)數(shù)據(jù)然后再內(nèi)網(wǎng)轉(zhuǎn)發(fā);從數(shù)據(jù)存儲(chǔ)上,提供的是單租戶的部署方案,不同客戶之間數(shù)據(jù)是完全物理隔離的;從查詢接口上,不同客戶有不同的權(quán)限賬號(hào)體系,也有不同的查詢token;從數(shù)據(jù)傳輸上,不同客戶使用不同數(shù)據(jù)上報(bào)token,并支持https上報(bào)數(shù)據(jù)。監(jiān)管服務(wù)全部采用分級(jí)授權(quán)機(jī)制。

5 鴻蒙AI開放平臺(tái)

為實(shí)現(xiàn)對(duì)廣告市場(chǎng)違法違規(guī)行為的監(jiān)測(cè)與監(jiān)管,監(jiān)測(cè)平臺(tái)需要集成各類專項(xiàng)監(jiān)管相關(guān)的人工智能識(shí)別模型,并通過平臺(tái)的統(tǒng)一支撐,對(duì)歸集的數(shù)據(jù)進(jìn)行建模與分析。鴻蒙AI人工智能開放平臺(tái)以云平臺(tái)和人工智能為基礎(chǔ)支撐,對(duì)外提供各類服務(wù),主要應(yīng)用于語音識(shí)別、人臉核驗(yàn)、面向領(lǐng)域的知識(shí)圖譜等。鴻蒙AI開放平臺(tái)架構(gòu)如圖4所示。

圖4 鴻蒙AI開放平臺(tái)架構(gòu)圖(部分)

5.1 語音識(shí)別

語音識(shí)別由聲學(xué)識(shí)別模型和語言理解模型兩部分組成,分別對(duì)應(yīng)語音到音節(jié)和音節(jié)到字的計(jì)算。

(1)聲學(xué)模型訓(xùn)練

聲學(xué)模型可以理解為是對(duì)聲音的建模,能夠把語音輸入轉(zhuǎn)換成聲學(xué)表示的輸出,準(zhǔn)確的說,是給出語音屬于某個(gè)聲學(xué)符號(hào)的概率。根據(jù)訓(xùn)練語音庫的特征參數(shù)訓(xùn)練出聲學(xué)模型參數(shù)。在識(shí)別時(shí)可以將待識(shí)別的語音的特征參數(shù)與聲學(xué)模型進(jìn)行匹配,得到識(shí)別結(jié)果。目前鴻蒙采用隱馬爾可夫模型(HMM--Hidden Markov Model)進(jìn)行聲學(xué)模型建模。

(2)語言模型訓(xùn)練

語言模型是用來計(jì)算一個(gè)句子出現(xiàn)概率的模型,它主要用于決定哪個(gè)詞序列的可能性更大,或者在出現(xiàn)了幾個(gè)詞的時(shí)候預(yù)測(cè)下一個(gè)即將出現(xiàn)的詞語。語言建模能夠有效的結(jié)合漢語語法和語義的知識(shí),描述詞之間的內(nèi)在關(guān)系,從而提高識(shí)別率,減少搜索范圍。對(duì)訓(xùn)練文本數(shù)據(jù)庫進(jìn)行語法、語義分析,經(jīng)過基于統(tǒng)計(jì)模型訓(xùn)練得到語言模型。

(3)語音解碼和搜索算法

解碼是指語音的識(shí)別過程。針對(duì)輸入的語音信號(hào),根據(jù)己經(jīng)訓(xùn)練好的HMM聲學(xué)模型、語言模型及字典建立一個(gè)識(shí)別網(wǎng)絡(luò),根據(jù)搜索算法在該網(wǎng)絡(luò)中尋找最佳的一條路徑,這個(gè)路徑就是能夠以最大概率輸出該語音信號(hào)的詞串。所以,解碼操作即指搜索算法,即在解碼端通過搜索技術(shù)尋找最優(yōu)詞串的方法。

連續(xù)語音識(shí)別中的搜索,就是尋找一個(gè)詞模型序列以描述輸入語音信號(hào),從而得到詞解碼序列。搜索所依據(jù)的是對(duì)公式中的聲學(xué)模型打分和語言模型打分。在實(shí)際使用中,往往要依據(jù)經(jīng)驗(yàn)給語言模型加上一個(gè)高權(quán)重,并設(shè)置一個(gè)長(zhǎng)詞懲罰分?jǐn)?shù)。

5.2 人臉核驗(yàn)

人臉識(shí)別算法通過深度學(xué)習(xí),利用卷積神經(jīng)網(wǎng)絡(luò)對(duì)海量人臉圖片進(jìn)行學(xué)習(xí),借助輸入圖像,提取出區(qū)分不同人臉的特征向量,以替代人工設(shè)計(jì)的特征。每張人臉在算法中都有一組對(duì)應(yīng)的特征值,這也是進(jìn)行人臉比對(duì)的依據(jù)。當(dāng)人臉比對(duì)的相似度值大于閾值時(shí),則比對(duì)通過,人臉識(shí)別的過程中有四個(gè)關(guān)鍵的步驟:

(1)人臉檢測(cè)

人臉檢測(cè)的目的是尋找圖片中人臉的位置。當(dāng)發(fā)現(xiàn)有人臉出現(xiàn)在圖片中時(shí),不管這個(gè)臉是誰,都會(huì)標(biāo)記出人臉的坐標(biāo)信息,或者將人臉切割出來??梢允褂梅较蛱荻戎狈綀D(HOG--Histogram of Oriented Gradient)來檢測(cè)人臉位置。

(2)人臉對(duì)齊

人臉對(duì)齊是將不同角度的人臉圖像對(duì)齊成同一種標(biāo)準(zhǔn)的形狀。先定位人臉上的特征點(diǎn),然后通過幾何變換(仿射、旋轉(zhuǎn)、縮放),使各個(gè)特征點(diǎn)對(duì)齊(將眼睛、嘴等部位移到相同位置)。

(3)人臉編碼

人臉圖像的像素值會(huì)被轉(zhuǎn)換成緊湊且可判別的特征向量,這也被稱為模板。理想情況下,同一個(gè)主體的所有人臉都應(yīng)該映射到相似的特征向量。

(4)人臉匹配

在人臉匹配構(gòu)建模塊中,兩個(gè)模板會(huì)進(jìn)行比較,從而得到一個(gè)相似度分?jǐn)?shù),該分?jǐn)?shù)給出了兩者屬于同一個(gè)主體的可能性。

5.3 面向監(jiān)管領(lǐng)域的知識(shí)圖譜

通過構(gòu)建面向監(jiān)管領(lǐng)域的知識(shí)圖譜,可以為人工智能模型的預(yù)測(cè)提供判別依據(jù)。一方面,模型在對(duì)數(shù)據(jù)進(jìn)行預(yù)測(cè)時(shí),可利用知識(shí)圖譜豐富其數(shù)據(jù)特征,使得模型的輸入能夠含有更豐富的領(lǐng)域相關(guān)“特征信息”,增加模型預(yù)測(cè)的準(zhǔn)確率。另一方面,在模型預(yù)測(cè)得到預(yù)測(cè)標(biāo)簽后,利用監(jiān)管領(lǐng)域知識(shí)圖譜對(duì)標(biāo)簽進(jìn)行解讀,并通過知識(shí)關(guān)聯(lián),得到更便于人直觀理解的判別依據(jù)。

基于遠(yuǎn)程監(jiān)督和無監(jiān)督生成等弱監(jiān)督學(xué)習(xí)方法,利用已有的知識(shí)關(guān)系以及少量的人工介入,平臺(tái)自動(dòng)發(fā)現(xiàn)更多知識(shí)和模式,人工快速介入審核后,進(jìn)一步迭代發(fā)現(xiàn)更多模式和知識(shí),直至準(zhǔn)確率達(dá)到一定程度,最終平臺(tái)可高精度地完成支持分詞、命名實(shí)體、關(guān)系抽取、分類、描述抽取等一系列自然語言處理工作,快速搭建知識(shí)圖譜。平臺(tái)支持多領(lǐng)域的知識(shí)學(xué)習(xí),少量人工干預(yù)就可以獲取更多可用的領(lǐng)域知識(shí)表示。

隨著違法行為的不斷發(fā)展和市場(chǎng)監(jiān)管機(jī)構(gòu)的改革,基于電商、廣告、合同等多領(lǐng)域的違法識(shí)別模型需要進(jìn)行更新融合?;诰W(wǎng)絡(luò)市場(chǎng)多個(gè)專項(xiàng)違法判別體系,以及人工智能分析系統(tǒng)所包含的基礎(chǔ)分析模型,形成模塊化的違法分類體系,同時(shí)把訓(xùn)練語料和測(cè)試語料進(jìn)行融合管理,針對(duì)新的違法類型,在平臺(tái)新增類型和相關(guān)語料,進(jìn)行二次訓(xùn)練來更新模型。

6 系統(tǒng)區(qū)塊鏈存證司法服務(wù)

“互聯(lián)網(wǎng)+司法鑒定”區(qū)塊鏈應(yīng)用提供電子數(shù)據(jù)取證、存證及出證服務(wù),有效解決目前電子數(shù)據(jù)保全過程中遇到的取證手段有限,證據(jù)效力不高,以及傳統(tǒng)出證不夠便捷等問題。依據(jù)“公證規(guī)范監(jiān)督,鑒定專家鑒證,存證科技護(hù)航”理念,實(shí)現(xiàn)電子證據(jù)采集、固定、應(yīng)用閉環(huán),形成“公證+鑒定”電子證據(jù)綜合服務(wù)。區(qū)塊鏈取證、存證、固證流程如圖5所示。

圖5 區(qū)塊鏈取證、存證、固證流程

音視頻監(jiān)測(cè)和其他監(jiān)測(cè)方式有一定的關(guān)聯(lián)度,作為獨(dú)立的系統(tǒng)具有特殊性。廣告?zhèn)髅揭粢曨l取證的過程不能采用傳統(tǒng)方法,因?yàn)槁浜蟮氖侄魏茈y讓監(jiān)管人員實(shí)現(xiàn)智慧監(jiān)管,需要具備在線證據(jù)存證。監(jiān)測(cè)管理具備監(jiān)測(cè)結(jié)果查看和監(jiān)測(cè)結(jié)果處理—取證、存證、固證、HMAI 審核和市場(chǎng)管理人員審核的功能及報(bào)告處理,對(duì)廣告內(nèi)容合法或涉嫌違法違規(guī)進(jìn)行篩選甄別;一鍵生成監(jiān)測(cè)報(bào)告并上報(bào)。圖6 給出了區(qū)塊鏈取證固證存證操作界面。

圖6 區(qū)塊鏈取證固證存證操作界面(包含示例違規(guī)詞“燃料”)

系統(tǒng)基于HMCS 系統(tǒng)多節(jié)點(diǎn)分布式的內(nèi)容掃描庫,利用文本模型(如特供專供、醫(yī)療保健、教育培訓(xùn)、意識(shí)形態(tài)、低俗色情等)、圖像模型(意識(shí)形態(tài)、化妝品、失德藝人、虛假宣傳等)和用戶自定義模型,實(shí)現(xiàn)文字、圖片、網(wǎng)址的線索查找,然后通過機(jī)器畫框和人工畫框技術(shù)實(shí)現(xiàn)線索標(biāo)注,再通過本地區(qū)塊鏈和全國(guó)司法鏈協(xié)議,實(shí)現(xiàn)文本、圖片、網(wǎng)頁等內(nèi)容的存證和固證。系統(tǒng)根據(jù)相關(guān)部門提供的詞條、法條和相關(guān)規(guī)章制度,將全網(wǎng)24 小時(shí)不間斷掃描來的數(shù)據(jù),進(jìn)行反復(fù)處理,自動(dòng)篩選出本地主體的目標(biāo)線索,由本地監(jiān)管部門相關(guān)干部進(jìn)行預(yù)審。

電子取證固證系統(tǒng)通過保全電子數(shù)據(jù)生成和存儲(chǔ)過程,將原始通話錄音、網(wǎng)頁截屏、電子郵件、網(wǎng)上聊天記錄等網(wǎng)絡(luò)數(shù)據(jù)實(shí)時(shí)加密傳至云端,接入司法鏈成為具備法律效力的證據(jù)。同時(shí),通過線索的違法判定處理、審查、派發(fā)、督辦及違法信息的統(tǒng)計(jì)查詢等相關(guān)監(jiān)管業(yè)務(wù)功能為用戶提供高效的監(jiān)測(cè)服務(wù)。線索識(shí)別準(zhǔn)確率85%以上;存證固證時(shí)間50 ms以內(nèi);存證固證文件參數(shù)MD5 值、HASH 值、文件時(shí)間戳等清楚記載,提升電子證據(jù)取證便捷度、存證技術(shù)專業(yè)度以及司法采信率。

7 專項(xiàng)行動(dòng)中的移動(dòng)執(zhí)法

系統(tǒng)通過智網(wǎng)移動(dòng)端,實(shí)現(xiàn)指揮中心與現(xiàn)場(chǎng)執(zhí)法人員連線,遠(yuǎn)程指揮現(xiàn)場(chǎng)執(zhí)法人員開展工作,采集執(zhí)法中的證據(jù),為一線人員提供支撐服務(wù)。系統(tǒng)為本地局構(gòu)建指揮中心,指揮中心架構(gòu)了云端結(jié)合,普通手機(jī)客戶端可以隨時(shí)隨地充當(dāng)執(zhí)法工具,并入監(jiān)測(cè)系統(tǒng),在日常工作中適應(yīng)巡查打卡、線索上報(bào)、云上辦公等。實(shí)現(xiàn)縱向和橫向可控的多級(jí)聯(lián)動(dòng),并提供移動(dòng)端和中心控制臺(tái)之間即時(shí)指揮,滿足移動(dòng)執(zhí)法的需要。圖7 給出了移動(dòng)執(zhí)法原理框圖,圖8 所示為指揮中心遠(yuǎn)程指揮現(xiàn)場(chǎng)執(zhí)法人員開展執(zhí)法工作。

圖7 移動(dòng)執(zhí)法原理框圖

圖8 指揮中心遠(yuǎn)程指揮現(xiàn)場(chǎng)執(zhí)法人員開展執(zhí)法工作

基于HMCS系統(tǒng)的音視頻直播技術(shù)實(shí)現(xiàn)的指揮中心場(chǎng)景,可實(shí)現(xiàn)實(shí)時(shí)-現(xiàn)場(chǎng)執(zhí)法-大屏指揮的音視頻聯(lián)動(dòng)。

8 結(jié)束語

本系統(tǒng)按照中國(guó)行政區(qū)劃,以市(區(qū)/縣)為節(jié)點(diǎn)進(jìn)行分布式部署,為每個(gè)行政區(qū)域建立獨(dú)立自主的廣播電視及融媒體等新業(yè)態(tài)監(jiān)管系統(tǒng)。系統(tǒng)將廣告公司、媒體、廣告主等相關(guān)的業(yè)務(wù)深度集成,運(yùn)用大數(shù)據(jù)技術(shù)激活數(shù)據(jù)資源池的涉企信息,線上線下相結(jié)合,全方位、全天候監(jiān)管媒體的信息發(fā)布,提升監(jiān)管效率,把監(jiān)管人員從浩瀚的互聯(lián)網(wǎng)信息尋證工作中解放出來。

本系統(tǒng)將創(chuàng)新平臺(tái)技術(shù)與本地監(jiān)管及治理模式緊密結(jié)合,實(shí)現(xiàn)權(quán)力運(yùn)行全程規(guī)范化、數(shù)字化,處處留痕跡,變?nèi)肆ΡO(jiān)督為數(shù)據(jù)監(jiān)督、變事后監(jiān)督為過程監(jiān)督、變個(gè)體監(jiān)督為整體監(jiān)督,推進(jìn)“智慧監(jiān)管”和“信用監(jiān)管”的制度措施進(jìn)一步落實(shí)。大數(shù)據(jù)化的監(jiān)測(cè)系統(tǒng)擁有巨大的應(yīng)用潛力,在宣傳、廣告、輿情監(jiān)測(cè)、特種設(shè)備、人文環(huán)境等領(lǐng)域開展動(dòng)態(tài)監(jiān)測(cè)、安全預(yù)警,可為宏觀經(jīng)濟(jì)領(lǐng)域轉(zhuǎn)變發(fā)展方式的決策規(guī)劃提供數(shù)據(jù)支持。

猜你喜歡
音視頻監(jiān)測(cè)模型
適用于BDS-3 PPP的隨機(jī)模型
自制空間站模型
特色“三四五六”返貧監(jiān)測(cè)幫扶做實(shí)做細(xì)
Microchip推出首款車載以太網(wǎng)音視頻橋接(AVB)全集成解決方案
3KB深圳市一禾音視頻科技有限公司
WIFI音視頻信號(hào)傳輸?shù)年P(guān)鍵問題探究
更接地氣的國(guó)際管理方式與音視頻實(shí)踐CEDIA廣州中級(jí)培訓(xùn)報(bào)道
模型小覽(二)
離散型隨機(jī)變量分布列的兩法則和三模型
網(wǎng)絡(luò)安全監(jiān)測(cè)數(shù)據(jù)分析——2015年12月
宜州市| 临洮县| 余姚市| 岳池县| 德庆县| 石狮市| 佛学| 渝北区| 大英县| 洞头县| 兴化市| 佛坪县| 巢湖市| 子洲县| 浮山县| 高淳县| 长沙市| 四会市| 喀什市| 盘山县| 屏南县| 长兴县| 固阳县| 藁城市| 亚东县| 渝北区| 苏州市| 阜康市| 宜阳县| 深泽县| 金川县| 梨树县| 泸溪县| 阿尔山市| 稻城县| 民和| 涪陵区| 怀安县| 阿拉善盟| 蚌埠市| 南陵县|