国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

今日頭條如何用算法打擊“標(biāo)題黨”

2017-06-01 11:35:11劉志毅
傳媒 2017年8期
關(guān)鍵詞:標(biāo)題黨頭條機(jī)器

文/劉志毅

今日頭條如何用算法打擊“標(biāo)題黨”

文/劉志毅

今日頭條建立了檢測(cè)“標(biāo)題黨”的規(guī)則模型,警示頭條號(hào)作者的“標(biāo)題黨”行為。當(dāng)頭條號(hào)作者預(yù)發(fā)布文章的時(shí)候,如果標(biāo)題中出現(xiàn)了“驚呆”“震驚”等內(nèi)容,會(huì)收到一個(gè)飄黃的窗口,提示其內(nèi)容涉及標(biāo)題夸張,建議修改,如果作者繼續(xù)強(qiáng)行發(fā)布的話將會(huì)被限制推薦量。

今日頭條并不是傳統(tǒng)意義上的媒體,而是一家有媒體屬性的科技公司,一個(gè)內(nèi)容創(chuàng)作與分發(fā)的平臺(tái),其愿景是“成為最懂你的信息平臺(tái),連接人與信息,促進(jìn)創(chuàng)作與交流”。

調(diào)配分發(fā)資源,打擊標(biāo)題亂象

今日頭條雖然提供資訊信息,但是其內(nèi)部并沒(méi)有編輯與記者,平臺(tái)上90%的內(nèi)容來(lái)源于頭條號(hào),截至2017年3月底,已有超過(guò)60萬(wàn)個(gè)人或組織開(kāi)設(shè)頭條號(hào)。這就決定了今日頭條在打擊“標(biāo)題黨”方面,要做的更多的是從生產(chǎn)層面和分發(fā)層面來(lái)進(jìn)行控制。

具體來(lái)說(shuō),今日頭條所做的事情就是在分發(fā)的過(guò)程中,減少給“標(biāo)題黨”的分發(fā)資源,而提升那些優(yōu)秀內(nèi)容得到分發(fā)資源的機(jī)率。這是提高效率的一種做法,也促使今日頭條能更好地打擊“標(biāo)題黨”,貫徹主流價(jià)值觀,服務(wù)好用戶。

基于文本挖掘的機(jī)器“把關(guān)人”

很多“標(biāo)題黨”常用的內(nèi)容元素其實(shí)都是可以在文本層面進(jìn)行總結(jié)的,交由機(jī)器處理的效率會(huì)更高。“正則表達(dá)式”就是定義一系列與“標(biāo)題黨”相關(guān)的詞匯來(lái)維護(hù)一些規(guī)則,進(jìn)而使用這些規(guī)則來(lái)檢測(cè)每一篇文章。今日頭條實(shí)際有數(shù)百人的審核隊(duì)伍,建立起了一套比較完善的規(guī)則,并利用機(jī)器算法對(duì)每天幾十萬(wàn)篇的新進(jìn)文章進(jìn)行篩選。由此,得到這些文章評(píng)級(jí)的高低,并對(duì)文章的標(biāo)題和內(nèi)容進(jìn)行判斷。

今日頭條建立了檢測(cè)“標(biāo)題黨”的規(guī)則模型,警示頭條號(hào)作者的“標(biāo)題黨”行為。當(dāng)頭條號(hào)作者預(yù)發(fā)布文章的時(shí)候,如果標(biāo)題中出現(xiàn)了“驚呆”“震驚”等內(nèi)容,會(huì)收到一個(gè)飄黃的窗口,提示其內(nèi)容涉及標(biāo)題夸張,建議修改,如果作者繼續(xù)強(qiáng)行發(fā)布的話將會(huì)被限制推薦量。

Facebook在面對(duì)“標(biāo)題黨”和假新聞時(shí),依賴(lài)于用戶舉報(bào)。今日頭條建立“標(biāo)題黨”的模型數(shù)據(jù)與國(guó)際上通行的做法類(lèi)似,讓用戶對(duì)文章進(jìn)行評(píng)論以及點(diǎn)擊“不喜歡”按鈕來(lái)表達(dá)個(gè)體意見(jiàn),通過(guò)一些按鈕來(lái)收集用戶行為,再對(duì)文章的標(biāo)題和內(nèi)容質(zhì)量進(jìn)行判斷,從而把內(nèi)容質(zhì)量不高或是存在“標(biāo)題黨”行為的推送限制在很小的范圍內(nèi)。

另外,機(jī)器也會(huì)自動(dòng)形成對(duì)“標(biāo)題黨”文本的識(shí)別,給不同的特征以不同權(quán)重的得分。在運(yùn)行的過(guò)程中,今日頭條會(huì)將標(biāo)題里面單個(gè)的詞進(jìn)行拆分,并形成權(quán)重分?jǐn)?shù),同時(shí)也對(duì)詞組進(jìn)行拆分,由機(jī)器自動(dòng)打分,分?jǐn)?shù)一旦超過(guò)閾值就被認(rèn)為是“標(biāo)題黨”,頭條號(hào)作者會(huì)收到警示。

面對(duì)頭條號(hào)作者忽略警示強(qiáng)行發(fā)布的行為,頭條號(hào)建立了一套非常嚴(yán)苛的處罰規(guī)則。如果是非法來(lái)源,違反相關(guān)法規(guī)扣50分。另外,被舉報(bào)抄襲、“標(biāo)題黨”、含有廣告信息、標(biāo)題與正文不符,甚至文章標(biāo)題中含有錯(cuò)別字的文章,都被認(rèn)為對(duì)用戶造成了不利影響,作者將會(huì)受到相應(yīng)的扣分處罰。

千萬(wàn)不能小看這些扣分,在頭條號(hào)中,扣10分意味著發(fā)文和微信的RSS接入禁止一天;如果被扣至0分,整個(gè)賬號(hào)就無(wú)法恢復(fù)。由于頭條號(hào)的賬號(hào)與每個(gè)人的身份證綁定,個(gè)人賬號(hào)的凍結(jié)意味著該作者失去了在今日頭條平臺(tái)上的話語(yǔ)權(quán)。如果被扣除50分,還將被取締廣告和自營(yíng)廣告的權(quán)限,頭條號(hào)的商業(yè)價(jià)值將受到限制。同時(shí),在頭條號(hào)平臺(tái)上打擊力度非常之重,公告欄上會(huì)定期發(fā)布整治各類(lèi)標(biāo)題的公告,在偽科學(xué)、股評(píng)、兩性、減肥這些“標(biāo)題黨”泛濫的重災(zāi)區(qū),進(jìn)行專(zhuān)項(xiàng)治理。

數(shù)據(jù)方面,今日頭條平均每天有超過(guò)12000篇文章被提示修改,日均僅有1027篇文章還繼續(xù)強(qiáng)行提交,且強(qiáng)行提交之后會(huì)被進(jìn)行很大程度的降權(quán)推薦,其中,476篇0閱讀,762篇閱讀量小于等于100。從2016年的7月至今,客戶端每周反饋量為每百萬(wàn)DAU(日活躍用戶數(shù)量)從0.9降至0.3,即平均每100萬(wàn)活躍用戶里,反映內(nèi)容存在“標(biāo)題黨”的情況的人從原來(lái)的0.9人降到了0.3人。

以數(shù)據(jù)反哺內(nèi)容創(chuàng)作者

頭條號(hào)的標(biāo)題非常難取,一方面需要突出新聞點(diǎn),而另一方面,要考慮機(jī)器分發(fā)。機(jī)器和人工分發(fā)最大的不同在于:傳統(tǒng)媒體的編輯具有文本經(jīng)驗(yàn),機(jī)器則不然。人與機(jī)器溝通過(guò)程中需要做很多工作,如利用什么關(guān)鍵詞來(lái)描述某事件能讓文章更好地被機(jī)器識(shí)別,從而到達(dá)更精準(zhǔn)的興趣人群,發(fā)揮內(nèi)容的最大價(jià)值,這是除了取好標(biāo)題之外更迫切的需求,所以,標(biāo)題留給創(chuàng)作者的空間很小,難度很大。

為了更好地實(shí)現(xiàn)用戶價(jià)值,提升用戶體驗(yàn),今日頭條推出了新的服務(wù)于創(chuàng)作者的產(chǎn)品——媒體實(shí)驗(yàn)室。它將數(shù)據(jù)結(jié)果直接呈現(xiàn)給內(nèi)容創(chuàng)作者,提供適合在平臺(tái)上表達(dá)、分發(fā),并能夠取得優(yōu)良傳播效果的詞匯,將這些詞匯制成了可視化的分析圖表,給作者提供一些寫(xiě)作角度的參考。

目前,媒體實(shí)驗(yàn)室已經(jīng)服務(wù)于400多家媒體機(jī)構(gòu),包括7000多位內(nèi)容創(chuàng)作者用戶。比如,在美國(guó)大選期間對(duì)熱度進(jìn)行監(jiān)控,通過(guò)定制關(guān)鍵詞,能夠?qū)?zhuān)題進(jìn)行相關(guān)的用戶畫(huà)像分析。

除此之外,內(nèi)容創(chuàng)作者還能對(duì)熱詞進(jìn)行關(guān)聯(lián)分析,通過(guò)分析用戶的互動(dòng)行為來(lái)挖掘創(chuàng)作的角度。作為一個(gè)創(chuàng)作者的服務(wù)平臺(tái),媒體實(shí)驗(yàn)室還會(huì)把今日頭條發(fā)布的數(shù)據(jù)報(bào)告第一時(shí)間進(jìn)行發(fā)布,并為創(chuàng)作者提供原版下載。

目前,媒體實(shí)驗(yàn)室已與一些媒體建立起了內(nèi)容合作關(guān)系。今日頭條將媒體內(nèi)容通過(guò)算法模型分發(fā)給不同興趣愛(ài)好的用戶,與此同時(shí),媒體實(shí)驗(yàn)室將用戶閱讀互動(dòng)產(chǎn)生的數(shù)據(jù)收集并反饋給媒體,形成一種反哺的關(guān)系,就像打車(chē)軟件之于交通部門(mén),外賣(mài)軟件之于食藥部門(mén),媒體實(shí)驗(yàn)室也可以把內(nèi)容分發(fā)的好壞、優(yōu)劣、內(nèi)容關(guān)鍵詞的關(guān)系等,反哺給媒體機(jī)構(gòu)甚至優(yōu)秀的自媒體作者,讓他們最高效地進(jìn)行創(chuàng)作,在不同創(chuàng)作環(huán)境和垂直領(lǐng)域內(nèi)發(fā)揮自己創(chuàng)造力的最大價(jià)值。

作者系今日頭條算數(shù)中心總監(jiān)

猜你喜歡
標(biāo)題黨頭條機(jī)器
微頭條
小康(2022年20期)2022-07-20 02:34:22
機(jī)器狗
機(jī)器狗
《頭條》(四首之三)
未來(lái)機(jī)器城
電影(2018年8期)2018-09-21 08:00:06
頭條
海峽姐妹(2017年8期)2017-09-08 12:16:45
互聯(lián)網(wǎng)新媒體中“標(biāo)題黨”現(xiàn)象探析
東方教育(2016年21期)2017-01-17 18:52:48
避免情緒化勿作“標(biāo)題黨”
聲屏世界(2016年10期)2016-12-10 21:20:45
杜絕網(wǎng)絡(luò)“標(biāo)題黨”向傳統(tǒng)媒體滲透
今傳媒(2016年6期)2016-07-02 00:01:45
頭條
霸州市| 株洲市| 瑞金市| 雷波县| 甘泉县| 潜江市| 龙口市| 阳原县| 赤峰市| 循化| 凭祥市| 神农架林区| 资中县| 磴口县| 永城市| 手机| 温州市| 新余市| 民权县| 博白县| 丰原市| 哈尔滨市| 保康县| 昭平县| 贺州市| 陇川县| 宁南县| 武冈市| 绥芬河市| 太保市| 韶关市| 吉水县| 巴彦淖尔市| 准格尔旗| 错那县| 金溪县| 弥勒县| 肃宁县| 陵川县| 安义县| 腾冲县|