本刊記者/蔡雨彤
人工智能正在“見縫插針”地開拓邊界,一次又一次滿足我們對AI無限可能的想象,帶給我們越來越多的驚喜。
4月1日,由騰訊云多媒體實驗室領(lǐng)先算法團隊修復,騰訊音樂娛樂集團攜手環(huán)球音樂旗下廠牌寶麗金,并聯(lián)合騰訊云、微信視頻號、騰訊視頻等多個團隊聯(lián)合呈現(xiàn)的“張國榮2000年《熱·情》演唱會超清修復版”全球首播,數(shù)千萬名粉絲共同見證了這場由AI技術(shù)加持風華絕代的演唱會。
一場演藝巔峰重現(xiàn)的背后,AI修復技術(shù)再一次用超越時間的魔力驚艷我們,AI高清修復市場也再次引起關(guān)注。
《熱·情》演唱會背后有怎樣的修復技術(shù)?AI修復技術(shù)還能做什么?
視頻修復并不是新鮮的事物,人們對經(jīng)典老片、老電影經(jīng)過AI技術(shù)的修復,重新搬上了銀幕早已習以為常。但AI技術(shù)修復視頻影像資料此前大都集中在影視領(lǐng)域,對于演唱會這類視頻資料的修復較少見。雖然都是修復視頻,但演唱會和影視類的視頻修復還是有著較大的區(qū)別。
影視劇視頻修復解決的是老舊影視資料中,畫面雪花、劃痕等造成視頻素材清晰度、畫質(zhì)、色彩等導致的感官損失度感受。相對演唱會而言場景比較固定,鏡頭的運作以及整個畫面比較穩(wěn)定,從頭到尾的藝術(shù)表達形式、整體的色彩風格比較統(tǒng)一。
據(jù)騰訊多媒體實驗室方面介紹,此次演唱會的修復工作用到的是實驗室旗下的“超清沉浸感修復引擎”,這是面向老片修復場景的技術(shù)解決方案。整個演唱會的修復包括智能分析、畫質(zhì)修復、畫質(zhì)增強、智能編碼四個步驟。通過多種AI評估算法對視頻內(nèi)容進行幀級別、場景級別和視頻級別等多維度的智能分析。利用多種人工智能修復算法,針對老片場景下進行訓練和優(yōu)化,修復老片中常見的豎線、雪花點、噪聲、壓縮失真、抖動等問題。
其實不僅僅是“娛樂圈”視AI修復為香餑餑,“考古界”更是對AI修復技術(shù)“愛不釋手”。
在歷史領(lǐng)域,研究者經(jīng)常會面對一些殘缺的古籍。這些古籍記載了遠古的文明,要了解歷史就必須要解開這些謎團。但長年的侵蝕和破壞造成了不少文字的缺損。依據(jù)剩余部分和其余相似文字推理出殘缺部分的內(nèi)容至今仍是個難題。
為克服當下考古的限制,DeepMind與威尼斯大學、牛津大學等多家機構(gòu)合作,共同推出了名為Ithaca的AI,這是第一個可以恢復受損銘文缺失文本、識別其原始位置并確定其書寫時間的深度神經(jīng)網(wǎng)絡(luò)AI。
Ithaca架構(gòu)中的注意力機制能夠通過串聯(lián)輸入的單個字符、完整單詞的表征與順序位置來了解輸入文本的每一部分的位置,最終權(quán)衡不同的輸入對模型決策過程的影響。
在以往,歷史學家單獨破譯某塊古希臘石碑的準確率只有25%,但在實際使用這一方法后準確率一舉提升了近乎2倍,達到了72%。
Ithaca不僅能修復文字,在地理歸屬的任務(wù)上也有71%的準確率,還能將古文字的書寫日期精確到30年以內(nèi)。
除了影視和歷史領(lǐng)域,制造業(yè)、醫(yī)療、教育、無人駕駛、智能家居等這些常見領(lǐng)域,人工智能也正在“見縫插針”地開拓邊界,一次又一次滿足我們對人工智能無限可能的想象,帶給我們越來越多的驚喜。