地面以下近千米的山東能源李樓煤業(yè)礦井工作面,只有零星幾個(gè)礦工的身影,每隔一段距離就有幾臺(tái)攝像儀和無(wú)線基站,采煤機(jī)等設(shè)備也安裝了傳感器等信息控制單元??恐@些裝置,地面調(diào)度指揮中心能清晰觀察、動(dòng)態(tài)監(jiān)管施工過(guò)程。防沖卸壓施工孔深監(jiān)管流程,從原本的3天縮短到現(xiàn)在的600秒,人工審核的工作量降低了82%。這背后,AI大模型功不可沒(méi)。
近段時(shí)間以來(lái),大模型已經(jīng)從寫(xiě)詩(shī)、作畫(huà)、編論文,開(kāi)始向能源、汽車、鋼鐵等工業(yè)領(lǐng)域挺進(jìn),在設(shè)計(jì)、研發(fā)、管理等環(huán)節(jié)嶄露頭角。由于工業(yè)領(lǐng)域本身門(mén)類多,企業(yè)間的數(shù)據(jù)壁壘明顯,尤其在核心制造環(huán)節(jié),大模型并非“萬(wàn)能”。而對(duì)于用戶而言,大模型的實(shí)際效果如何以及是否能夠支持快速迭代最為重要。有專家認(rèn)為,未來(lái)十年,工業(yè)領(lǐng)域或?qū)⒊尸F(xiàn)大模型和小模型共存的局面。
01工業(yè)大模型是怎樣煉成的?
采煤過(guò)程中,在卸壓鉆孔施工時(shí),人員操作不當(dāng),比如深度不夠、角度有誤等,都會(huì)導(dǎo)致安全隱患甚至事故。
最近,山東能源集團(tuán)、華為、云鼎科技聯(lián)合發(fā)布的全球首個(gè)能源行業(yè)商用AI大模型——盤(pán)古礦山大模型,解決了原先卸壓工程規(guī)范性驗(yàn)證需要工人下井逐個(gè)檢查的難題。引入大模型后,工人坐在辦公室就能完成這項(xiàng)工作。
工業(yè)大模型是工業(yè)企業(yè)數(shù)字化、智能化“進(jìn)化”到一定階段的產(chǎn)物。山東能源集團(tuán)啟動(dòng)數(shù)字轉(zhuǎn)型之初,日均處理數(shù)據(jù)已達(dá)到2億條。2022年年初,其在智能化煤礦基礎(chǔ)上,逐漸實(shí)現(xiàn)經(jīng)營(yíng)管理與智能生產(chǎn)分離、數(shù)據(jù)不出園區(qū)、支持規(guī)模復(fù)制、學(xué)習(xí)分析小樣本等能力,并搭建起中心訓(xùn)練、邊緣推理、邊用邊學(xué)的人工智能運(yùn)行體系和管理體系。
今年開(kāi)始,山東能源集團(tuán)瞄準(zhǔn)效率提升和安全生產(chǎn),讓一線生產(chǎn)工人深度參與大模型的應(yīng)用工作,將分散在數(shù)十座煤礦的一線經(jīng)驗(yàn)和能力集中到平臺(tái),并沉淀在大模型上,半年之內(nèi)訓(xùn)練出了覆蓋煤礦生產(chǎn)皮帶運(yùn)輸、立井提升、輔助運(yùn)輸?shù)葦?shù)十種場(chǎng)景的模型算法,助力企業(yè)提高安全生產(chǎn)效率。
在能源行業(yè)的油氣勘探環(huán)節(jié),“給地球做一次三維CT”需要處理PB級(jí)的地質(zhì)數(shù)據(jù)。如何更好理解、分析、利用海量數(shù)據(jù),實(shí)現(xiàn)全鏈路的提質(zhì)增效,成為行業(yè)性挑戰(zhàn)。
今年4月,阿里云宣布與中國(guó)石油集團(tuán)數(shù)字化轉(zhuǎn)型專業(yè)化公司昆侖數(shù)智共建油氣大模型。昆侖數(shù)智相關(guān)負(fù)責(zé)人表示,公司正在結(jié)合油氣專業(yè)數(shù)據(jù)、油氣專業(yè)知識(shí)和業(yè)務(wù)智能化需求,基于阿里基礎(chǔ)大模型開(kāi)展深入預(yù)訓(xùn)練、調(diào)優(yōu)等工作,打造油氣大模型。油氣大模型打造完成后,將在勘探開(kāi)發(fā)、煉油化工、油氣銷售等業(yè)務(wù)領(lǐng)域廣泛開(kāi)展油氣地質(zhì)工程模型化協(xié)同研究、油氣田開(kāi)發(fā)方案智能決策和優(yōu)化、油氣生產(chǎn)設(shè)備預(yù)測(cè)性維護(hù)等系列智能應(yīng)用合作研究。
由于工業(yè)大模型還處于應(yīng)用早期,如何落地,會(huì)產(chǎn)生哪些顛覆性應(yīng)用仍有待明確。大模型企業(yè)也正與行業(yè)客戶摸索合作的場(chǎng)景和切入點(diǎn)。
據(jù)百度智能云智慧工業(yè)事業(yè)部解決方案總經(jīng)理吳學(xué)義介紹,在化工行業(yè),目前的客戶主要分兩類,一類是行業(yè)研究咨詢機(jī)構(gòu),希望與百度合作做大模型的研發(fā),把行業(yè)里安全生產(chǎn)、管理等各類標(biāo)準(zhǔn),通過(guò)大模型知識(shí)固化,形成共性的服務(wù)平臺(tái);另一類希望提升工藝設(shè)計(jì)。例如一家頭部化工企業(yè),生產(chǎn)過(guò)程中需要多輪質(zhì)檢來(lái)保障產(chǎn)品質(zhì)量。他們希望結(jié)合此前的數(shù)據(jù)積累,和大模型廠商共同打造一個(gè)質(zhì)檢降頻的大模型,降低成本,提升生產(chǎn)效率。
02在設(shè)計(jì)研發(fā)管理環(huán)節(jié)率先落地
某工業(yè)企業(yè)的負(fù)責(zé)人在用大模型設(shè)計(jì)散熱葉片時(shí)表示。“研發(fā)人員認(rèn)為,弧形葉片的散熱效果最好,但大模型最終給出的設(shè)計(jì)方案不是弧形,而是不規(guī)則形。試驗(yàn)效果顯示,這種不規(guī)則葉片散熱效果更好,打破了所有研發(fā)人員的固化認(rèn)知?!?/p>
“大模型因具有強(qiáng)大的表征、泛化和自適應(yīng)能力,在處理復(fù)雜的自然語(yǔ)言、圖像、時(shí)間序列等任務(wù)上表現(xiàn)優(yōu)異。在經(jīng)過(guò)充分訓(xùn)練后,無(wú)需針對(duì)特定問(wèn)題進(jìn)行定制化,能夠自動(dòng)學(xué)習(xí)新的模式和規(guī)律,具備—定自己的認(rèn)知和推理能力,且能適應(yīng)不斷變化的數(shù)據(jù)和環(huán)境。”用友智能制造事業(yè)部高級(jí)技術(shù)架構(gòu)師葉琳表示。
用友通過(guò)對(duì)海量廢鋼圖片訓(xùn)練,構(gòu)建了用友BIP(商業(yè)創(chuàng)新平臺(tái))智能制造廢鋼判級(jí)大模型,在鞍鋼等20余家鋼鐵企業(yè)上線應(yīng)用,廢鋼判級(jí)準(zhǔn)確率達(dá)95%以上。值得一提的是,由于該大模型具有很好的泛化能力和自適應(yīng)能力,面對(duì)企業(yè)的不同需求,技術(shù)人員幾乎不用對(duì)原本模型做過(guò)多調(diào)整,而其他小模型卻不具備這些特點(diǎn)。
葉琳提及的這類大模型,屬于視覺(jué)類大模型。依托視覺(jué)識(shí)別能力,可以廣泛用于圖像識(shí)別或缺陷檢測(cè)。
另一類工業(yè)大模型便是自然語(yǔ)言處理類大模型,能夠基于內(nèi)容生成和自然語(yǔ)言交互能力,帶來(lái)產(chǎn)品研發(fā)工具和研發(fā)手段創(chuàng)新,成為一些企業(yè)級(jí)應(yīng)用的AI助手,提高工作效率。
隨著發(fā)展,工業(yè)領(lǐng)域也逐步涌現(xiàn)出了多模態(tài)大模型。日前,華為推出了盤(pán)古大模型3.0,包含了基礎(chǔ)大模型、行業(yè)大模型、場(chǎng)景大模型三層架構(gòu)、多個(gè)模型,采用了“完全的分層解耦設(shè)計(jì)”。華為常務(wù)董事、華為云CEO張平安解釋,為了更好地適配行業(yè)不同場(chǎng)景,必須要做到完全解耦。有些企業(yè)只需要圖像分析,不需要文案生成,基礎(chǔ)大模型和能力集解耦后,他們就可以按需調(diào)用;甚至還有數(shù)據(jù)解耦,模型升級(jí)時(shí),數(shù)據(jù)就可以復(fù)用;這個(gè)解耦架構(gòu),也實(shí)現(xiàn)了模型的并行迭代。
從上述已經(jīng)落地或正在開(kāi)發(fā)中的大模型趨勢(shì)來(lái)看,工業(yè)大模型率先落地的場(chǎng)景基本集中在企業(yè)的設(shè)計(jì)、研發(fā)、管理等環(huán)節(jié),提升人機(jī)交互性能及業(yè)務(wù)系統(tǒng)之間的互通效率。
比如,在企業(yè)跨系統(tǒng)數(shù)據(jù)分析方面,過(guò)去可能需要在多個(gè)系統(tǒng)中查詢數(shù)據(jù),再動(dòng)用一些工具進(jìn)行數(shù)據(jù)分析,生成式AI則可以通過(guò)一句話,自動(dòng)完成以上動(dòng)作并給出分析結(jié)果;在設(shè)計(jì)草圖生成方面,設(shè)計(jì)師輸入一些關(guān)鍵參數(shù),AI自動(dòng)生成相應(yīng)的產(chǎn)品設(shè)計(jì)草圖,供設(shè)計(jì)師進(jìn)一步修改或確認(rèn);在故障預(yù)測(cè)與維護(hù)方面,通過(guò)對(duì)大量傳感器時(shí)序數(shù)據(jù)的分析,大模型可以預(yù)測(cè)機(jī)器設(shè)備的故障風(fēng)險(xiǎn),從而實(shí)現(xiàn)智能化的設(shè)備維護(hù),降低停機(jī)時(shí)間和維修成本。
大模型并非“萬(wàn)能”
ChatGPT類生成式AI在實(shí)際使用過(guò)程中經(jīng)常會(huì)出現(xiàn)一些“驚喜”。但是工業(yè)生產(chǎn)不需要“驚喜”,最害怕“意外”,一個(gè)小小的故障或停機(jī)就可能帶來(lái)成百上千萬(wàn)元的損失。
要想讓大模型生成可靠、可信的結(jié)果,需要一系列嚴(yán)苛的前提。
數(shù)據(jù)是大模型的營(yíng)養(yǎng),大模型靠不斷地“吃數(shù)據(jù)”“消化數(shù)據(jù)”維持良好的性能。相比許多領(lǐng)域大模型,蛋白質(zhì)序列大模型發(fā)展較為迅速,已經(jīng)能夠解決蛋白類新藥研發(fā)過(guò)程中普遍存在的耗時(shí)長(zhǎng)、耗費(fèi)高等難題。之江實(shí)驗(yàn)室智能計(jì)算軟件研究中心主任潘愛(ài)民表示,這是因?yàn)榈鞍踪|(zhì)基因序列的數(shù)據(jù)非常豐富,往往有上億規(guī)模的數(shù)據(jù)量,為大模型的訓(xùn)練、使用和迭代帶來(lái)極大的幫助。
數(shù)據(jù)還要足夠標(biāo)準(zhǔn)化和規(guī)范化。以開(kāi)發(fā)礦山大模型為例,山東能源集團(tuán)啟動(dòng)數(shù)字轉(zhuǎn)型之初,日均處理數(shù)據(jù)已達(dá)到2億條,隨著智能化建設(shè)深入,開(kāi)始以標(biāo)準(zhǔn)的信息架構(gòu)和數(shù)據(jù)規(guī)范,全面打通OT(運(yùn)營(yíng)技術(shù))、IT(信息技術(shù))、CT(通信技術(shù))三大系統(tǒng)數(shù)據(jù),逐漸形成海量多源數(shù)據(jù)統(tǒng)一接入、匯聚和處理,為推動(dòng)大模型持續(xù)優(yōu)化升級(jí)帶來(lái)便利。
要想不斷提升大模型的專業(yè)水平,GPU/TPU加速器、基礎(chǔ)軟件、外掛插件、搜索引擎、相關(guān)數(shù)據(jù)庫(kù)等一系列IT軟硬件設(shè)施都要足夠完備和先進(jìn),這也將帶來(lái)巨大的使用成本。同時(shí),訓(xùn)練和微調(diào)行業(yè)模型所需的高質(zhì)量的行業(yè)數(shù)據(jù)的獲取和整理,也需要消耗大量的人力和時(shí)間。
大模型并不是“萬(wàn)金油”。“適合的場(chǎng)景可以基于大模型來(lái)提升競(jìng)爭(zhēng)力,但目前工業(yè)場(chǎng)景中沒(méi)有哪個(gè)場(chǎng)景和應(yīng)用是‘非大模型不可’的,特別是大模型對(duì)生產(chǎn)排程等核心制造環(huán)節(jié)的用處還不是很大?!迸藧?ài)民說(shuō)。工業(yè)領(lǐng)域本身門(mén)類多,各個(gè)企業(yè)間的數(shù)據(jù)壁壘非常明顯,尤其在某些核心制造環(huán)節(jié),難以收集到足夠的標(biāo)注數(shù)據(jù)來(lái)訓(xùn)練這些模型,這類環(huán)節(jié)往往不適用大模型。
“工業(yè)大模型并不能替代工業(yè)系統(tǒng),短時(shí)間內(nèi)也無(wú)法成為企業(yè)智能化的‘底座’?!睒I(yè)內(nèi)專家表示,從其底層技術(shù)看,大模型對(duì)各種AI模型的綜合應(yīng)用更加接近人類大腦的工作機(jī)理,尤其擅長(zhǎng)自然語(yǔ)言和文本處理等領(lǐng)域的融合,但它依舊與工業(yè)系統(tǒng)的智能具有不同的機(jī)理構(gòu)成。
04大小模型要互補(bǔ)發(fā)展
目前來(lái)看,足夠智能、能夠覆蓋所有場(chǎng)景的大模型時(shí)代還遠(yuǎn)遠(yuǎn)沒(méi)有到來(lái)。業(yè)內(nèi)專家一致認(rèn)為,包括工業(yè)行業(yè)在內(nèi)的產(chǎn)業(yè)智能化發(fā)展過(guò)程中,未來(lái)十年將是大模型和小模型共存的局面。
“一場(chǎng)景一模型”的小模型方案有定制化能力,場(chǎng)景貼合度好,解決某一具體問(wèn)題尤其特異性問(wèn)題的效果較好。比如,在精準(zhǔn)科學(xué)計(jì)算和符號(hào)推理方面,大模型并不比小模型可靠。目前,小模型已經(jīng)幫助天文、新材料、生物醫(yī)藥等諸多領(lǐng)域攻克了不少“卡脖子”難題。
然而,小模型在應(yīng)用于新任務(wù)或領(lǐng)域時(shí),可能需要進(jìn)行重新設(shè)計(jì)和訓(xùn)練,不如大模型具備較強(qiáng)的泛化性。葉琳表示,用友原本有30多個(gè)廢鋼智能判級(jí)小模型,雖然每個(gè)小模型準(zhǔn)確率比較高,但當(dāng)新的客戶帶著新的需求過(guò)來(lái),不少小模型都需要重新訓(xùn)練、標(biāo)注、迭代,否則準(zhǔn)確率會(huì)降低。
實(shí)際上,在工業(yè)制造智能化應(yīng)用中,大模型和小模型兩者不是相互對(duì)立的,兩者可以協(xié)作——廠商可以根據(jù)任務(wù)的復(fù)雜程度、數(shù)據(jù)量、實(shí)時(shí)性需求和計(jì)算資源等因素來(lái)選擇合適的大模型或小模型。
某些情況下,大模型和小模型還可以相互轉(zhuǎn)換?!按竽P突趯?duì)通用知識(shí)的理解變得更廣泛,能夠補(bǔ)足小模型的學(xué)習(xí)能力、交互能力和生成能力,可以通過(guò)壓縮或者知識(shí)蒸餾,部署到小模型環(huán)境中去替代一部分能力。也可以采用模型壓縮技術(shù),將大模型壓縮成小模型,以平衡性能和資源消耗之間的權(quán)衡。”北京九章云極科技有限公司副總裁于建崗表示。
“大和小是一個(gè)相對(duì)的變化?!庇诮◢徴f(shuō),當(dāng)前大模型的參數(shù)標(biāo)準(zhǔn)并不統(tǒng)一,相對(duì)于參數(shù)級(jí),模型的效果且是否能夠支持快速迭代對(duì)于用戶實(shí)際應(yīng)用來(lái)說(shuō)更為重要。用戶能夠在一個(gè)白盒大模型基礎(chǔ)上快速地、低成本地微調(diào)和迭代出客制化的小模型,才能高效地實(shí)現(xiàn)豐富場(chǎng)景的大模型應(yīng)用。
目前,很多場(chǎng)景的應(yīng)用已有初步效果,但是否能夠形成投入產(chǎn)出比清晰的可持續(xù)的商業(yè)模式,從而實(shí)現(xiàn)規(guī)模化的復(fù)制和推廣,則還有待觀察?;谶@層考慮,有觀點(diǎn)認(rèn)為,大模型更適合專業(yè)供應(yīng)商和部分頭部企業(yè)開(kāi)展應(yīng)用,更多企業(yè)更適合優(yōu)先從特定場(chǎng)景角度,開(kāi)展“領(lǐng)域大模型+專用小模型”的應(yīng)用試點(diǎn)。
摘自微信公眾號(hào)“中國(guó)電子報(bào)”