《經(jīng)濟(jì)參考報(bào)》記者近日調(diào)研獲悉,AI(人工智能)大模型相當(dāng)于“超級(jí)大腦”,,正成為人工智能“新高地”,。AI大模型有望實(shí)現(xiàn)人工智能從感知到認(rèn)知的躍遷,,重新定義人工智能產(chǎn)業(yè)模式和產(chǎn)業(yè)標(biāo)準(zhǔn),,給部分產(chǎn)業(yè)帶來重大變革。我國有較大的AI大模型應(yīng)用市場(chǎng),但發(fā)展過程中面臨部分技術(shù)薄弱,、人才稀缺,、成本高昂等多重挑戰(zhàn),亟須對(duì)相關(guān)技術(shù)研發(fā)和產(chǎn)業(yè)布局加以引導(dǎo)和支持,。
趙乃育 繪
“學(xué)富五車”的“超級(jí)大腦”
——“不開心的話可以聽點(diǎn)開心的歌,,看看喜劇,也可以去運(yùn)動(dòng),,或者好好休息一下,。”
——“心情不好是一種很正常的情緒,,所以不用太過自責(zé),。”
針對(duì)“今天心情不好應(yīng)該怎么辦”這一問題,,一個(gè)人工智能平臺(tái)以不同的“人設(shè)”,,給出了不同的回答。通過網(wǎng)址鏈接進(jìn)入該平臺(tái),,在“人設(shè)問答”區(qū)隨機(jī)輸入問題,,機(jī)器可支持和扮演不同“人設(shè)”,,對(duì)問題給出多角度答案,。該平臺(tái)正是基于AI大模型打造而成。
創(chuàng)新工場(chǎng)首席科學(xué)家,、北京瀾舟科技創(chuàng)始人周明介紹,,AI大模型也稱人工智能預(yù)訓(xùn)練模型,將海量數(shù)據(jù)導(dǎo)入具有幾億量級(jí)甚至十萬億量級(jí)參數(shù)的模型中,,機(jī)器通過做類似“完形填空”等任務(wù),,深度學(xué)習(xí)數(shù)據(jù)中蘊(yùn)含的特征、結(jié)構(gòu),,最終被訓(xùn)練成具有邏輯推理和分析能力的人工智能,。
通俗地說,AI大模型相當(dāng)于做了無數(shù)套關(guān)于各領(lǐng)域知識(shí)練習(xí)題,、模擬題的“超級(jí)大腦”,,深諳各領(lǐng)域知識(shí)內(nèi)在邏輯和解題思路,既能理解人類世界的知識(shí)體系,,也可能產(chǎn)出新的知識(shí),。
2018年起,人工智能進(jìn)入“大模型時(shí)代”,,由重復(fù)開發(fā),、手工作坊式人工智能,即“一千個(gè)應(yīng)用場(chǎng)景就有一千個(gè)小模型”的零散、低效局面,,走向工業(yè)化,、集成化智能的全新路徑,以一個(gè)大模型“走天下”,,為通用人工智能帶來曙光,。比如,為生產(chǎn)智能音響,,各個(gè)品牌競(jìng)相開發(fā)各自的AI小模型,,未來各品牌只需在同一個(gè)AI大模型基礎(chǔ)上開發(fā)即可。
“以前是‘碎片化’的人工智能,,針對(duì)不同的應(yīng)用場(chǎng)景要開發(fā)不同的模型,。作坊式開發(fā)對(duì)資源、成本造成較大消耗,,且效率低下,。未來在各垂直領(lǐng)域落地時(shí),只需基于一個(gè)大模型,,對(duì)其參數(shù)進(jìn)行微調(diào)即可,,這樣就打造出了具有通用性質(zhì)的人工智能?!比A為云人工智能領(lǐng)域首席科學(xué)家,、國際歐亞科學(xué)院院士田奇介紹,AI大模型將重新定義人工智能產(chǎn)業(yè)模式,、產(chǎn)業(yè)標(biāo)準(zhǔn),,甚至產(chǎn)業(yè)倫理。
受訪者舉例介紹,,以前的小模型就像“偏科的機(jī)器”,,只學(xué)習(xí)針對(duì)特定應(yīng)用場(chǎng)景的有限數(shù)據(jù),“舉一反三”能力不足,,一些智能產(chǎn)品被用戶調(diào)侃為“人工智障”的情況時(shí)有發(fā)生,。而AI大模型則學(xué)習(xí)了各行各業(yè)各類數(shù)據(jù),成為具備良好的知識(shí)遷移能力的“通才”,,適用領(lǐng)域更廣,,產(chǎn)出內(nèi)容質(zhì)量更高,更加智能,。
同時(shí),,周明指出,大模型的發(fā)展并非一味追求參數(shù)量大,,而是聚焦模型的高性能,,“在讓大模型學(xué)習(xí)和掌握更大量數(shù)據(jù)的同時(shí),盡可能讓大模型參數(shù)相對(duì)輕量化,在‘減負(fù)’的同時(shí)提高能效,?!?/p>
可分飾多角 應(yīng)用場(chǎng)景廣泛
自動(dòng)問診、產(chǎn)品營銷,、小說續(xù)寫……由于懂得人類語言,,且具備細(xì)分行業(yè)專業(yè)知識(shí),一個(gè)AI大模型可分飾多角,,它做得了醫(yī)生,,當(dāng)?shù)昧俗骷遥瑒偃蔚昧饲楦胁┲?,從事得了電商客服…?/p>
AI大模型行業(yè)適用范圍廣,,在醫(yī)療、金融,、零售,、氣象、新聞傳播,、文學(xué)藝術(shù)等領(lǐng)域具有廣泛應(yīng)用場(chǎng)景,。周明介紹,在大模型中輸入關(guān)鍵詞,、主題,、文本風(fēng)格等控制屬性后,即可生成滿足約束條件的文本內(nèi)容,,可用于產(chǎn)品營銷文案寫作,、電商智能客服等,。在金融等領(lǐng)域,,大模型通過抓取行業(yè)數(shù)據(jù),自主完成篩選,、分析,,并自主撰寫生成行業(yè)報(bào)告,輔助從業(yè)人員做決策,。
田奇介紹,,AI大模型已應(yīng)用于國網(wǎng)電力部門的日常線路檢測(cè)?!耙郧耙R(shí)別各種電力傳輸線上的缺陷,,需要針對(duì)每一類缺陷單獨(dú)做一個(gè)小模型,有幾百種缺陷就要做幾百種模型,,現(xiàn)在利用一個(gè)大模型就可完成各類缺陷的識(shí)別,。”
值得注意的是,AI大模型目前的技術(shù)進(jìn)步,,是人工智能從感知向認(rèn)知演進(jìn)的關(guān)鍵環(huán)節(jié),。清華大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)系副教授劉知遠(yuǎn)表示,古今中外一切文章,、資料,,都可作為訓(xùn)練大模型的數(shù)據(jù)。通過分析并“內(nèi)化”海量知識(shí),,不僅讓智能產(chǎn)品擁有更高性能,,如機(jī)器翻譯更加準(zhǔn)確、機(jī)器寫作更加生動(dòng)有邏輯,;還能品讀人類情感,,用于情感標(biāo)注。此外,,“它可能識(shí)別到‘弦外之音’,,甚至有希望發(fā)現(xiàn)人類未曾掌握的知識(shí)?!?/p>
這一技術(shù)的發(fā)展,,也可能給部分產(chǎn)業(yè)帶來重大變革。周明說,,未來將產(chǎn)生新一代搜索引擎,。“目前大部分搜索引擎是基于關(guān)鍵詞識(shí)別,,只將庫里已有的包含關(guān)鍵詞的結(jié)果‘搬運(yùn)’給用戶,,而基于大模型的新一代搜索引擎,通過理解人類語言,,可以自主生成回答,,且支持文字、圖片,、音頻,、視頻等多模態(tài)搜索?!?/p>
田奇表示,,新一代搜索引擎具備創(chuàng)作能力,比如搜索“長(zhǎng)翅膀的貓”“會(huì)飛的豬”等現(xiàn)實(shí)中不存在的事物,,搜索引擎也可根據(jù)描述生成相應(yīng)照片,。
多重發(fā)展難題待解
當(dāng)前,美國OpenAI,、谷歌,、微軟,、臉書、英偉達(dá)等海外公司紛紛布局AI大模型產(chǎn)業(yè),,國內(nèi)的華為,、阿里巴巴、百度等大型企業(yè),,以及高校,、科研機(jī)構(gòu)也加入研發(fā)賽道。AI大模型正成為人工智能“新高地”,。
記者調(diào)研了解到,,從技術(shù)上講,國內(nèi)AI大模型已初步成熟,,下一步將聚焦行業(yè)推廣,,并結(jié)合具體問題對(duì)模型進(jìn)行迭代。田奇預(yù)測(cè),,AI大模型的大規(guī)模應(yīng)用“可能還需要兩到三年時(shí)間”,,且未來AI大模型還有望集納于芯片上,更方便落地應(yīng)用,。
專家指出,,我國有較大的AI大模型應(yīng)用市場(chǎng),在應(yīng)用領(lǐng)域具有優(yōu)勢(shì),,但發(fā)展過程中也面臨一些挑戰(zhàn),。
劉知遠(yuǎn)介紹,很多核心技術(shù)目前仍然掌握在發(fā)達(dá)國家手中,,訓(xùn)練AI大模型需大量GPU(圖形處理器)芯片,,但當(dāng)前國產(chǎn)GPU芯片技術(shù)相對(duì)薄弱。同時(shí),,我國在算法上的原始創(chuàng)新能力也有待提升,。
多位受訪者表示,目前從事AI大模型研發(fā)且能產(chǎn)出創(chuàng)新性成果的高校,、科研機(jī)構(gòu)和企業(yè)屈指可數(shù),,與國外相比,,我國相關(guān)領(lǐng)域高水平基礎(chǔ)人才培養(yǎng)力度有待加強(qiáng),。
此外,訓(xùn)練大模型需要較高的電力成本,、設(shè)備成本等,,很多中小企業(yè)、科研單位囿于高昂成本,,無法搭建擁有充足算力的機(jī)房,,面臨算力不足的問題,。
多措并舉搶占“新高地”
多位專家表示,AI大模型有望實(shí)現(xiàn)人工智能從感知到認(rèn)知的躍遷,,將更高效地賦能AI產(chǎn)業(yè)化和產(chǎn)業(yè)AI化,。相關(guān)技術(shù)研發(fā)和產(chǎn)業(yè)布局引導(dǎo)、配套支持政策,、合理監(jiān)管等舉措能否有效落地至關(guān)重要,。
首先,推進(jìn)AI大模型標(biāo)準(zhǔn)化,。受訪專家指出,,大模型的訓(xùn)練過程具有高能耗的特點(diǎn),制定標(biāo)準(zhǔn)后,,許多工作可基于已經(jīng)開發(fā)的標(biāo)準(zhǔn)化大模型進(jìn)行適配和二次開發(fā),,無需每次從頭訓(xùn)練,以降低能耗,。同時(shí),,大模型發(fā)展的過程中,也可能衍生違法違規(guī)信息生成,、隱私泄露,、虛假信息傳播等風(fēng)險(xiǎn),對(duì)用于訓(xùn)練模型的源頭數(shù)據(jù)等做好規(guī)范,,有利于規(guī)避相關(guān)風(fēng)險(xiǎn),。國家相關(guān)部門可牽頭或引導(dǎo)企業(yè)、研究所,、高校等共同定義大模型的標(biāo)準(zhǔn),。
其次,適當(dāng)開放訓(xùn)練數(shù)據(jù),。受訪者表示,,訓(xùn)練大模型需要海量數(shù)據(jù),出于對(duì)數(shù)據(jù)的隱私,、安全等方面的擔(dān)憂,,一些領(lǐng)域難以獲取數(shù)據(jù),形成數(shù)據(jù)孤島,。建議在國家機(jī)構(gòu)監(jiān)管和宏觀把控的前提下,,各方數(shù)據(jù)能夠?qū)Π酌麊纹髽I(yè)、機(jī)構(gòu),、高校適當(dāng)開放,,在確保數(shù)據(jù)安全使用的同時(shí),增強(qiáng)我國AI大模型實(shí)力,。例如,,醫(yī)院等機(jī)構(gòu)適當(dāng)開放數(shù)據(jù),,將有利于訓(xùn)練更懂醫(yī)療的大模型,賦能健康醫(yī)藥領(lǐng)域發(fā)展,。
再次,,鼓勵(lì)算力共享。記者調(diào)研了解到,,目前只有部分大企業(yè)能夠負(fù)擔(dān)超大模型訓(xùn)練所需的算力成本,。受訪專家呼吁,可引導(dǎo)具有強(qiáng)算力的人工智能“國家隊(duì)”,,為更多中小微企業(yè),、科研單位提供大模型訓(xùn)練所需的算力支撐,可探索合理付費(fèi)的算力共享機(jī)制,,共同促進(jìn)技術(shù)的發(fā)展和資源的節(jié)約,。
最后,加大原始創(chuàng)新引導(dǎo)和支持,。多位專家指出,,我國應(yīng)加強(qiáng)研發(fā)力度,同時(shí)加強(qiáng)針對(duì)模型框架的基礎(chǔ)創(chuàng)新研究,,引導(dǎo)更多科研單位,、高校積極培養(yǎng)相關(guān)人才,鼓勵(lì)更多社會(huì)力量加入這場(chǎng)信息革命的浪潮,。
?
![]() |
AI大模型有望實(shí)現(xiàn)人工智能從感知到認(rèn)知的躍遷,,重新定義人工智能產(chǎn)業(yè)模式和產(chǎn)業(yè)標(biāo)準(zhǔn),,給部分產(chǎn)業(yè)帶來重大變革。
經(jīng)濟(jì)參考報(bào)社版權(quán)所有 本站所有新聞內(nèi)容未經(jīng)經(jīng)濟(jì)參考報(bào)協(xié)議授權(quán),,禁止轉(zhuǎn)載使用
新聞線索提供熱線:010-63074375 63072334 報(bào)社地址:北京市宣武門西大街57號(hào)
JJCKB.CN 京ICP備18039543號(hào)