美國公司OpenAI推出的人工智能聊天機器人ChatGPT“火”出圈了,上線兩個月就收獲了1億月活用戶,成為歷史上增長最快的消費級應用程序。這個速度打破了此前由字節(jié)跳動旗下短視頻社交平臺TikTok創(chuàng)造的9個月收獲過億月活用戶的紀錄。
這款“現(xiàn)象級”產(chǎn)品背后預示著什么樣的未來?中國有開發(fā)類似產(chǎn)品的基礎(chǔ)嗎?
競爭已至
在社交平臺展示自己與ChatGPT的對話截圖,已經(jīng)成為一種時尚。它可以用自然語言和人類用戶對話,理解用戶意圖,完成寫論文、寫代碼等各種內(nèi)容生成任務;還可以展現(xiàn)“學霸”光環(huán),在沃頓商學院通過了MBA考試、在明尼蘇達大學通過了法學院考試……
“ChatGPT是人工智能領(lǐng)域的又一次革新,將會推動新一輪的AI(人工智能)模型競爭。”遠鑒信息技術(shù)有限公司首席技術(shù)官鄭榕認為,ChatGPT的最大貢獻在于基本實現(xiàn)了理想型語言預訓練模型的接口層,讓機器人學習適應人類的表達方式,而不是反過來讓人類學習可以命令機器的指令,這是一種更符合人類表達習慣的人機接口技術(shù)。
ChatGPT的火爆對產(chǎn)業(yè)界、學術(shù)界都帶來了巨大的沖擊。
“2016年以來,我國人工智能產(chǎn)業(yè)規(guī)模呈現(xiàn)迅猛增長態(tài)勢,但2019年我國人工智能投融資出現(xiàn)大幅度下跌。”賽迪顧問股份有限公司副總裁宋宇認為,總體來看,人工智能發(fā)展退潮主要還是缺乏支撐產(chǎn)業(yè)快速發(fā)展的技術(shù)突破,而ChatGPT的出現(xiàn)恰好給行業(yè)發(fā)展和投資帶來了新動力。
高科技投資機構(gòu)方舟投資發(fā)布報告預測,到2030年,AI將大幅提高知識工作者的工作效率,平均工作效率增加140%。“新一代人工智能技術(shù)將有可能大幅度降低腦力勞動者的工作強度。如果這一切成為現(xiàn)實,或?qū)⑹抢^人類歷史上由于動力革命而擺脫繁重的體力勞動之后,人類社會發(fā)生的又一次深刻的技術(shù)革命。”阿里研究院資深技術(shù)專家、中國計算機學會人工智能專委會常務委員蘇中在近日發(fā)布的文章中表示。
“ChatGPT更偏向于對話機制的巨大優(yōu)勢,對包括谷歌在內(nèi)的傳統(tǒng)搜索引擎而言是巨大的挑戰(zhàn)。它的火爆將大大推動OpenAI主導的大規(guī)模語言模型研究方向的發(fā)展。隨著企業(yè)多模態(tài)領(lǐng)域的布局,人工智能相關(guān)領(lǐng)域會有突破性的進展。”北京航空航天大學人工智能研究院副研究員胡堃說,由于ChatGPT對算力要求較高,對于計算資源有限的高校而言,加大了學術(shù)研究的困難,亟需打通企業(yè)資源,加強產(chǎn)學研合作。
抓緊布局
在ChatGPT帶來的這波AI競爭中,中國顯然不甘人后。2月13日北京市經(jīng)濟和信息化局發(fā)布的《2022年北京人工智能產(chǎn)業(yè)發(fā)展白皮書》中,明確提出支持頭部企業(yè)打造對標ChatGPT的大模型,著力構(gòu)建開源框架和通用大模型的應用生態(tài)。
從預訓練到大模型的AI技術(shù)突破,是ChatGPT獲得成功的基礎(chǔ)。傳統(tǒng)的AI模型訓練中,標注成本一直是阻礙AI算法推向更大數(shù)據(jù)集合的障礙;而預訓練技術(shù)不依賴數(shù)據(jù)標注,就可以訓練出一個大規(guī)模深度學習模型。2020年6月,OpenAI發(fā)布了大型語言模型GPT—3,參數(shù)規(guī)模達到1750億,ChatGPT正是基于該模型的改進版而創(chuàng)建的。
大模型展現(xiàn)出的能力、潛力和豐富的應用場景,早已激發(fā)很多企業(yè)和研究機構(gòu)投身這場競賽。2021年1月,谷歌大腦推出了1.6萬億參數(shù)規(guī)模超級模型。2020年11月,華為啟動了中文預訓練大模型項目,2021年4月,千億參數(shù)規(guī)模的盤古大模型發(fā)布。2021年6月,由北京智源人工智能研究院牽頭,多家機構(gòu)參與共同研發(fā)的悟道2.0大模型,參數(shù)規(guī)模達到1.75萬億。阿里巴巴達摩院在2020年初啟動中文多模態(tài)預訓練模型M6項目,2021年10月,M6的參數(shù)規(guī)模擴展到10萬億,成為當時全球最大的AI預訓練模型。
蘇中認為,在這條數(shù)據(jù)、算法和算力三輪同時驅(qū)動的技術(shù)賽道上,中美兩國技術(shù)團隊已經(jīng)形成了“兩駕馬車”的發(fā)展模式,不斷刷新人工智能能力規(guī)模上的邊界線。在AIGC(人工智能內(nèi)容生成技術(shù))高質(zhì)量論文領(lǐng)域,中國和美國數(shù)量幾乎持平,并大幅度領(lǐng)先其他國家。
“人工智能可以成為我國自主創(chuàng)新的突破口。我國人工智能產(chǎn)業(yè)與美國相比雖有一定差距,但差距并不大。”宋宇說,比如面對大模型所需要的日趨龐大的算力需求,國內(nèi)已建立多個超算中心,以及專門的人工智能算力中心。“整體上看,我國現(xiàn)在的算力已經(jīng)領(lǐng)先了人工智能的需求,為自主創(chuàng)新提供了保障。”
數(shù)據(jù)顯示,近年來,我國人工智能產(chǎn)業(yè)增速高于全球水平。2017年至2021年,我國人工智能產(chǎn)業(yè)規(guī)模增長了2.6倍,占全球比重提升到16.8%。2012年至2022年9月,全球人工智能領(lǐng)域發(fā)表的論文約100萬篇,其中28%的論文來自中國。中國高水平論文產(chǎn)出占比從2012年的20.36%增長到2021年的50.71%。專利數(shù)量上,全球人工智能專利累計授權(quán)量25萬件,中國占比60%。
迎接挑戰(zhàn)
ChatGPT已領(lǐng)先一步,中國企業(yè)能否趕超?
“ChatGPT從回答的邏輯性和完整度上都遠超國內(nèi)大模型,在回復速度上,ChatGPT也領(lǐng)先一截。”鄭榕認為,這種差距與數(shù)據(jù)質(zhì)量有一定關(guān)系。AI的進化需要投喂大量數(shù)據(jù),而全球互聯(lián)網(wǎng)的中文數(shù)據(jù)質(zhì)量,相比于英文數(shù)據(jù)質(zhì)量還有明顯差距。“我們要想辦法,做好中英文不同語言之間的數(shù)據(jù)互補。”鄭榕說。
ChatGPT使用的大模型對計算資源消耗極大,這意味著需要大筆投資。2019年,微軟向OpenAI投資10億美元,2021年另一輪投資數(shù)額未公開。今年1月,微軟宣布將向OpenAI開展“多年、數(shù)十億美元”的投資,兩家公司沒有披露具體款項,但據(jù)美國媒體透露,微軟將向OpenAI投資100億美元。
面對這樣的門檻,胡堃建議通過政策發(fā)力整合資源。“大多數(shù)企業(yè)無法承受人工智能發(fā)展對于算力等資源的巨大消耗,建議國家從政策層面整合相關(guān)資源,如建立統(tǒng)一的計算平臺,結(jié)束各企業(yè)計算資源割裂和重復建設(shè)的狀態(tài),促成各方達成某種協(xié)議,共同建設(shè),共獲收益。”胡堃說。
另一方面,門檻也是改進和趕超的機會。ChatGPT需要大量算力和能源投入,成本很高,大規(guī)模商用必須改進技術(shù)、降低成本。比如AI芯片不但需要保證高性能,還要做到高算力下低功耗,對此,國內(nèi)芯片廠商可以有所作為。平臺型科技企業(yè)也可以發(fā)揮綜合優(yōu)勢,與研究機構(gòu)、高校等合作形成聯(lián)合創(chuàng)新主體,加速新一代AI技術(shù)的產(chǎn)品轉(zhuǎn)化。
“在體制機制上,要對開展自主創(chuàng)新的企業(yè)有足夠的耐心。”宋宇表示,在國家層面,建議進一步完善對人才和機構(gòu)的考核機制,要有長遠的目標和足夠的耐心讓企業(yè)自主創(chuàng)新,要有試錯容錯機制。
以ChatGPT為代表的人工智能內(nèi)容生成技術(shù),目前也面臨許多倫理問題和安全問題,如歧視、詐騙、抄襲、造謠、偽造身份等,需要在發(fā)展中加以規(guī)范。
多位專家表示,由于ChatGPT在中美科技競爭中扮演極其重要的角色,建議對相關(guān)技術(shù)和應用領(lǐng)域,采取鼓勵創(chuàng)新、包容審慎的監(jiān)管原則。同時,加強行業(yè)指引,特別是在科研、生活服務、商業(yè)、消費等倫理與安全相對有保障的應用領(lǐng)域,要積極鼓勵發(fā)展。
期待在ChatGPT引爆的新一輪AI產(chǎn)業(yè)競爭中,中國企業(yè)可以大展宏圖。(經(jīng)濟日報記者 佘惠敏)
評論