突圍與蝶變——?中國大模型發(fā)展方興未艾
2024-06-18 15:35 來源:法人雜志 作者:李遼

◎文 《法人》雜志全媒體記者 李遼

與以往任何一場顛覆性的技術(shù)革新相比,大模型似乎都來得更為猛烈,影響也更為深遠。經(jīng)過了2023年的大模型“元年”,如今,它正站在爆發(fā)前夜,探尋著商業(yè)落地的路徑。

在這個賽道,中國處于世界第一梯隊,特別是中國的千行百業(yè),市場需求大、場景多、數(shù)據(jù)豐富,使垂直大模型展現(xiàn)出了顯著優(yōu)勢,為效率提升、產(chǎn)業(yè)升級賦能。諸多廠商也已經(jīng)布局,“百模大戰(zhàn)”正在上演,相關(guān)應(yīng)用“破圈”頻繁引發(fā)熱議。

但算力、數(shù)據(jù)、資本、人才的普遍不足仍是未來大模型發(fā)展的掣肘,而技術(shù)的突破也帶來了新的風(fēng)險挑戰(zhàn),大模型產(chǎn)生的爭議與法律糾紛也讓人們看到了它背后的隱憂。

2024年,大模型的競爭愈發(fā)激烈。近日,斯坦福大學(xué)某AI團隊被曝疑似抄襲中國大模型創(chuàng)業(yè)公司面壁智能的創(chuàng)新成果,引發(fā)廣泛關(guān)注。人們這才意識到,幾年的時間里,中國在大模型這條賽道上已不再是單純的追隨者,而是展現(xiàn)出了與世界一流團隊一較高下的底氣和實力。

在人工智能技術(shù)演進中,大模型是一個重要分支。在2022年11月OpenAI公司發(fā)布GPT-3.5之前,大模型還在黑暗中不知前路。但隨著以ChatGPT為代表的生成式人工智能產(chǎn)品成為現(xiàn)象級應(yīng)用,人們終于意識到,這條探索之路走得通,也可以走得遠。

如今,人工智能的發(fā)展邁入新階段,千行百業(yè)迫切與之深度融合。全球都試圖搭上這趟時代的列車,而中國以自身獨特的方式,拉開了大模型商業(yè)化變現(xiàn)的大幕。

百模大戰(zhàn)

1956年夏天,美國達特茅斯學(xué)院的一場閉門會議首次提出了“人工智能”概念,被認為是人工智能誕生的標(biāo)志。進入20世紀(jì)八十年代,人們開始涉足人工智能背后的核心——神經(jīng)網(wǎng)絡(luò)算法的研究,但受限于算力和數(shù)據(jù)資源,人工智能并未如預(yù)期一般迎來大規(guī)模發(fā)展。

人工智能的浪潮在2017年達到高峰。谷歌大腦團隊發(fā)表了一篇著名的論文,提出了全新的transformer架構(gòu)。也正是這個架構(gòu),最終成就了OpenAI和ChatGPT。

6月4日,中歐國際工商學(xué)院決策科學(xué)與管理信息系統(tǒng)教授譚寅亮在接受《法人》記者采訪時稱:“數(shù)據(jù)量越多,參數(shù)量越高,模型性能提升越明顯,這正是大模型的特點,被形象地稱為‘大力出奇跡’?!?/p>

▲CFP

“大模型的技術(shù)進步并非線性發(fā)展,而是跳躍式、跨越式發(fā)展。”北京瑞泊控股(集團)創(chuàng)始人乙壤月稱,OpenAI的每一次產(chǎn)品發(fā)布,都不是小幅度的改進,而是大膽的飛躍,足以震撼世界,這是一種“暴力美學(xué)”。

2024年4月16日,斯坦福大學(xué)以人為本人工智能研究所發(fā)布《2024年人工智能指數(shù)報告》,揭示了全球人工智能最新動態(tài)。報告顯示,2023年,全球共發(fā)布149個通用大模型(大模型分通用大模型和垂類大模型,前者指具有廣泛適用性的大型生成式人工智能模型,可以表現(xiàn)出類似于人類智能的通用性和適應(yīng)性,后者是指針對特定行業(yè)或領(lǐng)域進行訓(xùn)練的大模型),這一數(shù)量是2022年的兩倍有余。

在這輪生成式人工智能的競賽中,中美處于世界第一梯隊。根據(jù)上述報告,2023年,美國共研發(fā)了61個通用大模型,中國緊隨其后,發(fā)布了15個,法國、德國和加拿大分別為8個、4個和4個。這些數(shù)字從側(cè)面反映出不同國家在人工智能領(lǐng)域的整體科技實力、資金投入和人才培養(yǎng)情況。

其實,中國早在2017年便開始發(fā)展人工智能產(chǎn)業(yè),其熱度在2019年達到頂峰,之后出現(xiàn)回落。當(dāng)時,市場對其可能性提出質(zhì)疑。但當(dāng)生成式人工智能的浪潮席卷全球后,國內(nèi)發(fā)展熱情被迅速被點燃,科技巨頭、初創(chuàng)企業(yè)、研究院等紛紛躬身入局。2023年上半年,百度發(fā)布“文心一言”,商湯科技發(fā)布日日新,阿里巴巴發(fā)布通義千問,同年下半年,華為云推出盤古大模型3.0……各方力量爭奇斗艷,被形象地稱為“百模大戰(zhàn)”。

截至2024年4月2日,國家網(wǎng)信辦發(fā)布公告稱,目前已有117款生成式人工智能服務(wù)通過備案,其中北京51款、上海24款、廣東19款,大部分為垂類大模型。

在談到當(dāng)前市場格局時,中國信通院華東分院人工智能事業(yè)部主任常永波給記者列舉了百度、阿里巴巴、字節(jié)跳動、華為和騰訊等互聯(lián)網(wǎng)領(lǐng)軍企業(yè),“它們具有雄厚的技術(shù)積累和創(chuàng)新能力,研發(fā)的產(chǎn)品在行業(yè)中處于領(lǐng)先地位”。此外,他還特別指出,一批新興獨角獸企業(yè),如智譜AI、百川智能、月之暗面、MiniMax和零一萬物等,成立時間雖短,但已憑借超過10億美元的融資規(guī)模和卓越的研發(fā)成果,在大模型領(lǐng)域嶄露頭角。

四大掣肘

當(dāng)前,中國大模型發(fā)展熱火朝天,但無法回避算力、數(shù)據(jù)、人才和資金方面我們存在的問題。

大模型算力的增強需要依賴強大的硬件支持,即高性能的AI芯片?!澳壳埃绹谒懔Ψ矫鎿碛蓄I(lǐng)先優(yōu)勢,一些高性能芯片被禁止向中國大陸市場出售,因此,國內(nèi)算力被卡脖子,企業(yè)只能使用本土芯片?!睆V東民營投資股份有限公司副總裁歐文志稱,“從中長期發(fā)展來看,國產(chǎn)算力自主是大模型發(fā)展的核心,其底層是國產(chǎn)高端芯片產(chǎn)業(yè)鏈的發(fā)展,相信今年正式官宣的國家大基金三期會在這個方向重點投入。”

數(shù)據(jù)的質(zhì)量和數(shù)量對大模型優(yōu)化至關(guān)重要?,F(xiàn)代大模型對數(shù)據(jù)的渴求已經(jīng)到了前所未有的高度,它們需要的數(shù)據(jù)量是過去的十倍甚至百倍。常永波強調(diào):“無論數(shù)據(jù)的數(shù)量還是質(zhì)量,都需要在特定行業(yè)或場景中進行長期積累。此外,還需要行業(yè)機構(gòu)愿意分享其擁有的數(shù)據(jù)。但由于目前數(shù)據(jù)流通環(huán)節(jié)不可控,導(dǎo)致很多數(shù)據(jù)擁有者不敢開放數(shù)據(jù)。”對此,乙壤月也表示,雖然中國的數(shù)據(jù)總量超過美國,但數(shù)據(jù)質(zhì)量不夠好,這對中國大模型的發(fā)展形成了一定掣肘。

大模型技術(shù)的爆發(fā)期與人才培養(yǎng)周期之間存在時間差,這導(dǎo)致具備高級人工智能素養(yǎng)和深入理解大模型技術(shù)路線的人才十分稀少。乙壤月說:“大模型火爆之前,國內(nèi)真正從事大模型的專業(yè)技術(shù)人員只有數(shù)百人,人才短缺并非中國獨有,全球范圍都面臨這個問題。甲方在尋找優(yōu)秀大模型人才時,往往需要付出巨大的人力成本。”據(jù)悉,一位具備專業(yè)技能的大模型技術(shù)人員,年薪也要100萬元以上,技術(shù)負責(zé)人則接近千萬元。

隨著大模型規(guī)模的擴大,訓(xùn)練成本上升也成為不可避免的趨勢。據(jù)業(yè)內(nèi)估計,大模型一次訓(xùn)練費用可能高達數(shù)千萬元,這無疑對企業(yè)的資金實力提出了嚴(yán)峻考驗。在大模型企業(yè)的成本結(jié)構(gòu)中,算力成本通常約占總成本的六成。因此,大模型本質(zhì)上是一個需要巨額資本投入的領(lǐng)域。

眼下,大模型給中國帶來了一場資本盛宴,這條賽道在當(dāng)下國內(nèi)的股權(quán)投資市場屬于一股清流。歐文志稱,當(dāng)前,大模型是為數(shù)不多的、資本仍愿意投資的“高景氣、高虧損”賽道,類似于當(dāng)年的芯片、創(chuàng)新藥,背后代表著投資人對其發(fā)展前景的高度預(yù)期?!按竽P彤a(chǎn)業(yè)發(fā)展如此之快,一時間涌現(xiàn)了這么多獨角獸企業(yè),競爭如此激烈,背后正是資本對該賽道的快速押注。”

如今,對于很多大企業(yè)來說,AI或是一張續(xù)命的船票,或是企業(yè)變革的關(guān)鍵。以阿里巴巴為代表,該公司押注了國內(nèi)6家獨角獸中的5家,而騰訊擔(dān)心錯失機會,除投資光年之外、MiniMax、智譜AI和百川智能,自己也在研發(fā)大模型,投資與自研并行。

肉眼可見,對通用大模型的投資,資方緊盯著頭部的幾家企業(yè)。常永波也坦言:“通用大模型不是一般的初創(chuàng)企業(yè)、小型資本能玩得轉(zhuǎn)的,這讓一些創(chuàng)業(yè)企業(yè)面臨很大的資金壓力?!?/p>

另辟蹊徑

中國需求規(guī)模大、產(chǎn)業(yè)配套全、應(yīng)用場景多,業(yè)內(nèi)普遍認為,垂類大模型是將來中國最具競爭力的方向。譚寅亮稱:“人工智能要實現(xiàn)對生產(chǎn)力的提升,需要通過應(yīng)用,而應(yīng)用離不開數(shù)據(jù),中國的場景更豐富,場景帶來的不僅是產(chǎn)業(yè)的動力,還有數(shù)據(jù)的多樣性。”

垂類大模型需要針對特定行業(yè)和場景進行定制化和優(yōu)化。東方財富人工智能首席科學(xué)家劉志毅觀察到,越來越多的金融企業(yè)、醫(yī)院、律師在積極尋找與大模型的結(jié)合點,“從這個角度看,我認為中國在大模型方面的發(fā)展?jié)摿Ω蟆薄?/p>

劉志毅將大模型技術(shù)創(chuàng)新者的研究比喻成攀登珠穆朗瑪峰:“美國的技術(shù)創(chuàng)新者選擇了一條充滿挑戰(zhàn)的路線,即通用人工智能的研發(fā),這如同攀登珠峰的北坡,技術(shù)難度極高。他們追求的是技術(shù)極客的理想,致力于創(chuàng)造能與人類相媲美的人工智能。而中國的大部分創(chuàng)新者則選擇了南坡,在底層技術(shù)積累相對較少的情況下,走上一條更為務(wù)實的道路——產(chǎn)業(yè)智能化和應(yīng)用產(chǎn)品化。盡管南北坡路線不同,但最終都將到達一個頂峰,就是整個社會的智能化。就像《月亮與六便士》,我們追求的是‘六便士’,但并不妨礙我們欣賞‘月亮’?!?/p>

▲在上海召開的世界人工智能大會吸引了眾多參觀者 CFP

對此,他預(yù)言:“由于中國大模型與產(chǎn)業(yè)結(jié)合得更加緊密,未來5到10年,除了出現(xiàn)獨立的人工智能行業(yè)以外,還將出現(xiàn)與具體產(chǎn)業(yè)結(jié)合的智能化趨勢,例如可能會涌現(xiàn)非常出色的智能金融產(chǎn)業(yè)、智能醫(yī)療產(chǎn)業(yè)、智能教育產(chǎn)業(yè)等。”他認為,這將是中國人工智能發(fā)展的一個顯著特點。

目前,中國還處在人工智能產(chǎn)業(yè)化階段,但再過幾年,常永波認為,應(yīng)該會走向產(chǎn)業(yè)人工智能化,各行各業(yè)的產(chǎn)品、管理、服務(wù)都會深入運用人工智能,全面融入人工智能,提升效率,進行產(chǎn)業(yè)迭代升級。根據(jù)大模型之家的數(shù)據(jù),預(yù)計2028年,中國大模型市場規(guī)模將達到1179億元;2022年至2028年,復(fù)合增長率約為60.11%。

構(gòu)建生態(tài)

毋庸置疑,中國大模型生態(tài)很卷。企業(yè)忙著卷新產(chǎn)品的研發(fā)、典型的應(yīng)用場景、落地的商業(yè)模式,誰能突出重圍,推出一個可以形成示范效應(yīng)的殺手級應(yīng)用,誰就能脫穎而出。

如今,從“卷”參數(shù)到“卷”價格,多家企業(yè)大模型應(yīng)用價格動輒下調(diào)90%以上,有的甚至直接免費。可見,大模型比拼已經(jīng)進入白熱化階段?!按竽P褪褂贸杀窘档停吔诿赓M,是未來的趨勢,隨之而來的是大模型快速普及?!币胰涝抡J為,這給一些規(guī)模較小、實力較弱的大模型企業(yè)帶來了生存壓力。

在國內(nèi)“卷到極致”的發(fā)展趨勢下,常永波敏銳地觀察到了人工智能企業(yè)出海的現(xiàn)象?!耙恍┢髽I(yè)家說,國內(nèi)大模型賽道太卷了,能夠在中國生存下來的企業(yè),如果走向東南亞、歐美等其他市場,會顯現(xiàn)出強大的競爭力?!?/p>

目前,美國眾議院正在推進大模型出口限制法案,如果法案最終落地實施,譚寅亮認為,將影響中國企業(yè)在美國開源的大模型上進行二次開發(fā)?!耙虼耍袊仨毤訌姶竽P妥灾餮邪l(fā)能力,確保人工智能系統(tǒng)研發(fā)的自主性。大模型本土化替代顯得尤為迫切?!彼ㄗh,行業(yè)領(lǐng)軍企業(yè)應(yīng)擔(dān)起重任,開發(fā)開源的通用模型。

隨著生成式人工智能的發(fā)展,其帶來的模型幻覺、數(shù)據(jù)安全、個人信息保護以及科技倫理等方面的風(fēng)險和挑戰(zhàn)引發(fā)了全球關(guān)注,人工智能的全球治理正在被各國緊鑼密鼓地提上議程。

2023年10月,在第三屆“一帶一路”國際合作高峰論壇上,中國提出了《全球人工智能治理倡議》;同年11月,中國、美國、英國等28國和歐盟簽署了全球第一份針對人工智能的國際性聲明《布萊切利宣言》;2024年3月,聯(lián)合國大會通過了由美國牽頭提出的決議案《抓住安全、可靠和值得信賴的人工智能系統(tǒng)帶來的機遇,促進可持續(xù)發(fā)展》;5月14日,中美人工智能政府間對話首次會議在瑞士日內(nèi)瓦舉行;5月21日,韓國和英國在首爾共同主辦了第二屆人工智能安全峰會;同日,歐盟理事會正式批準(zhǔn)了全球首個用于人工智能領(lǐng)域監(jiān)管的法案《人工智能法案》,該法案不僅適用于所有歐盟境內(nèi)的人工智能使用者,還包括位于歐盟以外的人工智能設(shè)備供應(yīng)商。

可見,主要國家正致力于人工智能生態(tài)的打造,加強自身在國際舞臺上的話語權(quán)。畢竟,在人工智能這一關(guān)鍵技術(shù)領(lǐng)域,擁有話語權(quán)意味著能夠參與制定全球規(guī)則,引領(lǐng)技術(shù)發(fā)展方向,保護國家利益。

“人工智能這條路不僅需要技術(shù)本身的創(chuàng)新,還需要學(xué)者、企業(yè)、公眾、國家的共同努力,需要整個組織架構(gòu)、商業(yè)環(huán)境和文化生態(tài)的全面調(diào)整和創(chuàng)新?!弊T寅亮說,“我們正處在人工智能的關(guān)鍵時刻,但這條路一定不會漫長?!?/p>

編審|渠 洋

責(zé)編|白 馗

校對|張波 張雪慧

編輯:劉曉瑩