魯俊群:由ChatGPT現(xiàn)象看中美產(chǎn)業(yè)鏈和科技創(chuàng)新之爭
——從開源生態(tài)系統(tǒng)視角觀察AI大模型
- 發(fā)布時(shí)間:2023-09-26 11:20:28
- 來源:中國社會(huì)科學(xué)網(wǎng)
2022年底,Open AI推出Chat GPT,迅速火遍全球,上線僅兩個(gè)月注冊用戶就達(dá)到1億,引發(fā)全民關(guān)于AI大變革的討論。
同時(shí),人們對于Open AI在成立時(shí)承諾專利和研究成果全部開放,而現(xiàn)在又不開源代碼表示疑慮。Open AI未來是否會(huì)開源代碼?開源生態(tài)系統(tǒng)在塑造產(chǎn)業(yè)鏈和科技創(chuàng)新方面到底扮演了什么角色?在創(chuàng)新機(jī)制上又有哪些可學(xué)習(xí)借鑒之處?中國是否應(yīng)該發(fā)展自己的AI大模型?發(fā)展路徑應(yīng)該如何選擇?本文嘗試從開源生態(tài)系統(tǒng)的視角來觀察AI進(jìn)化的邏輯。
一、開源生態(tài)系統(tǒng)的發(fā)展歷史與國際現(xiàn)狀
開源是軟件開發(fā)中的一種模式,指基于開源許可證的要求開放源代碼。這一開發(fā)模式允許他人使用、拷貝、修改以及重新發(fā)布源代碼,在其基礎(chǔ)上創(chuàng)新、優(yōu)化、迭代。
開源文化具有開放、平等、共享、協(xié)作、貢獻(xiàn)、合規(guī)等特點(diǎn),也是一種先進(jìn)的大規(guī)模的智力協(xié)同創(chuàng)新協(xié)作模式,并已從軟件開發(fā)延伸至更多領(lǐng)域。
開源軟件從上世紀(jì)80年代發(fā)展至今,經(jīng)歷了從理想主義模式、服務(wù)商業(yè)模式,再到如今的多元商業(yè)模式等多個(gè)階段(如圖)。開源的歷史是軟件創(chuàng)新自由和版權(quán)收益之間不斷斗爭和平衡的歷史,也是處在開源與壟斷不斷循環(huán)之中。服務(wù)器操作系統(tǒng)、云計(jì)算、大數(shù)據(jù)、人工智能等新技術(shù)都在近幾年逐步走向開源。
在國際上,開源的重要性已得到廣泛認(rèn)可。開源體系成為西方國家打造數(shù)字經(jīng)濟(jì)新優(yōu)勢的戰(zhàn)略選擇。以美國為例,美國對開源生態(tài)的建設(shè)強(qiáng)調(diào)體系化,借助開源幫助政府降低采購成本,開源的發(fā)展與研發(fā)的突破結(jié)合緊密,開源常引導(dǎo)新技術(shù)的發(fā)展方向。美國政府于2002年開始布局開源生態(tài)的建設(shè)。從2004年起美國出臺了一系列指導(dǎo)政府部門使用開源軟件的政策。在2016年和2019年的《人工智能研發(fā)戰(zhàn)略計(jì)劃》中均提出,要開發(fā)開源軟件庫和工具包;政府部門不但要支持和使用人工智能開源技術(shù),還要為開源項(xiàng)目貢獻(xiàn)算法或軟件。
市值超過千億美元的國際龍頭企業(yè)也紛紛布局開源。IBM以340億美元收購了開源軟件企業(yè)RedHat,微軟以75億美元收購了Git Hub。除此以外,Oracle、Adobe等巨頭也紛紛收購開源軟件企業(yè),布局開源生態(tài)。
二、美國Open AI誕生Chat GPT的內(nèi)部運(yùn)行機(jī)制:開源和閉源的博弈、理想主義和商業(yè)利益的平衡
2015年底,OpenAI宣告成立。它是以捐贈(zèng)款成立基金會(huì)支持的非營利性實(shí)驗(yàn)室,目標(biāo)是開發(fā)“通用人工智能”技術(shù)。到2019年時(shí),捐贈(zèng)款項(xiàng)已無法支撐運(yùn)營成本,OpenAI成立了一個(gè)以盈利為目的的分支機(jī)構(gòu),并與微軟達(dá)成投資協(xié)議,在股權(quán)架構(gòu)與利潤分配上創(chuàng)造了一種與眾不同的結(jié)構(gòu)。
(1)微軟新一輪投資完成、Open AILP首批投資人收回初始投資后,微軟有權(quán)獲得Open AILP75%的利潤;
?。?)微軟收回130億美元投資、從Open AILP獲得920億美元利潤后,分享利潤的比例從75%降到49%;
?。?)OpenAILP產(chǎn)生的利潤達(dá)到1500億美元后,投資方的全部股權(quán)轉(zhuǎn)讓給Open AI的非營利基金。
2022年底,Chat GPT成功發(fā)布??梢哉f,微軟用上百億美元的投資“租了Open AI”。等Open AI開始賺大錢之后,微軟能直接分錢。但如果Open AI變得極其賺錢,就能拿回微軟手中的股份,不再受其制約。
在目前階段,OpenAI變得不那么開放,為了保護(hù)其知識產(chǎn)權(quán)和收入來源,開始放棄發(fā)布所有研究成果和開源代碼的承諾,理想主義讓位于商業(yè)利益。
三、中國開源生態(tài)的現(xiàn)狀以及面臨的問題和挑戰(zhàn)
我國目前已積極在開源領(lǐng)域展開布局,出臺了多部政策、法規(guī)。很多地方政府也在產(chǎn)業(yè)發(fā)展規(guī)劃方案中對開源進(jìn)行了布局。
開源技術(shù)發(fā)展、開源基金會(huì)的建設(shè)等出現(xiàn)在多部“十四五”規(guī)劃中,包括《“十四五”數(shù)字經(jīng)濟(jì)發(fā)展規(guī)劃》《“十四五”國家信息化規(guī)劃》《關(guān)于規(guī)范金融業(yè)開源技術(shù)應(yīng)用與發(fā)展的意見》等。多個(gè)地方政府,如浙江省、湖北省政府等都在各自的“十四五”數(shù)字經(jīng)濟(jì)發(fā)展規(guī)劃中將開源技術(shù)納入了發(fā)展藍(lán)圖。
開源生態(tài)能夠?yàn)槲覈鴦?chuàng)新能力體系的建設(shè)添磚加瓦。利用與歐美開源模式的差異化發(fā)展,我國有機(jī)會(huì)打造中國特色的開源生態(tài),吸引國際開發(fā)者和投資者。但同時(shí)中國的開源系統(tǒng)發(fā)展也面臨多個(gè)問題和挑戰(zhàn)。
第一,目前,中央和地方在開源建設(shè)上的步調(diào)還不一致,例如有的地方政府鼓勵(lì)國際開源社區(qū)落地,而忽略了自主建設(shè)開源生態(tài)的機(jī)會(huì)。開源體系和對草根創(chuàng)新力量的保護(hù)是創(chuàng)新賴以生存的土壤。開源項(xiàng)目可以很好地集中個(gè)體的創(chuàng)新能力,保護(hù)個(gè)體創(chuàng)新的變現(xiàn)權(quán)益,可以匯聚全國甚至全球的個(gè)體創(chuàng)新者的智慧,對社會(huì)面的創(chuàng)新有極大的幫助。我國計(jì)算機(jī)相關(guān)行業(yè)工作者數(shù)量龐大,目前還沒有將草根創(chuàng)新力量聚攏起來。在科技領(lǐng)域,還存在重復(fù)建設(shè)、重復(fù)投資的情況,沒有將創(chuàng)新力量體系化。
第二,科技公司的商業(yè)競爭阻礙創(chuàng)新開發(fā)。為了搶占市場先機(jī),各大科技公司仍主要關(guān)注項(xiàng)目的商業(yè)利益,對開源的長期價(jià)值缺乏認(rèn)知,企業(yè)之間并未建立信任,不利于打造開源環(huán)境。同時(shí),即使是在開源項(xiàng)目上,傳統(tǒng)的開發(fā)方式仍然很普遍,小部分利益相關(guān)者起主導(dǎo)作用,不符合開源的利他主義思想和開源生態(tài)系統(tǒng)的建設(shè)。
第三,對開源機(jī)構(gòu)的行政干預(yù)措施仍需優(yōu)化。目前開源社區(qū)、開源基金會(huì)等受到較強(qiáng)的行政干預(yù)。例如,有的開源基金會(huì)目前歸部委相關(guān)司局管理,但司局的管理范疇和協(xié)調(diào)力度不足以支撐該基金會(huì)向更多的行業(yè)和應(yīng)用場景延伸。同時(shí),部委對基金會(huì)采取行政化管理方式,對于需求層層審批,對發(fā)展重點(diǎn)并不明確,使得開源機(jī)構(gòu)工作方向不清晰,項(xiàng)目運(yùn)作效率低下。開源基金會(huì)的管理層由部委指派,缺少社會(huì)力量的參與,使得開源模式利用民間創(chuàng)新能力的初衷沒有得到體現(xiàn),同時(shí)基金會(huì)的背景對于與國際科技企業(yè)協(xié)商合作也受一定影響。
第四,開源機(jī)構(gòu)缺乏核心競爭力。國家級的開源生態(tài)倡導(dǎo)機(jī)構(gòu),例如開源基金會(huì),缺少優(yōu)質(zhì)項(xiàng)目以及開發(fā)能力等核心競爭力,無法吸引更多企業(yè)加入合作。部分大企業(yè)在接觸開源機(jī)構(gòu)時(shí)也因此顯得更為抵觸,更傾向于保護(hù)自身的商業(yè)利益。
四、開源生態(tài)系統(tǒng)對于塑造產(chǎn)業(yè)鏈和科技創(chuàng)新的意義
開源緣起于奉獻(xiàn)和利他的理想主義。開源精神也是一種共享共治的精神,一種打破壟斷、開放創(chuàng)新的精神。開源在國際上是作為一種開發(fā)模式。軟件的開發(fā)模式與物理世界的資源開發(fā)存在根本的不同,開源的開發(fā)環(huán)境和理念有機(jī)會(huì)吸引國際開發(fā)者協(xié)作共贏,并且在外交和國際合作領(lǐng)域可以產(chǎn)生新的國際影響。
開源體系是重組全球要素資源、優(yōu)化全球價(jià)值分配、改變?nèi)蚋偁幐窬值膽?zhàn)略選擇。具體而言,開源對于創(chuàng)新活力、產(chǎn)業(yè)生態(tài)、經(jīng)濟(jì)發(fā)展都具有重大意義。
第一,開源有助于激發(fā)創(chuàng)新活力。開源的模式能夠匯聚社會(huì)中的創(chuàng)新力量,“眾籌”草根的創(chuàng)新能力。例如,操作系統(tǒng)領(lǐng)域,全球90%以上服務(wù)器操作系統(tǒng)和72%以上移動(dòng)操作系統(tǒng)均基于開源Linux內(nèi)核;電動(dòng)汽車領(lǐng)域,在特斯拉將其代碼向全球開發(fā)者共享后,全世界范圍內(nèi)迸發(fā)出許多電動(dòng)車企業(yè),促進(jìn)了電動(dòng)車行業(yè)全球產(chǎn)業(yè)鏈的發(fā)展。開源也已成為云計(jì)算、大數(shù)據(jù)、人工智能、區(qū)塊鏈、元宇宙等新興領(lǐng)域的主要開發(fā)模式。
第二,開源能夠重塑產(chǎn)業(yè)生態(tài)。開源的項(xiàng)目能夠號召和匯聚全社會(huì)的力量對其做創(chuàng)新和迭代,從而超越產(chǎn)業(yè)中原來的優(yōu)勢者,有機(jī)會(huì)重新塑造產(chǎn)業(yè)生態(tài)。例如,在手機(jī)的移動(dòng)操作系統(tǒng)領(lǐng)域,安卓系統(tǒng)憑借開源的優(yōu)勢,快速迭代和擴(kuò)散,擊敗了塞班系統(tǒng),2013年全球裝機(jī)量就達(dá)到80%。
第三,開源能夠賦能經(jīng)濟(jì)發(fā)展。歐盟測算發(fā)現(xiàn),開源軟件的投資平均可帶來4倍回報(bào),開源貢獻(xiàn)者數(shù)量每增加10%,年度GDP將提高0.6%。
五、中國開發(fā)類Chat GPT大模型的問題和挑戰(zhàn)
Chat GPT的問世極大推動(dòng)了AI時(shí)代的發(fā)展,將給人類社會(huì)生活和生產(chǎn)帶來巨變。中國企業(yè)在大模型上也展現(xiàn)出極高的開發(fā)熱情,目前國內(nèi)至少已經(jīng)有30多家公司有大模型亮相,其中不乏參數(shù)規(guī)模甚至超過ChatGPT規(guī)模的大模型,涵蓋了互聯(lián)網(wǎng)巨頭、AI上市公司、服務(wù)器龍頭企業(yè)、科研院所與一些創(chuàng)業(yè)公司。
國內(nèi)AI大模型呈現(xiàn)出以下幾個(gè)技術(shù)特點(diǎn):
第一,采用預(yù)訓(xùn)練模型提高泛化能力。中國的大模型通常采用預(yù)訓(xùn)練模型,使用大量未標(biāo)注的數(shù)據(jù)對模型進(jìn)行訓(xùn)練,從而使得模型具有更好的泛化能力和適應(yīng)性。目前,BERT是最常用的預(yù)訓(xùn)練模型之一,不過也有其他模型如GPT-2、XLNet等。
第二,多任務(wù)學(xué)習(xí)方法,提高不同領(lǐng)域的效果。中國的大模型通常采用多任務(wù)學(xué)習(xí)方法,讓一個(gè)模型同時(shí)處理多個(gè)任務(wù)。這種方法可以使得模型能夠更好地學(xué)習(xí)不同領(lǐng)域的知識,從而提高模型的效率和準(zhǔn)確性。
第三,結(jié)合知識圖譜,增強(qiáng)理解能力。中國的大模型通常會(huì)結(jié)合知識圖譜進(jìn)行應(yīng)用,以增強(qiáng)模型的理解和推理能力。此外,有些模型還會(huì)引入實(shí)體鏈接、關(guān)系抽取等技術(shù),以更好地理解文本。
第四,建立訓(xùn)練平臺,訓(xùn)練規(guī)模大。中國的大模型通常需要大規(guī)模的訓(xùn)練數(shù)據(jù)和計(jì)算資源才能達(dá)到較好的效果。為此,一些企業(yè)和機(jī)構(gòu)建立了自己的訓(xùn)練平臺和超算中心,以支持大規(guī)模訓(xùn)練。
在模型的開源情況上,華為的盤古大模型、復(fù)旦大學(xué)的MOSS模型、商湯科技的書生2.5模型、鵬程系列的大模型、智譜GLM-130B模型等目前開源,而諸如百度的文心一言、阿里、騰訊、字節(jié)跳動(dòng)等互聯(lián)網(wǎng)大廠的大模型均未開源或未披露。
目前,中國大模型的發(fā)展存在諸多問題,這些問題不但影響大模型的發(fā)展,也不利于創(chuàng)新體系建設(shè)。
第一,科技企業(yè)“千模大戰(zhàn)”競爭激烈,商業(yè)利益降低開源意愿。各個(gè)科技公司只顧“自家門前雪”,關(guān)注商業(yè)利益,而抗拒加入開源生態(tài)。據(jù)有的開源基金會(huì)的調(diào)研,科技巨頭中僅有華為對開源大模型展現(xiàn)出興趣,其他大公司均以商業(yè)利益等緣由拒絕透露技術(shù)信息。這也導(dǎo)致各個(gè)公司存在模型重復(fù)開發(fā)、重復(fù)建設(shè)的問題,一家公司取得的突破難以惠及其他公司和開發(fā)者。
第二,大模型的開發(fā)能源消耗巨大,入場門檻高。大模型的訓(xùn)練依賴于大量的數(shù)據(jù)計(jì)算和超算體系。然而超算耗電量巨大,并且目前中國的超算體系效率比較低。盡管超級計(jì)算機(jī)的建設(shè)方興未艾,峰值理論算力達(dá)到了世界第一,但實(shí)際利用率不足。同時(shí),大模型訓(xùn)練所產(chǎn)生的能源消耗也給當(dāng)?shù)貛磔^大的環(huán)境壓力。
六、對開源生態(tài)和AI大模型發(fā)展的政策建議
第一,國家相關(guān)部門對開源生態(tài),以及開源生態(tài)對科技創(chuàng)新和塑造全球產(chǎn)業(yè)鏈的戰(zhàn)略意義提高認(rèn)識,做好開源生態(tài)的頂層設(shè)計(jì),加大力度培育科技創(chuàng)新的土壤。相關(guān)部門應(yīng)認(rèn)識到開源對于創(chuàng)新的重要性及開源開發(fā)模式所帶來的社會(huì)生產(chǎn)模式的改變。除了更好地發(fā)揮舉國體制集中力量辦大事以外,開源也是建設(shè)科技創(chuàng)新土壤的重點(diǎn),需要將開源生態(tài)的發(fā)展提到戰(zhàn)略高度,中央和地方統(tǒng)一步調(diào),致力于打造中國的開源生態(tài),提出行業(yè)標(biāo)準(zhǔn),保護(hù)和匯聚社會(huì)創(chuàng)新草根力量,爭取培育出中國版的OpenAI。
第二,在人工智能模型的開發(fā)上,鼓勵(lì)科技公司加入開源生態(tài),集合開源的力量,助力中國的類ChatGPT大模型的發(fā)展。人工智能大模型不僅僅是人類的工具和助手,更是人工智能時(shí)代新的操作系統(tǒng),是人工智能的底層架構(gòu)和基礎(chǔ)設(shè)施。中國必須發(fā)展出自己的大模型,要充分認(rèn)識其重要意義。同時(shí),要客觀、真實(shí)地分析影響企業(yè)開源的因素,在開源前,鼓勵(lì)各企業(yè)之間建立定期溝通交流機(jī)制,將開發(fā)技術(shù)的信息脫敏后充分交流,并且探討如何建立開源后的協(xié)同運(yùn)營管理機(jī)制。對于大模型的開發(fā),還應(yīng)當(dāng)進(jìn)行多維度的思考。借助開源社區(qū)和社會(huì)創(chuàng)新力量,積極探索其他的人工智能發(fā)展道路。大模型是否是通用人工智能發(fā)展的唯一正確的路徑,是否有更低能耗、更高效率的技術(shù)途徑,仍需要進(jìn)一步探索。例如,可以考慮從生物神經(jīng)網(wǎng)絡(luò)的認(rèn)知邏輯結(jié)構(gòu)入手,尋找更好的通用模型。
第三,積極培養(yǎng)開源人才,建設(shè)開源文化。推動(dòng)開源社區(qū)、開源基金會(huì)等機(jī)構(gòu)與高校、科技企業(yè)、研究院等機(jī)構(gòu)合作研究;舉辦全球性質(zhì)的開源大賽,選拔優(yōu)秀人才,展示創(chuàng)新成果,傳播普及開源理念,對青少年開展開源文化的教育,為推進(jìn)開源生態(tài)繁榮和可持續(xù)發(fā)展提供動(dòng)力和支撐。
第四,鼓勵(lì)地方政府為開源社區(qū)、開源機(jī)構(gòu)提供落地支持。地方政府為開源機(jī)構(gòu)提供包括辦公地點(diǎn)、資金支持、算力支持、知識產(chǎn)權(quán)優(yōu)惠政策、人才政策等支持,助力開源機(jī)構(gòu)提高自身核心競爭力,與開源機(jī)構(gòu)互助互利,合力建設(shè)中國特色的開源生態(tài)系統(tǒng),為科技創(chuàng)新和科技自立自強(qiáng)注入強(qiáng)大動(dòng)能。(作者單位:清華大學(xué)人工智能國際治理研究院)