開源和閉源一直是大模型發(fā)展中的重要議題,DeepSeek掀起的大模型“旋風(fēng)”更引起技術(shù)界對開閉源策略選擇的爭論,。開源和閉源各有什么優(yōu)劣,?如何理解開源大模型對人工智能發(fā)展的意義?
所謂“開源”,,指的是開放源代碼,,意味著開源軟件的源代碼任何人都可以審查、修改和增強,。DeepSeek便屬于開源大模型,;而與之相對的閉源軟件,只有創(chuàng)建者才具備修改權(quán)限,,像OpenAI旗下chatGPT的一系列模型就屬于閉源專有模型,。
發(fā)展大模型,選擇開源還是閉源,,本質(zhì)上是由企業(yè)的不同定位決定的,。選擇閉源的企業(yè)注重用專有技術(shù)換商業(yè)利潤,選擇開源的企業(yè)注重用技術(shù)擴散換生態(tài)影響,。
短期看,,閉源將大模型變成企業(yè)的一大盈利點,能夠保障企業(yè)在激烈的市場競爭中獲得利潤,。相比來說,,開源模式?jīng)]有明顯的盈利點,但也不意味著不能掙錢,。
在大數(shù)據(jù)時代,,信息和流量是最大的財富,相較專有閉源模型帶來直接的商業(yè)利潤,,以DeepSeek為代表的開源模型通過卓越性能+免費開源的低部署成本,,一躍成為人工智能時代的基礎(chǔ)設(shè)施,為未來發(fā)展帶來更多可能,。
同時,,開源大模型在凝聚全球開發(fā)者、建設(shè)智力共同體,、快速優(yōu)化模型能力,、本地化部署適配各類場景等各個方面具有閉源模型無可比擬的優(yōu)勢,更有潛力塑造行業(yè)標準,,營造出一個能夠源源不斷培育頂級科技產(chǎn)品的開放生態(tài),,同時也能通過云服務(wù)和硬軟件等各種方式創(chuàng)造出不輸于閉源模型的商業(yè)價值,。
我國擁有聯(lián)合國產(chǎn)業(yè)分類中所列全部工業(yè)門類,開源大模型賦能全產(chǎn)業(yè)鏈空間無限,。通過標準化,、模塊化的技術(shù)架構(gòu),大模型能夠打通產(chǎn)業(yè)鏈上下游,,形成協(xié)同創(chuàng)新的生態(tài)系統(tǒng),。
在硬件層,算力廠商基于開源模型的通用需求優(yōu)化芯片設(shè)計,;在數(shù)據(jù)層,,標注服務(wù)和語料庫建設(shè)因模型開源而標準化;在應(yīng)用層,,開發(fā)者可快速調(diào)用預(yù)訓(xùn)練模型開發(fā)垂直場景產(chǎn)品,,如智能客服、醫(yī)療影像分析等,。這種全鏈條的貫通效應(yīng),,使得技術(shù)創(chuàng)新能全方位轉(zhuǎn)化為經(jīng)濟社會效益,為高質(zhì)量發(fā)展注入持續(xù)動能,。
傳統(tǒng)閉源模式下,,算法、算力,、數(shù)據(jù)的“三重壟斷”將中小企業(yè)排斥在AI競爭之外,,一方面使得大模型賦能力度不足,另一方面也使得大模型缺少足夠的場景和用戶反饋,,制約其繼續(xù)創(chuàng)新,。
開源大模型通過“技術(shù)平權(quán)”重構(gòu)經(jīng)濟格局。低成本加卓越性能,,塑造了開源模型的高性價比,,直接使得大模型能夠全面賦能千行百業(yè)。這種開放生態(tài)形成了良性循環(huán)的“創(chuàng)新飛輪”:企業(yè)貢獻基礎(chǔ)模型,,學(xué)術(shù)界優(yōu)化算法,,開發(fā)者創(chuàng)造應(yīng)用,最終反哺模型迭代,。
技術(shù)路線從來不會十全十美,,開源模式也是如此。在發(fā)展開源大模型的過程中,,應(yīng)避免一些誤區(qū),。比如,開源并不等于忽視知識產(chǎn)權(quán),,應(yīng)加緊開源許可協(xié)議標準建設(shè),,為開源生態(tài)確立規(guī)范。開源策略公開代碼,,意味著安全風(fēng)險的暴露和強傳播性,,應(yīng)充分調(diào)動開源社區(qū)維護者、開源軟件開發(fā)者,、開源代碼使用者等受益于代碼開源的利益相關(guān)者的積極性,,形成多元可靠的安全管控網(wǎng)絡(luò),以去中心化的人人防控確保開源安全,。
自2017年7月國務(wù)院印發(fā)《新一代人工智能發(fā)展規(guī)劃》至今,,我國人工智能產(chǎn)業(yè)蓬勃發(fā)展。在其從大轉(zhuǎn)強的歷史發(fā)展進程中,,我國的人工智能需要一個能充分激發(fā)技術(shù)創(chuàng)造力和生產(chǎn)力的新生態(tài),,而開源正是打造新生態(tài)的有力“武器”。(本文來源:經(jīng)濟日報 作者:鐘梓濱)