(網(wǎng)經(jīng)社訊)3月27日消息,阿里通義千問與DeepSeek均于25日低調(diào)開源了兩款新模型。阿里發(fā)布了更適合本地部署的高性能“多模態(tài)模型”Qwen2.5-VL-32B,DeepSeek則將此前熱門的“基座模型”V3更新到0324版本,并官宣在魔搭社區(qū)上架開源。截至目前,魔搭社區(qū)模型總數(shù)已超4萬(wàn)個(gè),已成為中國(guó)最大的AI開源社區(qū)。
技術(shù)亮點(diǎn):從多模態(tài)到基座模型優(yōu)化
據(jù)網(wǎng)經(jīng)社云計(jì)算臺(tái)(CC.100EC.CN)查詢DeepSeek后獲悉,阿里此次開源的Qwen2.5-VL-32B是通義千問系列的多模態(tài)版本,突出“高性能”和“本地部署”特性。其32B參數(shù)量在視覺-語(yǔ)言聯(lián)合任務(wù)(如圖文理解、生成)中可能具備更強(qiáng)的泛化能力,而優(yōu)化后的推理效率則降低了企業(yè)私有化部署的門檻。這延續(xù)了阿里從Qwen-72B到1.8B小模型的梯度化開源策略,覆蓋從云端到邊緣計(jì)算的全場(chǎng)景需求。
DeepSeek的升級(jí)版V3-0324則是對(duì)此前基座模型的針對(duì)性優(yōu)化。作為一款純文本大模型,DeepSeek-V3憑借長(zhǎng)上下文支持(128K)和強(qiáng)代碼能力已在開發(fā)者中積累口碑,此次更新可能進(jìn)一步提升了邏輯推理或垂直領(lǐng)域適配性。其選擇魔搭社區(qū)作為首發(fā)平臺(tái),也凸顯了開源社區(qū)在模型分發(fā)中的核心地位。
開源生態(tài):魔搭社區(qū)成關(guān)鍵基礎(chǔ)設(shè)施
兩家團(tuán)隊(duì)均將魔搭社區(qū)作為重要發(fā)布渠道,反映出該平臺(tái)已是中國(guó)AI開源的核心樞紐。據(jù)官方數(shù)據(jù),魔搭模型總量超4萬(wàn)個(gè),涵蓋NLP、CV、語(yǔ)音等多領(lǐng)域,其意義不僅在于資源聚合,更在于提供了標(biāo)準(zhǔn)化的工具鏈(如ModelScope)、算力支持和協(xié)作機(jī)制,極大降低了開發(fā)者的試錯(cuò)成本。
這種“廠商開源+社區(qū)運(yùn)營(yíng)”的模式,正在形成與美國(guó)Hugging Face分庭抗禮的中國(guó)特色路徑。廠商通過開源獲取生態(tài)影響力,社區(qū)則推動(dòng)技術(shù)落地反哺創(chuàng)新,形成正向循環(huán)。
行業(yè)影響:開源競(jìng)爭(zhēng)進(jìn)入深水區(qū)
此次更新傳遞出兩個(gè)信號(hào):
1. 技術(shù)差異化:阿里側(cè)重多模態(tài)與部署友好性,DeepSeek深耕文本基座模型,反映開源策略從“通用模型”向“垂直場(chǎng)景”細(xì)化。
2. 生態(tài)協(xié)同:頭部團(tuán)隊(duì)與開源社區(qū)的深度綁定,加速了技術(shù)下沉。中小廠商可基于這些模型二次開發(fā),避免重復(fù)造輪子。
未來,中國(guó)開源生態(tài)的競(jìng)爭(zhēng)將不僅限于模型性能,更在于工具鏈完善度、商業(yè)化案例落地以及社區(qū)活躍度。隨著更多玩家加入,開源或?qū)⒊蔀锳I技術(shù)民主化的關(guān)鍵推手。