(網(wǎng)經(jīng)社訊)尖端AI推理模型DeepSeek R1一經(jīng)問世,便在整個科技行業(yè)引起波瀾。因其性能能夠 媲美甚至超越先進的同類模型,顛覆了關于AI發(fā)展的傳統(tǒng)認知。 這一關鍵時刻是更廣泛趨勢的一部分,凸顯了行業(yè)在打造高質量小語言模型和多模態(tài)推 理模型方面的創(chuàng)新,以及這些創(chuàng)新正在為AI的商用應用和終端側推理落地做好準備。這些新模型能夠在終端側運行,將加速強大邊緣側芯片的規(guī)模化擴展,并創(chuàng)造對此類芯片 的需求。
四大趨勢正在顯著提高目前可在終端側運行的AI模型的質量、性能和效率,從而推 動上述變革:
當前先進的AI小模型已具有卓越性能。模型蒸餾和新穎的AI網(wǎng)絡架構等新技 術能夠在不影響質量的情況下簡化開發(fā)流程,讓新模型的表現(xiàn)超越一年前 推出的僅能在云端運行的更大模型。
模型參數(shù)規(guī)模正在快速縮小。先進的量化和剪枝技術使開發(fā)者能夠在不對準 確性產(chǎn)生實質影響的情況下,縮小模型參數(shù)規(guī)模。
開發(fā)者能夠在邊緣側打造更豐富的應用。高質量AI模型快速激增,意味 著文本摘要、編程助手和實時翻譯等特性在智能手機等終端上的普及, 讓AI能夠支持跨邊緣側規(guī)?;渴鸬纳逃脩?。
AI正在成為新的UI。個性化多模態(tài)AI智能體將簡化交互,高效地跨越各種應 用完成任務。
高通技術公司在引領并利用從AI訓練向大規(guī)模推理轉型,以及AI計算處理從云端向邊 緣側擴展方面具有戰(zhàn)略優(yōu)勢。公司在開發(fā)定制CPU、NPU、GPU和低功耗子系統(tǒng)領 域取得了廣泛的成就。通過與模型廠商展開合作,以及面向跨不同邊緣終端領域的 模型部署提供工具、框架和SDK,高通技術公司賦能開發(fā)者在邊緣側加速采用AI智能 體和應用。
近期對AI模型訓練方式的顛覆變革和重新評估驗證了AI格局即將向大規(guī)模推理轉變的 趨勢,這將形成全新邊緣側推理計算的創(chuàng)新和升級周期。盡管模型訓練仍將在云端 進行,但推理將受益于采用高通?技術的廣泛終端規(guī)模,并催生更多邊緣側AI賦能處 理器的需求。