(網(wǎng)經(jīng)社訊)尖端AI推理模型DeepSeek R1一經(jīng)問世,便在整個(gè)科技行業(yè)引起波瀾。因其性能能夠 媲美甚至超越先進(jìn)的同類模型,顛覆了關(guān)于AI發(fā)展的傳統(tǒng)認(rèn)知。 這一關(guān)鍵時(shí)刻是更廣泛趨勢(shì)的一部分,凸顯了行業(yè)在打造高質(zhì)量小語言模型和多模態(tài)推 理模型方面的創(chuàng)新,以及這些創(chuàng)新正在為AI的商用應(yīng)用和終端側(cè)推理落地做好準(zhǔn)備。這些新模型能夠在終端側(cè)運(yùn)行,將加速強(qiáng)大邊緣側(cè)芯片的規(guī)?;瘮U(kuò)展,并創(chuàng)造對(duì)此類芯片 的需求。
四大趨勢(shì)正在顯著提高目前可在終端側(cè)運(yùn)行的AI模型的質(zhì)量、性能和效率,從而推 動(dòng)上述變革:
當(dāng)前先進(jìn)的AI小模型已具有卓越性能。模型蒸餾和新穎的AI網(wǎng)絡(luò)架構(gòu)等新技 術(shù)能夠在不影響質(zhì)量的情況下簡(jiǎn)化開發(fā)流程,讓新模型的表現(xiàn)超越一年前 推出的僅能在云端運(yùn)行的更大模型。
模型參數(shù)規(guī)模正在快速縮小。先進(jìn)的量化和剪枝技術(shù)使開發(fā)者能夠在不對(duì)準(zhǔn) 確性產(chǎn)生實(shí)質(zhì)影響的情況下,縮小模型參數(shù)規(guī)模。
開發(fā)者能夠在邊緣側(cè)打造更豐富的應(yīng)用。高質(zhì)量AI模型快速激增,意味 著文本摘要、編程助手和實(shí)時(shí)翻譯等特性在智能手機(jī)等終端上的普及, 讓AI能夠支持跨邊緣側(cè)規(guī)?;渴鸬纳逃脩?yīng)用。
AI正在成為新的UI。個(gè)性化多模態(tài)AI智能體將簡(jiǎn)化交互,高效地跨越各種應(yīng) 用完成任務(wù)。
高通技術(shù)公司在引領(lǐng)并利用從AI訓(xùn)練向大規(guī)模推理轉(zhuǎn)型,以及AI計(jì)算處理從云端向邊 緣側(cè)擴(kuò)展方面具有戰(zhàn)略優(yōu)勢(shì)。公司在開發(fā)定制CPU、NPU、GPU和低功耗子系統(tǒng)領(lǐng) 域取得了廣泛的成就。通過與模型廠商展開合作,以及面向跨不同邊緣終端領(lǐng)域的 模型部署提供工具、框架和SDK,高通技術(shù)公司賦能開發(fā)者在邊緣側(cè)加速采用AI智能 體和應(yīng)用。
近期對(duì)AI模型訓(xùn)練方式的顛覆變革和重新評(píng)估驗(yàn)證了AI格局即將向大規(guī)模推理轉(zhuǎn)變的 趨勢(shì),這將形成全新邊緣側(cè)推理計(jì)算的創(chuàng)新和升級(jí)周期。盡管模型訓(xùn)練仍將在云端 進(jìn)行,但推理將受益于采用高通?技術(shù)的廣泛終端規(guī)模,并催生更多邊緣側(cè)AI賦能處 理器的需求。