(網(wǎng)經(jīng)社訊)1月22日消息,網(wǎng)易有道正式推出國內(nèi)首個輸出分步式講解的推理模型“子曰-o1”。這款14B參數(shù)規(guī)模的輕量級單模型能夠在消費級顯卡上部署,特別適合教育領(lǐng)域的應(yīng)用。作為一款專注于思維鏈技術(shù)的模型,子曰-o1能夠提供細(xì)致的解題過程,模擬人類的思考方式,通過自言自語和自我糾錯的方式逐步推導(dǎo)出最終答案。
子曰-o1的設(shè)計理念在于解決當(dāng)前大模型在低顯存設(shè)備上運行不穩(wěn)定的問題。盡管其參數(shù)規(guī)模較小,但該模型依然能夠?qū)崿F(xiàn)高質(zhì)量的推理能力,與云端部署的質(zhì)量相媲美。這使得它不僅可以在消費級硬件上流暢運行,還能提供與大型模型相當(dāng)?shù)慕忸}準(zhǔn)確性和邏輯推理能力。
作為一個教育垂類模型,子曰-o1的特性使其非常適合應(yīng)用于教育產(chǎn)品中。它通過清晰呈現(xiàn)有條理的解題過程,以啟發(fā)式講解引導(dǎo)學(xué)生提升自主思考能力。例如,在解題過程中,子曰-o1會形成較長的思維鏈條,使解題思路更接近于人類的思考模式,并通過詳細(xì)的步驟展示,幫助學(xué)生理解每一步驟的邏輯。
此外,為了進(jìn)一步優(yōu)化教育場景的應(yīng)用效果,子曰-o1從數(shù)據(jù)篩選到訓(xùn)練指令等多個方面進(jìn)行了改進(jìn)?;谟械蓝嗄陙碓诮逃I(lǐng)域的數(shù)據(jù)資源積累,該模型使用了大量的教育領(lǐng)域?qū)W生試卷習(xí)題作為訓(xùn)練樣本,從而提升了其在教育場景中的準(zhǔn)確性。目前,子曰-o1已在“有道小P”中落地應(yīng)用,支持其實現(xiàn)先提供解析思路再提供答案的答疑過程,引導(dǎo)學(xué)生主動思考并自主解決問題,真正將知識學(xué)透。
總的來說,子曰-o1憑借其輕量化設(shè)計、分步式講解以及中文邏輯推理等優(yōu)勢,能夠以較低的落地門檻撬動更高的應(yīng)用價值,為相關(guān)開發(fā)者提供了一個實用高效的工具。隨著推理模型賽道的不斷擴(kuò)大,子曰-o1將作為起點,持續(xù)釋放其在教育領(lǐng)域內(nèi)的應(yīng)用潛力。堅持“場景為先”的理念,子曰-o1已經(jīng)擁有較通用大模型更為專業(yè)的預(yù)訓(xùn)練語料,可以根據(jù)用戶在學(xué)習(xí)場景下的需求,幫助用戶答疑解惑。