(網(wǎng)經(jīng)社訊)9月25日,2024百度云智大會(huì)在北京中關(guān)村國(guó)際創(chuàng)新中心舉行。會(huì)上,百度集團(tuán)執(zhí)行副總裁、百度智能云事業(yè)群總裁沈抖圍繞算力、模型、應(yīng)用三個(gè)話題,與行業(yè)專家、企業(yè)領(lǐng)袖和技術(shù)極客,共同探討如何在新一輪技術(shù)變革中更好搶抓機(jī)遇、實(shí)現(xiàn)智能躍升。
沈抖表示,過(guò)去一年是大模型從技術(shù)變革走向產(chǎn)業(yè)變革的關(guān)鍵一年,而大模型和云計(jì)算緊密結(jié)合,正在成為新型的基礎(chǔ)設(shè)施。我們知道,在歷史上這樣大范圍的基礎(chǔ)設(shè)施升級(jí)并不多,但每次升級(jí)都能帶來(lái)生產(chǎn)力的巨大躍遷,而且一次比一次速度更快、影響更大。
圍繞大模型算力方面,沈抖表示,提到算力,不少人都聽(tīng)說(shuō)過(guò)“萬(wàn)卡集群”,簡(jiǎn)單來(lái)說(shuō),GPU集群有三個(gè)特征:極致規(guī)模、極致高密和極致互聯(lián)。
而這些“極致”帶來(lái)了幾個(gè)嚴(yán)峻的挑戰(zhàn)。沈抖介紹,首先是巨額的建設(shè)、運(yùn)營(yíng)成本,建一個(gè)萬(wàn)卡集群,單是GPU的采購(gòu)成本就高達(dá)幾十億元。其次,在這么大規(guī)模的集群上,運(yùn)維的復(fù)雜性急劇增加。他談到,硬件不可避免地會(huì)出故障,而規(guī)模越大,出故障的概率就越高?!癕eta訓(xùn)練Llama3的時(shí)候,用了1.6萬(wàn)張GPU卡的集群,平均每3小時(shí)就會(huì)出一次故障?!?/p>
據(jù)網(wǎng)經(jīng)社云計(jì)算臺(tái)(CC.100EC.CN)獲悉,百度智能云同時(shí)公布了千帆大模型平臺(tái)的最新“成績(jī)單”,在千帆大模型平臺(tái)上,文心大模型日均調(diào)用量超過(guò)7億次,累計(jì)幫助用戶精調(diào)了3萬(wàn)個(gè)大模型,開(kāi)發(fā)出70多萬(wàn)個(gè)企業(yè)級(jí)應(yīng)用。過(guò)去一年,文心旗艦大模型降價(jià)幅度超過(guò)90%。