(網(wǎng)經(jīng)社訊)01 產(chǎn)業(yè)鏈全景圖
02 AI大模型簡介
02-1 什么是AI大模型?
大模型是擁有超大規(guī)模參數(shù)(通常在十億個以上)、復(fù)雜計算結(jié)構(gòu)的機器學(xué)習(xí)模型,能夠處理海量數(shù)據(jù),完成各種復(fù)雜任務(wù),如自然語言處理、圖像識別等。
02-2 AI大模型的三大特征
02-3 AI大模型類型分析
02-4 算力承接算法及數(shù)據(jù),成為AI產(chǎn)業(yè)發(fā)展基石
在現(xiàn)代人工智能領(lǐng)域,算力扮演著推動創(chuàng)新、實現(xiàn)突破的核心驅(qū)動力。算力、算法、數(shù)據(jù)和系統(tǒng)架構(gòu)等多個方面的綜合優(yōu)化對于大規(guī)模模型訓(xùn)練的成功至關(guān)重要。從技術(shù)層面看,在大模型的研發(fā)過程中,預(yù)訓(xùn)練、微調(diào)和模型推理等環(huán)節(jié)是核心關(guān)鍵因素和主要計算特征。
03 上游產(chǎn)業(yè)鏈:算力、算法、數(shù)據(jù)
03-1 算力:驅(qū)動智能的引擎
AI 大模型拉動算力需求:預(yù)計2025 年,AI 大模型的算力需求將達2020 年 10倍,超 50% 源于企業(yè)AI 應(yīng)用。
AI 芯片市場格局與國產(chǎn)趨勢:NVIDIA 占據(jù)全球高性能AI 芯片超80% 市場,A100/H100 供不應(yīng)求,價格漲約3 倍。華為昇騰、寒武紀(jì)、壁仞科技等中國廠商加速自研,預(yù)計2025 年國內(nèi)AI 芯片市場份額升至30%。
云計算廠商的AI 算力競爭:2023年全球 AI云算力市場規(guī)模 640億美元,AWS、Azure、Google Cloud 占超70% 份額。阿里云、華為云、騰訊云等中國云廠商加速布局,阿里云計劃未來三年投524 億美元擴充AI 算力。
AI算力服務(wù)商市場變化:產(chǎn)品及服務(wù)復(fù)雜性提升,推動市場多樣性發(fā)展
03-2 算法:塑造思維的框架
算法是AI 大模型的核心要素,涵蓋深度學(xué)習(xí)框架與優(yōu)化策略。
Transformer 影響:2017 年Google 提出的Transformer 架構(gòu),掀起AI 大模型革命,成為技術(shù)基石,相較傳統(tǒng)RNN,計算效率提升超10 倍。
算法優(yōu)化與算力成本降低:AI 訓(xùn)練成本高昂,GPT - 4 訓(xùn)練成本估算超1 億美元。稀疏化、蒸餾、量化等新技術(shù)可使訓(xùn)練成本降低30% - 50%。
開源與專有模型競爭態(tài)勢:
前沿算法發(fā)展動態(tài) :2023 年多模態(tài)大模型(如GPT - 4V、Gemini)打破文本局限,可處理圖像、音頻、視頻等多種數(shù)據(jù)類型。強化學(xué)習(xí)(RLHF)優(yōu)化AI 交互能力,提升用戶體驗。
算法的“從技術(shù)到應(yīng)用”:
數(shù)字經(jīng)濟時代迎來了數(shù)據(jù)的爆炸式增長,隨著大數(shù)據(jù)、云計算、人工智能等新型信息技術(shù)的加速發(fā)展及規(guī)?;瘧?yīng)用,數(shù)據(jù)的價值和地位不斷提升,已經(jīng)成為推動經(jīng)濟社會高質(zhì)量發(fā)展的新型關(guān)鍵生產(chǎn)要素、重塑全球經(jīng)濟結(jié)構(gòu)、改變?nèi)蚋偁幐窬值年P(guān)鍵力量。
2024 年1 月,國家數(shù)據(jù)局發(fā)布《“數(shù)據(jù)要素X”三年行動計劃(2024-2026 年)》,以政務(wù)、金融、互聯(lián)網(wǎng)、交電為代表的行業(yè)持續(xù)深化數(shù)據(jù)要素的發(fā)展與應(yīng)用,艾瑞咨詢預(yù)計 2024 年全年市場規(guī)模將達 1662.0 億元,2025 年市場規(guī)模將有望達 2042.9 億元。
從產(chǎn)業(yè)鏈價值環(huán)節(jié)傳導(dǎo)角度出發(fā),數(shù)據(jù)要素產(chǎn)業(yè)鏈分為數(shù)據(jù)資源要素化、市場化流通與數(shù)據(jù)要素應(yīng)用,這三大環(huán)節(jié)。首先,從數(shù)據(jù)采集歸類加工,管理后形成資產(chǎn),再加工為產(chǎn)品,完成數(shù)據(jù)資源要素化;再者,通過掛牌上市,或者場外交易的方式觸達各行業(yè)需求者并投入應(yīng)用。其中,再市場化流通這一環(huán)節(jié)當(dāng)中,也會有第三方服務(wù)機構(gòu),提供相應(yīng)地咨詢審計、評估與仲裁等服務(wù),更好地推進數(shù)據(jù)資源化到應(yīng)用這一過程的轉(zhuǎn)化,所牽扯的參與方多元且類別復(fù)雜,價值共創(chuàng)屬性十分突出。
03-3 數(shù)據(jù):訓(xùn)練模型的燃料數(shù)據(jù)是AI大模型的基礎(chǔ)資源,涵蓋高質(zhì)量數(shù)據(jù)集與標(biāo)注信息。
數(shù)據(jù)質(zhì)量直接影響模型表現(xiàn):“Garbage In, Garbage Out”。根據(jù)研究,90% 的AI模型表現(xiàn)問題來源于不良數(shù)據(jù)質(zhì)量,而非模型架構(gòu)。
多樣化的數(shù)據(jù)源提升模型的普適性:GPT-4結(jié)合文本與圖像數(shù)據(jù);Google的PaLM2模型集成了文本、圖像、音頻等多模態(tài)數(shù)據(jù),使其在多任務(wù)下表現(xiàn)更好。
前沿算法發(fā)展動態(tài) :AI技術(shù)本身也可以用來加速數(shù)據(jù)清洗和預(yù)處理,例如自監(jiān)督學(xué)習(xí)、異常值檢測和自動標(biāo)注技術(shù)。如,NLP領(lǐng)域常用的Tokenization和Embeddings
04 中游產(chǎn)業(yè)鏈:“百模大戰(zhàn)”
04-1 國際AI大模型對比
04-2 國內(nèi)AI大模型對比
05 下游產(chǎn)業(yè)鏈:AI + …… = ∞
05-1 AI 市場高景氣,大模型下游行業(yè)需求旺盛,應(yīng)用場景豐富2022年中國人工智能行業(yè)市場規(guī)模為3,716億人民幣,預(yù)計2027年市場規(guī)模將達到15,372億人民幣有望在下游制造、交通、金融、醫(yī)療等更多領(lǐng)域不斷滲透,實現(xiàn)大規(guī)模落地應(yīng)用
05-2 AI + 醫(yī)療
人工智能在醫(yī)療行業(yè)的應(yīng)用將帶來顛覆性變革,通過技術(shù)創(chuàng)新改變供給端和醫(yī)療工作流程,提高效率并催生增量市場。醫(yī)療資源供需矛盾突出,是推動人工智能醫(yī)療發(fā)展的主要驅(qū)動力,需求端因人口老齡化和健康意識提升而增長,供給端因資源不足和分布不均而難以滿足需求。人工智能在醫(yī)療影像、輔助診斷、新藥研發(fā)和健康管理等方向有廣泛應(yīng)用,其中醫(yī)療影像是成熟細(xì)分領(lǐng)域,手術(shù)機器人在輔助診斷中活躍,人工智能算法和算力優(yōu)勢助力新藥研發(fā),健康管理領(lǐng)域應(yīng)用廣泛。
05-3 AI + 金融
由于金融機構(gòu)往往具有信息安全要求高、數(shù)據(jù)處理量大且信息基礎(chǔ)設(shè)施建設(shè)較為完善的特征,人工智能技術(shù)得以較早在金融領(lǐng)域營銷、合規(guī)、風(fēng)控等多元化場景實現(xiàn)落地應(yīng)用并得到長足發(fā)展。
05-4 AI + 物流
06 發(fā)展趨勢
06-1 技術(shù)深化與融合多模態(tài)融合加速:未來AI大模型將更加注重多模態(tài)能力的融合,如文本、圖像、音頻、視頻等,以實現(xiàn)更豐富的應(yīng)用場景和更強大的交互能力。強化學(xué)習(xí)與人類反饋的結(jié)合:通過強化學(xué)習(xí)(RLHF)和人類反饋優(yōu)化,AI大模型將不斷提升交互能力和任務(wù)執(zhí)行的準(zhǔn)確性,進一步縮小與人類智能的差距。算法優(yōu)化與效率提升:稀疏化、量化、模型壓縮等技術(shù)將不斷優(yōu)化,降低訓(xùn)練和推理成本,提高模型運行效率,推動AI大模型的普及化。
06-2 產(chǎn)業(yè)生態(tài)與商業(yè)模式變革MaaS模式興起:Model as a Service(MaaS)將成為主流商業(yè)模式,通過API接口提供大模型服務(wù),降低開發(fā)門檻,激發(fā)新的產(chǎn)業(yè)鏈分工和商業(yè)模式。生態(tài)開放性競爭加?。簭S商將更加注重生態(tài)開放性,通過開源模型、開放基礎(chǔ)設(shè)施、合作開發(fā)等方式,構(gòu)建更廣泛的生態(tài)系統(tǒng),提升競爭力。行業(yè)大模型定制化:針對金融、醫(yī)療、教育、工業(yè)等垂直領(lǐng)域的行業(yè)大模型將不斷涌現(xiàn),滿足特定行業(yè)的深度需求,推動AI技術(shù)在更多領(lǐng)域的落地。
06-3 政策和倫理挑戰(zhàn)政策監(jiān)管加強:隨著AI大模型的廣泛應(yīng)用,政府將加強對生成式AI、數(shù)據(jù)隱私、算法倫理等方面的監(jiān)管,推動行業(yè)健康發(fā)展。倫理與可持續(xù)發(fā)展:廠商將更加注重AI技術(shù)的倫理合規(guī)性,推動AI技術(shù)的可持續(xù)發(fā)展,確保技術(shù)應(yīng)用符合人類價值觀和社會利益。數(shù)據(jù)安全與隱私保護:數(shù)據(jù)作為AI大模型的核心資源,其安全性和隱私保護將成為未來發(fā)展的重要挑戰(zhàn),廠商需要加強數(shù)據(jù)管理和安全技術(shù)的研發(fā)。