(網(wǎng)經(jīng)社訊)
目錄
01. 概覽
02. 文本
03. 圖像
04. 視頻
05. 音頻
06. 數(shù)字人
07. 游戲
08. 綜合
09. 模型&算法
10. 報告申明
概覽
2022年12月發(fā)布的大型語言生成模型ChatGPT,以其強大的信息整合和語言創(chuàng)作能力驚艷了世界,能夠勝任對話聊天、小說和劇本構思等多個場景。在北密歇根大學的一門課程論文評分時,用ChatGPT撰寫的論文得到了最高等級的A+評分,并被教授評為“全班最好的論文”。
在我們上個月發(fā)布的《行業(yè)洞察 | 萬字長文解讀AIGC如何革命性提效內(nèi)容營銷》中已經(jīng)對AIGC對內(nèi)容營銷的影響有了基本的介紹,本篇主要針對中國市場對國內(nèi)正在做AIGC的相關企業(yè)展開介紹。
目前AIGC主要運用在文字、圖像、視頻、音頻、游戲以及虛擬人等方面。簡單的說,用戶只需要輸入一段對文章的描述或要求,類似于大學課堂上教授布置論文時的要求,系統(tǒng)就能根據(jù)指令進行創(chuàng)作;輸入對藝術繪畫作品的文字描述,比如“星空下的大海,遠處的波浪像籠罩著一層層白霧慢慢向海邊靠近”,系統(tǒng)就能自動生成一張繪畫作品。
△賣出300萬的全球第一幅AI畫作(由GAN創(chuàng)作自2018年)
所謂AIGC,英文全稱是AI Generated Content,指的是利用人工智能來生產(chǎn)內(nèi)容,其中AI是人工智能的簡稱,GC則是創(chuàng)作內(nèi)容。
同傳統(tǒng)意義上的AI相比,AIGC變聰明了。畢竟創(chuàng)造力是人類非常特別的能力,但當人們發(fā)現(xiàn)AIGC有創(chuàng)造力的時候非常震驚,未來AIGC將是人工智能發(fā)展的新方向。在AIGC 相關技術爆發(fā)的同時,其商業(yè)化速度同樣驚人,文字生成公司Copy.ai 僅用兩年時間 ARR 就突破 了千萬美金,這非常像移動互聯(lián)網(wǎng)早期,全新的商業(yè)模式在不斷涌現(xiàn)并快速被市場驗證后,能夠更快的迭代,尋求突破。
△圖表來源:量子位,《AIGC/AI生成內(nèi)容產(chǎn)業(yè)展望報告》
AI絕不是真的在一夜間變得無所不能,算法、模型、框架的迭代凝結著無數(shù)從業(yè)者的心血,無論是科技大廠,還是初創(chuàng)企業(yè),始終要在最前沿的科技領域保持前瞻的視野和敏銳的判斷,才有可能把握住市場機遇,而背后日復一日的數(shù)據(jù)積累,更是產(chǎn)品能夠在差異化的需求中勝出的基礎。
眾多從業(yè)者也紛紛表示:AIGC將會是AI的下一波浪潮,第一代AI更多應用在分析、識別領域,而AIGC實現(xiàn)了重大突破,它讓AI有創(chuàng)造內(nèi)容的能力,是全新的革命。
△圖表來源:量子位,《AIGC/AI生成內(nèi)容產(chǎn)業(yè)展望報告》
越早擁抱變化,才能越早享受到技術變革所帶來的紅利。AIGC幫助各行各業(yè)的內(nèi)容創(chuàng)作者們打破自身能力的局限性,更好將自己的想法、創(chuàng)意變成現(xiàn)實。
文本
目前AIGC的發(fā)展,可以以較人工更高效的技術路徑,實現(xiàn)個性化文本、圖像的生成需求,對規(guī)?;瘍?nèi)容的生產(chǎn)有較大沖擊,特別是對初級、通用形內(nèi)容生產(chǎn)者,具有取代性?,F(xiàn)在圖像、文本人工智能內(nèi)容生成技術,基本可以實現(xiàn)快速生成高質(zhì)量的營銷內(nèi)容。
聆心智能
聆心智能是一家超擬人底層大模型研發(fā)商,致力于打造“超擬人底層大模型”,核心技術是具有可控、可配置、擬人特點的LLM,通過簡單設置即可構造一個有知識、有個性、有風格的類人智能體。聆心智能的愿景是創(chuàng)造AGI(通用人工智能)時代的類人智能體,使得AI Companion進入人類生活的所有角落,科技向善為人類謀福祉始終是聆心智能的目標。
聆心智能孵化自清華大學計算機系,創(chuàng)始人黃民烈教授是自然語言生成領域知名教授。團隊核心成員均來自于清華大學、卡內(nèi)基梅隆大學、谷歌等國內(nèi)外頂尖高校及公司,具有豐富的商業(yè)化經(jīng)驗,一直以來,在大模型和對話系統(tǒng)的開發(fā)與應用領域中處于行業(yè)領先位置。
作為AI心理賽道中自然語言處理(NLP,Natural Language Processing)基因領先的創(chuàng)業(yè)團隊之一,聆心智能已開發(fā)了心理咨詢及朋輩支持服務線上平臺聆心悠然,可為不同需求層次的用戶提供服務。
瀾舟科技
瀾舟科技是一家認知智能公司,針對商業(yè)場景數(shù)字化轉(zhuǎn)型、以自然語言處理為基礎提供商業(yè)洞見類產(chǎn)品,主要產(chǎn)品包括基于預訓練模型的功能引擎(包括搜索、生成、翻譯、對話等)和針對垂直行業(yè)場景的 SaaS 產(chǎn)品。
公司創(chuàng)始人周明是世界頂級的 AI 科學家,自然語言處理領域的代表性人物。
【熊貓小說家】小程序是瀾舟科技首個 AIGC 方向的 C 端用戶產(chǎn)品,通過技術領先的語言生成模型,快速將用戶的日常生活變成小說情節(jié)。
△圖片來源:瀾舟科技官網(wǎng)
倚瀾科技
倚瀾科技成立于2021年6月,致力于沉浸式數(shù)字內(nèi)容和實時3D引擎兩大核心業(yè)務,為超寫實虛擬化身CG內(nèi)容創(chuàng)作、實時交互等場景提供技術解決方案和平臺化技術服務,通過科技創(chuàng)新,改變數(shù)字內(nèi)容生產(chǎn)方式。
22年11月,倚瀾科技在線上發(fā)布會上公布了Meta Conference、Meta Streaming兩套元宇宙場景解決方案,分別對應兩套產(chǎn)品MetaC系統(tǒng)與MetaS系統(tǒng)。
Meta Conference 是一款提供給線下會議、論壇使用的擴展現(xiàn)實會議工具。該系統(tǒng)首創(chuàng)XR空間互動模式,讓每一位演講者在論壇現(xiàn)場就能輕松創(chuàng)觸摸科技前沿,結合實際場景與虛擬場景創(chuàng)造元宇宙會議空間,打通由虛向?qū)?、由實向虛的雙向通道,實現(xiàn)科技魅力和互動體驗的飛躍。
而Meta Streaming 是直播行業(yè)提供的一款智能便捷的擴展現(xiàn)實直播工具。該系統(tǒng)首創(chuàng)輕量高精AR模式,讓每一位創(chuàng)作者和品牌主都能夠以極低的成本和極簡的方式,實現(xiàn)真實和虛擬的人、物品、空間進行虛實結合來增強直播互動,為主播和直播用戶創(chuàng)造沉浸式的直播體驗。
彩云小夢
彩云小夢是一款AI寫書軟件。你可以通過給出一些基本的世界設定,讓你的彩云AI圍繞故事主題去進行聯(lián)想創(chuàng)作。彩云小夢由彩云科技出品,因為有了彩云天氣和彩云小譯這兩款成功產(chǎn)品的開發(fā)運營經(jīng)驗,彩云小夢自身研發(fā)素質(zhì)過硬,曾風靡B站創(chuàng)作圈。
彩云小夢創(chuàng)始人兼 CEO 袁行遠在訪談中說道:「就像游戲讓我們體驗各種光怪陸離的世界,看電影是對生命的延長。人只能活一輩子,這是很遺憾的,但電影、小說都是讓我們體驗不一樣的人生。而現(xiàn)在有 AI 技術,可以讓你更沉浸式的體驗,不僅可以閱讀基督山伯爵,也可以扮演基督山伯爵,而且是自由的扮演。它也是對生命的延長,以前所未有的一種形式?!?/span>
△在b站火爆一時的AI續(xù)寫
必優(yōu)科技
智能寫作SDK服務平臺,致力于為企業(yè)提供場景化內(nèi)容創(chuàng)作解決方案和通用內(nèi)容創(chuàng)作SDK服務,打造一站式內(nèi)容創(chuàng)作應用。必優(yōu)科技已在智能簡歷方面,搭建了AI在線輔寫簡歷平臺——YOO簡歷。
選擇簡歷作為智能寫作的應用場景,原因在于簡歷常被視為低頻場景,但事實上市場空間很廣。而目前市場上,大多智能簡歷以提供模板為主,難以起到內(nèi)容優(yōu)化的作用,因此用戶較為容易認可內(nèi)容優(yōu)化的商業(yè)價值。
基于以上問題,必優(yōu)科技首先通過大量AI訓練,明確企業(yè)關注的核心內(nèi)容與板塊,以此來引導用戶完成簡歷內(nèi)容。其次,通過分析投遞崗位,提煉出關鍵信息。最后,是將內(nèi)容潤色,通過將口語化等內(nèi)容轉(zhuǎn)為職業(yè)化表達,優(yōu)化用戶的內(nèi)容價值。
YOO簡歷能夠?qū)崿F(xiàn)AI輔寫,關鍵在于底層的韋尼克框架(Wernicke)。韋尼克框架是由必優(yōu)科技自主研發(fā)的智能寫作引擎,基于其自研的深度學習模型WCCG(Wernicke Control Content Generate)架構生成。
KAWO 科握
社交媒體管理服務商「KAWO 科握」,成立于2017年,是一家為品牌或市場營銷機構提供一站式社交媒體管理的平臺,也是國內(nèi)首家提供標準化SaaS服務的社交媒體協(xié)同管理平臺。
「KAWO」為品牌提供了統(tǒng)一的協(xié)作平臺,使得內(nèi)外部不同參與者都可以擁有單一登錄信息的安全平臺,管理不同的社交媒體賬號,從而進行創(chuàng)建、排期、批準、發(fā)布內(nèi)容等,提升效率的同時降低人為失誤和人力依賴。數(shù)據(jù)顯示,該平臺每周平均為品牌運營人員節(jié)省了3-4個小時的工作時間。
KAWO 科握具有深度數(shù)據(jù)復盤、競品監(jiān)測與分析、內(nèi)容規(guī)劃與排期、編輯與排版、實時反饋與審批、定時發(fā)布等功能,幫助客戶團隊的內(nèi)外部成員均可在平臺上全流程協(xié)作管理多個社媒賬號。
香儂科技
AI+金融的初創(chuàng)公司,智能投研,即在金融市場數(shù)據(jù)的基礎支持上,通過深度學習、自然語言處理等人工智能方法,對于數(shù)據(jù)、事件、結論等信息進行自動化處理和分析,為金融機構的專業(yè)從業(yè)人員(分析師、基金經(jīng)理、投資人等)提供投研幫助,提高其工作效率和分析能力。預計到2020年,智能投研所屬的人工智能分析產(chǎn)業(yè)的市場規(guī)模達到700億美元左右。
利用自然語言處理(NLP)和圖像處理(CV)算法,從海量分散的非結構化數(shù)據(jù)中自動提取結構化信息,通過獨立開發(fā)的智能AI金融信息平臺,描繪包括中小企業(yè),上市公司,地區(qū)、產(chǎn)業(yè)、全球等多維度金融實體畫像,服務政府、銀行、基金券商、評級機構、保險和大型企業(yè),為金融資產(chǎn)管理、風控評級、行業(yè)研究、投資決策等各類金融業(yè)務賦能。
秘塔科技METASOTA
上海秘塔網(wǎng)絡科技有限公司成立于2018年4月,是人工智能領域的一家新銳科技公司,致力于將重復腦力勞動AI化,以AI為杠桿撬動專業(yè)場景的百倍生產(chǎn)力提升。
目前,秘塔科技已經(jīng)擁有數(shù)百萬用戶,成立北京和成都兩大研發(fā)中心,在AIGC、文檔輔助創(chuàng)作、智能合同等方向上開展研發(fā)與產(chǎn)品落地。
中文在線
中文在線全資子公司鴻達以太已經(jīng)在錄制部分有聲書過程中運用AIGC技術,通過捕捉聲紋,AI做情感標識,產(chǎn)出高質(zhì)量仿真語音,快速完成文本到語音的轉(zhuǎn)化過程,極大加速了網(wǎng)絡文學到音頻內(nèi)容的生產(chǎn)能力,擴充了內(nèi)容傳播的渠道。
其“AI主播”可實現(xiàn)低成本、高效優(yōu)質(zhì)的內(nèi)容生產(chǎn),實現(xiàn)了單播、雙播、多人播制作方式,支持制作玄幻、懸疑、武俠、歷史、言情等不同類型的作品,實現(xiàn)旁白、角色音的區(qū)分,演繹更豐富、貼合劇情。該功能已向公司旗下17K文學平臺全部作者開放。
黑狐科技
黑狐創(chuàng)客隸屬于廣州黑狐科技有限公司,是國內(nèi)以AI技術應用的平臺,自注冊成立歷時至今一直以“誠信為本、用戶至上”的服務理念為經(jīng)營之本。平臺一直致力于AI生態(tài)圈,產(chǎn)品有:狐寫作、黑狐文字提取神器。
漢儀股份
公司主營業(yè)務包括字體設計、字庫軟件開發(fā)和授權、提供字庫類技術服務 和視覺設計服務,以及以 IP 賦能方式開展的 IP 產(chǎn)品化業(yè)務。
2022下半年,深度學習模型Diffusion擴散化模型創(chuàng)新推進AIGC技術突破,公司AI造字等內(nèi)容領域爆發(fā)。
智搜科技
智搜是中國領先的AI+資訊的技術服務商,自主研發(fā)了Giiso資訊機器人引擎,以及系列衍生的寫作機器人、機器人商店、天機智訊、Giiso編輯機器人等智能產(chǎn)品,可廣泛應用于新聞媒體服務和情報采集追蹤等領域。作為國內(nèi)首家AI+資訊的技術服務商,智搜正試圖圈住“資訊”這塊蛋糕,為人們提供更智能的資訊服務。
智搜以卓越的科研能力獲得國家級高新技術企業(yè)認證,并先后獲得了金沙江聯(lián)合資本、力合集團、民銀國際等多家著名投資機構的參股投資。發(fā)展至今,智搜已有近百名員工,其中研發(fā)人員占五成以上。
同伴客數(shù)據(jù)
同伴客數(shù)據(jù)是領先的數(shù)據(jù)要素市場集成構建商,致力于讓所有數(shù)據(jù)資產(chǎn)都能產(chǎn)生最大價值。同伴客數(shù)據(jù)成立于2017年,是一家致力于通過數(shù)字科技為人類釋放無限潛能的科技公司。其核心產(chǎn)品是TBanic數(shù)字員工基礎平臺,集成了基于“DARD”技術(數(shù)據(jù)-Data、人工智能-AI、機器流程自動化-RPA、數(shù)字人-Digital Human)的數(shù)字員工開發(fā)套件,客戶可以根據(jù)不同的業(yè)務場景,構造出具備對應工作技能的數(shù)字員工。同伴客的產(chǎn)品和解決方案覆蓋數(shù)字藍領、數(shù)字白領和數(shù)字金領三個層級,主要包含AIGC數(shù)字員工、數(shù)據(jù)洞察數(shù)字員工、RPA數(shù)字員工、金融交易數(shù)字員工、人工增強數(shù)字員工,目前已服務于全球超過200家客戶。
Friday
△FRIDAY官網(wǎng)
文本生成工具「Friday AI」:用戶輸入一個標題,就能生成一篇文章。
Friday智能寫作是一款在線AI內(nèi)容創(chuàng)作工具,做為提高寫作者內(nèi)容生產(chǎn)效率的助手,能夠幫助你更快、更好地創(chuàng)作內(nèi)容。Friday AI開始搭建易用的專注于人工智能文本生成的服務。作為一家中美合資公司,我們?yōu)椴煌膶懽鲌鼍伴_發(fā)和提供各種原創(chuàng)文本,包括產(chǎn)品描述、營銷信息、各類主題文章和廣告文案等。
拓爾思
成立于1993年,公司已落地了一批服務型虛擬人項目,其中有面向農(nóng)產(chǎn)品電商主播提供直播腳本智能創(chuàng)作、帶貨虛擬人全鏈租用等知識賦能服務。
拓爾思開展“大數(shù)據(jù)看世界杯”的虛擬數(shù)字人系列服務。在 2022 年北京冬奧會上,二十多位數(shù)字人代替真人為賽事提供服務支持。其中數(shù)字播報員小思通過對資訊內(nèi)容的自動分析、智能創(chuàng)作和虛擬播報幫助觀眾了解冬奧盛況,讓觀眾能快速把握冬奧會海量資訊中的亮點信息。小思冬奧播報由拓爾思 SaaS 平臺開發(fā)而成,集成自然語言處理、大數(shù)據(jù)、人工智能等技術。
圖像
去年由Stability發(fā)布的Stable Diffusion模型,就讓人工智能生成圖片的速率和質(zhì)量進行了大幅提升。全AI創(chuàng)作的繪圖作品幾乎達到專業(yè)水準,讓一眾畫師感到職業(yè)危機。
TIAMAT
生成式AI平臺,成立于2021年?!拜斎胍痪湓?,Tiamat系統(tǒng)就會從0開始生成一整張圖片?!盩iamat系統(tǒng)是該團隊自主研發(fā)的一款AI藝術創(chuàng)作工具。該系統(tǒng)采用了當前最先進的算法技術和強大的多模態(tài)技術,結合人類靈感創(chuàng)造力與科技的碰撞,拓展了算法藝術與AI創(chuàng)造力在商業(yè)環(huán)境中的應用邊界,致力于探索前沿AIGC領域的更多可能性。
Tiamat生成式AI模型是基于擴散模型(Diffusion Models)和審美模型實現(xiàn)的,研發(fā)團隊還在擴散模型采樣、數(shù)據(jù)集構建上開展了許多工作,進一步增加了圖像生成質(zhì)量。作為一款國產(chǎn)優(yōu)化自研系統(tǒng),Tiamat系統(tǒng)支持中文和各種復雜的描述風格,界面簡潔,在手機上就可以使用。
Tiamat研發(fā)團隊創(chuàng)新性地使用梯度引導和條件生成結合的技術,對系統(tǒng)進行優(yōu)化,使得Tiamat系統(tǒng)能夠在圖片生成符合文本輸入的同時,讓最終結果的色彩細節(jié)、構圖更加完善。
ZMO.AI
ZMO開發(fā)了新一代AIGC引擎,基于?研優(yōu)化的Implicit style diffusion技術,為?戶提供從AI輔助內(nèi)容創(chuàng)作到AI完全?成的技術引擎與創(chuàng)作平臺。
2022年年底,ZMO的中文平臺“YUAN初”、以及同名小程序全新上線,用戶可以便捷體驗AI圖像生成。
△YUAN初生成的圖像
ZMO開發(fā)了新一代AIGC引擎,基于?研優(yōu)化的Implicit style diffusion技術,為?戶提供從AI輔助內(nèi)容創(chuàng)作到AI完全?成的技術引擎與創(chuàng)作平臺。
ZYRO
圍繞電商場景,通過AIGC生成網(wǎng)站搭建過程中所需的各類素材,具體業(yè)務包括針對性生成公司介紹、企業(yè)價值、Slogan、自動提升圖片清晰度、自動生成logo等。
國內(nèi)類似的公司包括聆心智能?;诙嗄B(tài)對話生成系統(tǒng),該公司專注于針對精神心理的AI驅(qū)動的高質(zhì)量數(shù)字療法,讓AI圍繞認知、情緒和行為三個維度對用戶進行評估和干預,生成千人千面的情緒治療方案,目前已與北醫(yī)六院、湘雅二院、中日友好醫(yī)院、清華大學玉泉醫(yī)院等達成合作。
目前,Zyro帶來了完全不同的網(wǎng)站設計工具:AI寫作器(AI Writer)和AI熱圖(AI Heatmap)。
Mai小麥
Mai小麥作為AI量化社交電商領域的獨角獸,將AI與電商行業(yè)深度融合,打造了獨特的商業(yè)模式。此外,Mai的核心技術已經(jīng)得到美國和日本的專利認證,Mai通過自主研發(fā)的視覺識別產(chǎn)品,模擬人眼觀看視頻時的過程,自動識別畫面中出現(xiàn)的商品并匹配各大電商平臺的同款推薦給用戶。
當前,市面上的視頻廣告技術本質(zhì)上都是圖片識別,而Mai小麥可以模擬人眼對畫面中的商品進行追蹤,做到高速準確的多物體識別。這是Mai小麥在技術領域的核心競爭力,并且在行業(yè)中處于領先地位。目前Mai已經(jīng)與微博、愛奇藝等頭部內(nèi)容平臺以及唯品會、天貓、京東、亞馬遜等國內(nèi)外知名電商平臺展開合作,并且正在積極拓展合作平臺和應用場景,讓更多用戶可以感受到AI技術帶來的“所見即所買”的便捷。
Nolibox(圖宇宙)
Nolibox成立于2020年,是一家基于場景需求和用戶喜好的智能設計引擎及平臺服務商,致力于讓每個人都能享受好設計。Nolibox將美學原理、設計模型及人工智能技術進行深度融合,完成知識表示與設計生成,支持多場景之間的設計分發(fā)與延展創(chuàng)造。
△Nolibox - 畫宇宙
這一設計平臺旨在提供兼收并蓄的多元設計,讓人們能夠以實惠價格獲取別具一格的優(yōu)質(zhì)設計作品。在此理念驅(qū)動下,“計算美學”(Nolibox)致力于運用人工智能等尖端技術,打破當下壟斷的設計壁壘。
視覺中國
視覺中國是國內(nèi)最大的視覺內(nèi)容互聯(lián)網(wǎng)版權交易平臺,百度文心一格是AI作畫這一新興領域兼顧創(chuàng)新與實用的代表性平臺。雙方在AIGC賦能內(nèi)容創(chuàng)作上的積極探索,展現(xiàn)了AIGC的多元商業(yè)價值。視覺中國與百度正式簽署戰(zhàn)略合作協(xié)議,視覺中國與百度旗下的AI作畫平臺文心一格將在創(chuàng)作者賦能和版權保護等方面展開多項合作,共探AIGC內(nèi)容產(chǎn)業(yè)發(fā)展方向。
藍色光標
藍色光標AI技術主要應用于“智能創(chuàng)意設計”“短視頻智能化制作”“智能策略方案制作”三個方面。2021年12月,藍色光標銷博特全新上線AI易稿模塊,輔助營銷人員輕松寫作,用戶只需輸入公司、產(chǎn)品、行業(yè)、標題四項關鍵內(nèi)容即可一鍵生成新聞草稿;此外,還能輕松創(chuàng)作虛擬人配音的可“聆聽”音頻版新聞稿件。
2022年2月,藍色光標旗下智能營銷助手銷博特平臺發(fā)布“小元宵”計劃,旨在將平臺現(xiàn)有的分析、寫作、文案、隨筆以及創(chuàng)意等六大產(chǎn)品能力封裝成API技術接口,為虛擬數(shù)字人賦能營銷創(chuàng)作能力。
萬興科技
萬興科技深耕數(shù)字創(chuàng)意軟件領域,推出萬興喵影、萬興優(yōu)轉(zhuǎn)、萬興錄演等視頻創(chuàng)意軟件,Wondershare Filmstock、萬興喵庫視頻創(chuàng)意素材平臺,萬興愛畫、萬興播爆等AIGC應用;此外面向全球市場還推出萬興圖示、萬興腦圖MindMaster、墨刀等繪圖創(chuàng)意軟件,萬興PDF、Wondershare PDFelement等文檔創(chuàng)意軟件,萬興恢復專家、萬興數(shù)據(jù)管家、萬興易修等實用工具軟件。
公司正以前瞻的視野推進全球化布局,在深圳設立研發(fā)總部,并在長沙、北京、杭州、鄭州、西安、溫哥華、東京等地設立運營中心,業(yè)務范圍遍及全球200多個國家和地區(qū),全球累計用戶逾15億。
西湖心辰
西湖心辰今年8月上線的AI繪畫平臺盜夢師,今年9月,AI繪畫的作品《太空歌劇院》獲得了第一名。
「盜夢師」所在的AIGC廠商「西湖心辰」成立于2021年,依托于新型研究型學術機構西湖大學,專注于人工智能自然語言處理領域的科研成果轉(zhuǎn)化及產(chǎn)品應用等,2021年年底完成了近千萬美元的天使輪融資。Diffusion方法出現(xiàn)之后,AI Art的生成速度被大幅提高,也讓他們終于看到了在這一賽道推出產(chǎn)品的可行性。
Fancy Technology
Fancy Technology成立于2020年4月,核心團隊主要來自阿里系,深諳平臺運營規(guī)則及電商玩法。FancyTech是在用AIGC做內(nèi)容生成,通過AI能力學習平臺里海量的跨平臺內(nèi)容,得到我們自己的模型,在結合商家的素材去為他們生成更多內(nèi)容。
在天使輪之后,F(xiàn)ancyTech基于其之前做數(shù)據(jù)智能服務商所沉淀的海量數(shù)據(jù),建立數(shù)據(jù)分析模型,最終打造出面向品牌的智能服務平臺Content Hub,其核心是通過“跨平臺熱門內(nèi)容的智能使用和內(nèi)容的智能生成”,從而提升品牌力商品的轉(zhuǎn)化率以及用戶的留存度。
美圖秀秀
美圖公司旗下應用程序Meitu也順勢推出AI繪畫功能,在海外收獲了一大批新用戶。特別是在日本地區(qū)的蘋果App免費下載排行榜上,Meitu軟件在上周多次蟬聯(lián)第一,一度創(chuàng)造了單日最高將近破百萬新增用戶的巨幅增長。
美圖選擇的AI繪畫賽道,是AIGC的重要分支,利用該技術,用戶只需或拍攝上傳一張照片,幾秒鐘后就能得到一張意象極為相似的藝術圖畫。美圖秀秀AI繪畫功能廣受海外用戶喜愛,在日本、巴西、烏克蘭多日蟬聯(lián)Apple Store總榜第一名;在美國、加拿大、澳大利亞、新西蘭、白俄羅斯、智利、哈薩克等地區(qū)沖至總榜前三名,訂閱用戶數(shù)在多個國家都有上漲。
詩云科技
詩云科技成立于2020年12月,總部在深圳,愿景是用AI生成內(nèi)容,讓用戶以更低成本完成內(nèi)容創(chuàng)作。其主要產(chǎn)品是內(nèi)容生成引擎Surreal Engine,核心技術是深度學習和圖形學,如自然語言理解、3D建模、神經(jīng)輻射場、生成對抗網(wǎng)絡、神經(jīng)渲染等。
在Surreal Engine里,他們把內(nèi)容生成分解成三個步驟:Understanding(理解)、Framing(視框化)、Rendering(渲染)。這是一個多模態(tài)的生成器,可以在文字、語音、圖片、視頻、3D 內(nèi)容、虛擬內(nèi)容之間互相切換。這些底層能力會堆疊起來組成內(nèi)容生成和內(nèi)容編輯的能力。
視頻
相較文本、圖像、音頻而言,人工智能生成視頻的算法模型還處于未成熟階段。
視連通
北京視連通科技有限公司在人工智能/CV識別、視頻內(nèi)容智能生產(chǎn)和營銷增值方面深入探索,以自有AI技術加持大屏增加營銷增長。他從當下傳統(tǒng)長視頻運營的痛點切入,直指面向內(nèi)容的營銷是助力傳統(tǒng)長視頻運營商營銷增長的重中之重。
特看科技
特看科技成立于2022年6月,創(chuàng)始人兼CEO吳春松(花名樂乘)是前阿里資深產(chǎn)品專家,曾擔任阿里巴巴智能設計實驗室負責人,打造了AI設計平臺“魯班”;后負責淘寶內(nèi)容工具業(yè)務,孵化了淘寶商家短視頻工具親拍App。聯(lián)合創(chuàng)始人兼CTO陳炳輝是前阿里資深技術專家,曾擔任UC瀏覽器內(nèi)核技術負責人,淘寶內(nèi)容中臺視頻生產(chǎn)播放技術負責人。
△圖片來源:特看科技
特看核心團隊在生成式AI、B端視頻直播工具領域有著多年的技術及產(chǎn)品落地經(jīng)驗,同時也在電商行業(yè)擁有豐富的認知。團隊致力于打造服務全球電商商家的內(nèi)容工具SaaS,目前已推出海外電商數(shù)據(jù)分析&視頻智能生成工具Tabcut.com,數(shù)字人直播工具“主播寶”。
像素偏移
像素偏移致力于拓展視覺藝術的技術邊界,改變?nèi)藗儎?chuàng)作、審美和休閑方式。 我們結合數(shù)字角色渲染和混合現(xiàn)實等技術應用,展開在 IP 角色數(shù)字化、創(chuàng)意營銷視頻生產(chǎn)等領域的產(chǎn)品方案落地。
騰訊智影
騰訊智影是騰訊影業(yè)戰(zhàn)略型科技創(chuàng)新團隊,依靠騰訊體系的能力和資源,聯(lián)動云技術,運用5G和AI作為技術載體,基于騰訊科技為影視行業(yè)提供智慧化全流程解決方案,推出可提高影片拍攝,后期制作,宣傳發(fā)行的系列工具:智慧制片,審片平臺,智慧后期。
影譜科技
作為國內(nèi)人工智能視覺技術企業(yè),影譜科技開創(chuàng)了AI視覺生成技術的全景商業(yè)模式,影譜科技在產(chǎn)品、業(yè)務、研發(fā)等方面取得的一系列突破,代表著社會對AI技術商業(yè)落地能力的期望。
2020年9月,影譜科技發(fā)布“AI視頻鑒偽鑒定平臺”,從數(shù)字治理入手輔助AI視頻生態(tài)的安全性;2020年10月,發(fā)布“智能影像生成引擎MAGC 2.0”,被學界、商界、媒體界認定成為數(shù)字經(jīng)濟的生成要素;2020年11月,推出國內(nèi)首款融合AI+5G的3D數(shù)字孿生引擎MADT,創(chuàng)建適應數(shù)字經(jīng)濟時代的新型可視化業(yè)務鏈環(huán)境。除此之外,基于MADT引擎,影譜科技還推出了業(yè)內(nèi)首款3D數(shù)字文創(chuàng)解決方案。同月,公司首次對外展示和演示新的3D成像系統(tǒng),并針對新零售業(yè)務場景提出行業(yè)解決方案。
GilaCloud
GilaCloud旗下的GliaStudio是人工智能視頻自動生產(chǎn)制作平臺,通過其人工智能技術會自動將內(nèi)容轉(zhuǎn)換成視頻,并且提供客制化選項。GliaStudio在大數(shù)據(jù)分析以及機器學習等領域提供多種應用服務以及解決方案,致力于讓用戶都能享受人工智能以及大數(shù)據(jù)所帶來的便利。
Creative Fitting
商業(yè)內(nèi)容創(chuàng)作服務企業(yè)「井英科技」發(fā)布CreativeFitting短視頻一站式生產(chǎn)平臺,以“AI+人工”協(xié)同創(chuàng)作,幫助品牌提高生產(chǎn)效率,為品牌出海賦能。伴隨TikTok商業(yè)化的崛起,整體廣告主對廣告短視頻的創(chuàng)作需求將大幅度提升。而國內(nèi)出海廣告主在做國外廣告短視頻時,通常面臨腳本創(chuàng)作難、多語言挑戰(zhàn)、真人化本土化、真人素材昂貴、外籍演員溝通難等痛點。這都將是CreativeFitting的機會。
數(shù)字王國
2022年初,南京江蘇衛(wèi)視跨年演唱會,有一位“特殊”嘉賓現(xiàn)身:使用最先進技術合成的虛擬人鄧麗君現(xiàn)身舞臺,與知名歌手周深同臺演繹《大魚》、《小城故事》和《漫步人生路》,虛擬鄧麗君的背后是知名虛擬現(xiàn)實(VR)體驗服務供應商之一,數(shù)字王國。本次其使用的技術是融合機器學習的高階渲染系統(tǒng)“Mystique Live”,該項技術也曾經(jīng)運用在《復仇者聯(lián)盟》系列中的“滅霸”身上。
筷子科技
企業(yè)級創(chuàng)意智能生產(chǎn)及協(xié)作增長平臺。經(jīng)過多年的技術沉淀,筷子科技基于自研的圖片、音頻和視頻內(nèi)容的結構化分析技術引擎FusionX,通過AI自動解構圖像及視頻創(chuàng)意元素,賦能內(nèi)容人機協(xié)作生產(chǎn)效率,深度分析創(chuàng)意與商業(yè)轉(zhuǎn)化效果的關系,并通過商業(yè)創(chuàng)意線上化團隊協(xié)作平臺產(chǎn)品,大幅提升內(nèi)容商家客戶團隊效率和業(yè)務增長。
△筷子科技核心產(chǎn)品能力
“加筷”智能創(chuàng)意生產(chǎn)及協(xié)作平臺,該平臺為筷子科技于2020年底推出的全新企業(yè)級智能創(chuàng)意SaaS產(chǎn)品平臺,賦能國內(nèi)數(shù)百萬內(nèi)容商家及跨境商家的智能內(nèi)容生產(chǎn)及協(xié)作平臺,鏈接內(nèi)容團隊編導、拍攝、剪輯、投放、管理等五大協(xié)同角色,數(shù)十倍提升內(nèi)容(特別是短視頻)生產(chǎn)效率,打通國內(nèi)外公域及私域主流平臺,并通過智能推薦算法和數(shù)據(jù)分析提升內(nèi)容轉(zhuǎn)化。
快手云剪
目前,字節(jié)跳動旗下的剪映,快手云剪都能提供AI生成視頻,快手云剪提供了智能封面、自動配音、自動字幕、畫質(zhì)增強、視頻去抖、自動橫屏轉(zhuǎn)豎屏等系列智能工具,以技術賦能內(nèi)容創(chuàng)作者。
在視頻的智能化處理模塊,目前已經(jīng)上線了4個智能工具:智能封面、橫屏轉(zhuǎn)豎屏、視頻去抖和智能去痕。通過AI技術識別橫屏視頻,再自動生成豎屏內(nèi)容,直接降低了橫屏豎屏之間的轉(zhuǎn)換門檻。
帝視科技
專注于人工智能與計算機視覺技術研究與產(chǎn)品開發(fā),提供智能制造及數(shù)智影像領域技術服務和行業(yè)解決方案。帝視科技與產(chǎn)業(yè)鏈上下游高校、院所、企業(yè)構建了關系廣泛、技術力量強大、產(chǎn)業(yè)鏈完整的產(chǎn)學研合作體,圍繞數(shù)智影像、智能制造等領域開展系統(tǒng)研究與攻關,形成多種專業(yè)化的解決方案。目前,經(jīng)過自主開發(fā)且可落地應用的核心AI算法已有100+,AI模型超1000+,產(chǎn)品能力覆蓋數(shù)智影像、智能制造產(chǎn)業(yè)鏈上下游企業(yè),加速實體產(chǎn)業(yè)往數(shù)字化、智能化、系統(tǒng)化方向更新迭代。
音頻
思必馳
思必馳旗下DUI平臺上線“單人千音”功能。“單人千音”通過深度神經(jīng)網(wǎng)絡對發(fā)音人音色進行建模,實現(xiàn)單個音色就能生成同時覆蓋多種語言、多種風格的語音合成聲音,極大豐富了合成語音的表現(xiàn)力。與大家分享這一新功能。
靈動音科技
于2018年成立,其產(chǎn)品包括針對視頻生成配樂的配樂貓、支持非音樂專業(yè)人員創(chuàng)作的口袋音樂、可AI生成歌詞的LYRICA、AI作曲軟件LAZYCOMPOSER。目前已與國內(nèi)多家音樂平臺廠商達成合作。其音樂標注團隊已形成了全球最精確的話語歌曲音樂信息庫。
標貝科技
標貝科技是一家專注于智能語音交互和AI數(shù)據(jù)服務的人工智能公司,擁有業(yè)內(nèi)先進的AI語音交互技術及高精度數(shù)據(jù)采標處理技術,創(chuàng)新打造多場景應用的語音交互方案,以及聲音定制,聲音復刻、情感合成、聲音轉(zhuǎn)換等在內(nèi)的語音技術產(chǎn)品;AI數(shù)據(jù)業(yè)務涵蓋語音合成、語音識別、圖像視覺、nlp等采標服務和數(shù)據(jù)可視化平臺-數(shù)據(jù)工場。
為了賦予合成聲音更豐富的情感表現(xiàn)力,滿足用戶在更多應用場景的多樣化需求,標貝科技在音色和場景豐富度上持續(xù)發(fā)力,上線了超過34種音色,包括童聲、成人男女聲,深度覆蓋有聲閱讀、智能客服、語音播報等多個業(yè)務場景,完成對發(fā)音庫的大量增容。
科大訊飛
科大訊飛是成立于1999年的AI巨頭,不僅基于AI虛擬人交互平臺在打造中國AIGC的中心,而且正在穩(wěn)步推進國產(chǎn)化核心技術創(chuàng)新。
早在2019年科大訊飛已開始研究超大模型關鍵技術,聯(lián)合國內(nèi)高校打造的開源預訓練模型已成為業(yè)界頭部中文預訓練模型,助力行業(yè)智能化創(chuàng)新。
訊飛超腦2030計劃為牽引來推動源頭技術的系統(tǒng)性創(chuàng)新,科大訊飛在復雜場景的多模感知、多維表達、認知智能和AI運動智能算法領域都有長足的進步。多模感知實現(xiàn)語音與視覺、眼神、面部表情、肢體語言、環(huán)境的融合感知,多模態(tài)增強語音技術將主說話人的干凈人聲從嘈雜場景中分離出來,識別效果相較單模態(tài)提升約49.5%,在業(yè)界率先跨過實用門檻。在多語種語音識別、語音合成、圖文識別、機器翻譯領域,科大訊飛主要語種核心效果保持國際領先水平。
網(wǎng)易天音
△圖片來源:網(wǎng)易天音官網(wǎng)
網(wǎng)易試水AI音樂創(chuàng)作領域,推出全球首個一站式音樂創(chuàng)作平臺天音??梢詾榱餍幸魳穼I(yè)伴奏編曲工作,提供快速模版化。但是使用該平臺需要一定的樂理基礎,可根據(jù)和弦譜,進行編曲微調(diào)的自定義編輯,支持導出成品伴奏音頻。
數(shù)字人3D
AIGC和虛擬數(shù)字人結合會成為一種趨勢,聰明且人性化的對話體驗,不再只是文字呈現(xiàn),而是以生動形象的數(shù)字人形式輸出,這或?qū)⒊蔀锳IGC數(shù)字人的另一個里程碑。
倒映有聲
AI音頻科技創(chuàng)新企業(yè)「倒映有聲」,一家以AI技術為核心的國家高新技術企業(yè)和無人驅(qū)動數(shù)字分身技術解決方案供應商,通過自研神經(jīng)渲染引擎、數(shù)字孿生技術、以及獨創(chuàng)的TTSA技術,從語義到聲音圖片,再到連續(xù)幀視頻畫面,實現(xiàn)多姿態(tài)的數(shù)字分身生成,并實現(xiàn)基于文本實時生成高質(zhì)量語音(音頻)和動畫(視頻),最終實現(xiàn)無人驅(qū)動數(shù)字分身的行業(yè)技術突破,致力于成為全球領先的AI數(shù)字人神經(jīng)渲染引擎。
倒映有聲旗下?lián)碛腥诿襟wAI數(shù)字人技術解決方案、“一視同人”數(shù)字分身內(nèi)容創(chuàng)作平臺和有聲書制作交易平臺等,落地場景可覆蓋媒體播報、有聲讀物制作、互動游戲、虛擬直播、娛樂等應用場景,滿足企業(yè)用戶降本增效的需求,促進企業(yè)業(yè)務形態(tài)創(chuàng)新和增長,構建以無人驅(qū)動數(shù)字分身為載體的虛擬世界新生態(tài)。
目前,公司產(chǎn)品、技術、服務以及整套解決方案,已被中央廣播電視總臺音頻客戶端云聽、河南電視臺、物靈科技、中文在線、當紅齊天等頭部企業(yè)所采用。
魔琺科技
成立于2018年初,創(chuàng)始人柴金祥已在三維虛擬人的智能建模和綁定、AI表演動畫、AI動畫生成、交互領域潛心研究了19年,并以第一作者身份代表MSRA發(fā)表了中國大陸學者第1篇SIGGRAPH(圖形學世界最頂級期刊)論文,先后在SIGGRAPH/TOG發(fā)表了20篇關于三維虛擬人核心技術論文。
目前已構建AI虛擬人能力平臺,實現(xiàn)一站式造人、育人、用人的構建AI虛擬人的能力平臺,賦能各行各業(yè)創(chuàng)建多模態(tài)交互的AI虛擬人,從而應用在不同的業(yè)務場景。
星凡科技
坐落于成都,依托自主研發(fā)的元宇宙引擎,采用行業(yè)內(nèi)領先的大數(shù)據(jù)、區(qū)塊鏈、AIGC等技術,致力于打造Web3.0時代的元宇宙基礎數(shù)字設施,賦能商業(yè)元宇宙和城市元宇宙,助力政府、企業(yè)數(shù)字化轉(zhuǎn)型升級,服務國家戰(zhàn)略,推動人類重構未來智能新世界。
2022年11月,星凡科技完成近千萬人民幣天使輪融資,由鑫瑞恩資本和個人投資者聯(lián)合投資。本輪融資資金主要用于元宇宙引擎以及AIGC相關技術的研發(fā)、市場拓展等。
游戲
△HoloLens工業(yè)使用宣傳畫面
AIGC已經(jīng)或者將要滲透到游戲產(chǎn)業(yè)鏈各個環(huán)節(jié):美術—AI畫圖、AI實景運算、AI地圖;玩法/策劃—AI劇情、智能NPC及語音、AI關卡設計/道具設計;發(fā)行—AI投放系統(tǒng)、AI驅(qū)動CG制作等等。AIGC對游戲的改造也有望推動全新的玩法/品類甚至游戲形態(tài)的誕生。
超參數(shù)科技
超參數(shù)科技是一家專注于游戲AI探索的初創(chuàng)公司,主攻機器學習、強化學習、大系統(tǒng)工程等領域,旨在為游戲公司提供AI解決方案。成立于2019年初,目前已獲得晨興資本、高榕資本數(shù)千萬美元A輪融資。
創(chuàng)始人劉永升,原騰訊AI Lab總經(jīng)理、T4技術專家,圍棋AI“絕藝”、王者榮耀AI“絕悟”團隊負責人。團隊成員包括來自騰訊AI Lab和IEG游戲的多位人工智能科學家、技術骨干,以及海內(nèi)外頂尖院校的精英伙伴。團隊曾主導了圍棋AI“絕藝”、王者榮耀AI“絕悟”的研發(fā)工作。
超參數(shù)科技的方向主要是探索通過AI技術,變革游戲生產(chǎn)方式和內(nèi)容玩法形式。而經(jīng)過三年發(fā)展,劉永升意識到,游戲AI能夠輻射的領域非常廣闊,在游戲AI概念下衍生出的業(yè)務和應用場景非常豐富,“即便游戲本身也太大了,每個人對游戲AI的理解也不同,我們現(xiàn)在是做減法,把AI Bot做到極致,這是公司非常重要的新戰(zhàn)略。”
超參數(shù)為AI Bot的發(fā)展規(guī)劃了一條從L1至L4的技術路徑,希望從簡單擬人化的AI Bot出發(fā),最終構建一個“10億人與100億AI bot共存”的虛擬空間生態(tài)。
靈圖創(chuàng)新
旗下產(chǎn)品「言出法隨」——無門檻的影視游戲創(chuàng)作發(fā)布平臺。靈圖致力于搭建下一代影視游戲創(chuàng)作發(fā)布平臺。利用先進的多模態(tài)AI,實現(xiàn)一句話到多種數(shù)字媒體內(nèi)容(圖像、視頻、VR/AR、3D場景)的一鍵式生成。將創(chuàng)作能力和權利下放到每一個人,真正實現(xiàn)內(nèi)容原生,建起人類走向元宇宙時代的橋梁。公司具有奧斯卡級的超大型CG數(shù)據(jù)集,研發(fā)了世界領先的多模態(tài)AI。目前該AI已能夠?qū)崿F(xiàn)從文字到多種數(shù)字媒體內(nèi)容的生成。
rct AI
rct AI 成立于2018年,運用人工智能為游戲行業(yè)提供完整的解決方案。 在不同類型和題材的游戲場景中,rct AI為游戲開發(fā)者打造的一系列解決方案,覆蓋了游戲的全生命周期,包含智能內(nèi)容生成、智能測試、智能數(shù)據(jù)運營、智能投放等類型。
rct AI也在打造不同技術解決方案,以布局虛擬人“大腦”,即讓虛擬人能夠智能地行動和決策。在布局過程中,選擇以工具的方式切入,借助游戲的全數(shù)字化場景迭代AGI技術。rct AI目前主要面向游戲行業(yè)提供基于AI的解決方案,包括智能NPC、自動化QA、對話系統(tǒng)和AI陪玩,在這個過程中不斷實現(xiàn)技術的積累與迭代。
綜合
相芯科技
2016年成立,相芯科技致力于元宇宙基礎設施建設,并率先布局深耕虛擬人技術應用,是國內(nèi)最早一批的元宇宙規(guī)模化廠商之一。
相芯科技憑借尖端技術研發(fā)能力、豐富的產(chǎn)品開發(fā)經(jīng)驗,為各行業(yè)領域提供標準化、低門檻、多類型的虛擬人解決方案,廣受海內(nèi)外客戶青睞。立足國內(nèi),相芯科技已服務小米、榮威、中國移動等各行業(yè)頭部企業(yè);放眼全球,與美國Fika Media Company、韓國CKG Solutions、新加坡Buzz AR等企業(yè)均深入合作。
微軟小冰
成立于2020年,獨角獸企業(yè),是全球領先的人工智能科技公司,旗下小冰框架是全球承載交互量最大的完備人工智能框架之一,在開放域?qū)υ?、多模態(tài)交互、超級自然語音、神經(jīng)網(wǎng)絡渲染及內(nèi)容生成領域居于全球領先。
微軟小冰人產(chǎn)品有虛擬人、音頻生成、視覺創(chuàng)造、文本創(chuàng)造、虛擬社交等。微軟小冰的客戶已覆蓋金融、智能車機、零售、體育、紡織、地產(chǎn)、文旅等十多個垂直領域,并提出了以「人力」的邏輯去進行商業(yè)報價的虛擬人商業(yè)模式。
追一科技
深圳追一科技有限公司是領先的人工智能公司和AI數(shù)字員工提供商,公司主攻深度學習和自然語言處理,提供智能語義,語音和視覺的AI全棧服務。AI數(shù)字員工智能平臺能與業(yè)務場景深度融合,提供不同類型的AI數(shù)字員工,滿足企業(yè)和政府用戶服務、營銷、運營、 辦公等多種場景的智能化升級需求,幫助客戶降本提效,改善用戶體驗,驅(qū)動創(chuàng)新和增長。
核心團隊中,國內(nèi)頂尖技術專家占比81%以上,絕大部分成員為碩士和博士學歷,涵蓋了NLP算法、語義算法、語音算法、多模態(tài)算法、自動機器學習、數(shù)據(jù)挖掘等全棧AI技術領域。團隊成員已提交333項專利,其中獲得專利授權109項,在AI領域主流刊物發(fā)表數(shù)十篇學術論文,其中3篇論文發(fā)表在頂級學術會議ASRU、NLPCC、EMNLP上。
昆侖萬維
昆侖萬維成立于2008年,在AIGC領域已經(jīng)投入了近兩年的時間,成立MusicX L ab,目前已經(jīng)正式銷售AI作曲。
△昆侖天工算法與模型
22年第四季度推出的“昆侖天工”,旗下模型包括天工巧繪SkyPaint、天工樂府SkyMusic、天工妙筆SkyText、天工智碼SkyCode,覆蓋圖像、音樂、文本、編程等多模態(tài)內(nèi)容生成能力,標志著昆侖萬維成為目前國內(nèi)AIGC領域布局最為全面的公司之一,也是國內(nèi)第一個全身心投入到AIGC開源社區(qū)的公司。
目前AI圖像、AI文本、AI編程的模型已經(jīng)在GitHub上開源。
AI圖像方面,天工巧繪SkyPaint采用全球第一款多語言Stable Diffusion分支模型,兼容Stable Diffusion;使用1.5億中英雙語語料,支持中英雙語輸入實現(xiàn)文字生成圖像,是國內(nèi)為數(shù)不多的支持中英雙語的文圖生成模型。
模型&算法
搜狗
央視最早在 2018 年就和搜狗推出過 AI 主持人,并在21年5月推出手語AI合成主播,搜狗在翻譯和虛擬數(shù)字人(搜狗分身)交互領域的積累和交叉融合。在搜狗以語言為核心的AI技術布局中,從中文、多方言和外國語種的語音識別轉(zhuǎn)寫、AI同傳翻譯,再到個性化的語音合成和變聲……在人們生活中語言應用的方方面面,都不乏搜狗的身影。
如今,搜狗作為國產(chǎn)AI+語音領域顛覆傳統(tǒng)語音行業(yè)領先者之一,其AI語音技術具有高識別率、高準確率、低時延和多模態(tài)融合等優(yōu)勢,已廣泛應用到教育、商務、旅游等多個應用場景,并已深入你我身邊的千家萬戶中。
百度
2022年發(fā)布了AI助理,覆蓋了各種AIGC應用,包括AI自動生成文字、圖片以及圖片轉(zhuǎn)換成視頻,旨在為現(xiàn)有的500多萬百家號創(chuàng)作者帶來一套AI生產(chǎn)內(nèi)容工具,幫助他們更快更好地產(chǎn)出視頻內(nèi)容,從而增加百度百家號等產(chǎn)品的用戶粘性。
百度增強現(xiàn)實技術部成立于2017年,依托百度大腦核心能力,打造業(yè)內(nèi)領先的AR 智能交互平臺DuMix AR。通過視覺定位、人機交互、3D識別跟蹤等技術能力的前瞻布局,構建虛實互聯(lián)的基礎設施,變革人機交互的創(chuàng)新體驗。百度知識圖譜面向海量數(shù)據(jù),綜合運用語義理解、知識挖掘、知識整合與補全等技術,構建出多元異構的超大規(guī)模知識圖譜,進而基于知識圖譜進行理解、推理和計算。
文心一言(英文名:ERNIE Bot)是百度基于文心大模型技術推出的生成式對話產(chǎn)品:
△AI自動生成節(jié)日海報(來自文心作畫大模型ERNIE-ViLG)
目前,百度知識圖譜已經(jīng)擁有業(yè)界最大規(guī)模知識圖譜,并廣泛應用于公司各產(chǎn)品線。同時,百度知識圖譜深耕行業(yè)圖譜,打造面向B端場景的知識圖譜平臺、產(chǎn)品及解決方案,業(yè)內(nèi)首發(fā)行業(yè)知識中臺,助力各行各業(yè)的智能化升級。
騰訊
2023年2月初,騰訊旗下的騰訊研究院發(fā)布《AIGC發(fā)展趨勢報告2023》。報告中指出,AIGC的商業(yè)化應用將快速成熟,市場規(guī)模會迅速壯大。當前AIGC已經(jīng)率先在傳媒、電商、影視、娛樂等數(shù)字化程度高、內(nèi)容需求豐富的行業(yè)取得重大發(fā)展,市場潛力逐漸顯現(xiàn)。以及,在廣告領域,騰訊混元AI大模型能夠支持廣告智能制作,即利用AIGC將廣告文案自動生成為廣告視頻,大大降低了廣告視頻制作成本。巨大的應用前景將帶來市場規(guī)模的快速增長。
騰訊擁有“微信”這一國民級移動應用程序,包括在公眾號、視頻號、看一看等功能中都有AI算法加持。目前,騰訊在AI技術領域的業(yè)務,主要包括騰訊AI實驗室、騰訊優(yōu)圖等。
騰訊AI Lab基于多模態(tài)學習及生成能力在游戲領域進行了全流程的布局。如開發(fā)的“絕悟”平臺通過強化學習的方法來模仿真實玩家,包括發(fā)育、運營、協(xié)作等指標類別,以及每分鐘手速等具體參數(shù),讓AI更接近正式服玩家真實表現(xiàn)。騰訊AI Lab還與王者榮耀聯(lián)合推出了AI開放研究平臺“開悟”,試圖讓AI通過強化學習的方法來模仿真實玩家,最終達到職業(yè)電競水平。除此之外,騰訊還打造了寫稿機器人“夢幻寫手”。
微軟亞洲研究院
微軟亞洲研究院(MSRA)是微軟在美國本土以外規(guī)模最大研究機構,自 1998 年建院以來已經(jīng)發(fā)展成為世界一流的計算機基礎及應用研究機構,推動整個計算機學科前沿技術發(fā)展并將最新研究成果快速產(chǎn)品化。微軟亞洲研究院著眼于下一代革命性技術的研究,目前共有約 250 名研究和開發(fā)人員以及 300 多名訪問學者和實習生。
微軟亞洲研究院自然語言計算組專注于自然語言處理領域的理論、算法和應用研究。目前主要的研究興趣包括:自然語言理解與生成,機器翻譯,智能問答,語音處理,代碼智能,文檔智能,多模態(tài)理解與生成,以及大規(guī)模預訓練模型等。
阿里巴巴
淘系搜索算法團隊擁有全世界最大的商品搜索系統(tǒng),每天為上億用戶提供數(shù)十億次搜索服務。我們致力于研究最前沿的機器智能技術,探索世界上最完整的最有價值的電商大數(shù)據(jù),引領深度學習時代搜索算法技術的變革。
阿里巴巴達摩院語言技術實驗室NLP團隊研發(fā)的技術在圖文問答和中文理解榜單多個任務上首次超越人類,建設NLP平臺和產(chǎn)品在阿里巴巴集團內(nèi)支持數(shù)百個場景日均數(shù)萬億級調(diào)用,對外賦能多個行業(yè)合作伙伴,也是AI開源魔搭社區(qū)NLP模型的主要提供者。其中黃非博士加入達摩院之前,他曾在卡耐基梅隆大學攻讀博士,之后在IBM Watson和Facebook從事并領導NLP研究等工作。他在人工智能頂級會議和期刊發(fā)表文章60+篇,中美專利20項,曾擔任ACL,AACL等學術會議領域主席等。
阿里巴巴旗下的AI在線設計平臺Lubanner,幫助營銷人員生產(chǎn)Banner。
英偉達
在視覺生成研究領域始終位于前沿,代表作品包括CycleGAN、GauGAN、EditGAN、GANverse3D、Instant NeRF等。2022年12月,NVIDIA發(fā)布了NVIDIA AI Enterprise 軟件套件的新版本,為全球企業(yè)多個行業(yè)和特定領域的各項工作負載提供支持。NVIDIA AI Enterprise 3.0提供用于呼叫中心的智能虛擬助手、音頻轉(zhuǎn)錄和網(wǎng)絡安全數(shù)字指紋的AI工作流。對于應用AI來完善客戶服務的企業(yè)而言,這些都是最常使用的應用。NVIDIA AI Enterprise 3.0預計將于本月晚些時候上線。除上述功能外,還擴大了對NVIDIA NGC軟件目錄中50多個NVIDIA AI軟件框架和預訓練模型的支持,將大幅推動并簡化全球范圍內(nèi)眾多機構的AI部署工作。
商湯科技
商湯擁有領先的人工智能基礎設施SenseCore大裝置,不僅具有領先的人工智能算力,還可以提供十億級參數(shù)級別的參數(shù)大模型,并在此基礎上打造了SenMARS火星混合現(xiàn)實平臺。SenMARS火星混合現(xiàn)實平臺可以提供包括數(shù)字人、數(shù)字空間、數(shù)字物體在內(nèi)的生成能力。
基于原創(chuàng)的OpenXRLab擴展現(xiàn)實平臺的領先算法,結合大量真人動作數(shù)據(jù),商湯打造了一套基于深度學習的動作捕捉及生成解決方案。
基于商湯原創(chuàng)的虛擬IP解決方案及多種領先的AI技術,可以實現(xiàn)高效率、低成本的AIGC內(nèi)容創(chuàng)作,助力銀行實現(xiàn)前端業(yè)務的用戶積累和營銷轉(zhuǎn)化。
字節(jié)跳動
抖音有很多 NLP 的落地場景,多模態(tài),語義理解,詞法分析,意圖分析,多語言,廣告等等,絕對有你的用武之地;而工程方面的也有非常多有挑戰(zhàn)的工作等著你,支持數(shù)萬億視頻的快速檢索框架,超大規(guī)模分布式系統(tǒng),高性能深度學習框架和平臺構建等等,方向眾多。
2023年2月7日,谷歌通過Twitter發(fā)布了一個在線短視頻廣告,推廣其旗下、基于大型語言模型LaMDA的聊天機器人Bard。谷歌已經(jīng)向AI初創(chuàng)企業(yè)Anthropic投資約3億美元,獲得Anthropic約10%的股份,后者將用投資從谷歌的云計算部門購買大量計算資源。
谷歌所研發(fā)的LaMDA,是一種基于網(wǎng)絡上數(shù)十億詞匯進行訓練的大型語言模型。它不僅受益于谷歌更強大的計算能力和研發(fā)團隊,并且谷歌還有能力通過數(shù)百萬用戶的反饋來對LaMDA模型及聊天機器人Bard進行微調(diào)。按照Pichai的說法,Bard可以利用谷歌龐大的信息庫,為用戶提供準確且高質(zhì)量的答案,對微軟及ChatGPT構成有力威脅。
Meta AI(Facebook)
2022年5月,MetaAI官宣發(fā)布了基于1750億參數(shù)的超大模型OPT-175B,還對所有社區(qū)免費開放。
2022年12月22日,該模型的更新版本OPT-IML(Open Pre-trained Transformer)正式上線,Meta稱其「對2000個語言任務進行了微調(diào),包含1750 億個參數(shù)」,還將為非商業(yè)研究用途免費開放。
MetaAI在2022年5月宣布了一項長期研究計劃,與神經(jīng)影像中心NeuroSpin (CEA)和INRIA合作,以更好地了解人類的大腦如何處理語言。該項目的主要工作是比較AI語言模型和大腦如何響應相同的口語或書面句子,進而將得出的見解和結論用于指導AI模型的開發(fā),使得新模型能夠像人類一樣高效地處理語音和文本。
Open.AI
OpenAI是全球最著名的人工智能研究機構,發(fā)布了許多著名的人工智能技術和成果,如大語言模型GPT系列、文本生成圖片預訓練模型DALL·E系列、語音識別模型Whisper系列等。由于這些模型在各自領域都有相當驚艷的表現(xiàn),引起了全世界廣泛的關注。
2022年11月30日,OpenAI帶來了一種全新的 AI 聊天機器人——ChatGPT,它在很多問題上近乎完美的表現(xiàn)使得它僅僅5天就有了100萬用戶。它可以幫助我們寫代碼、寫博客、解釋技術,可以多輪對話,寫短劇等等。
Stability.AI
以AI繪畫走紅全球的新晉獨角獸公司Stability AI,去年推出了開源AI模型Stable Diffusion。借助這一模型,任何人只需要提供一段文字描述,就有機會創(chuàng)作出任意風格的繪畫作品。Stable Diffusion自2022年8月推出以來,已經(jīng)被全球超過20萬開發(fā)者下載和授權。Stability AI的消費級產(chǎn)品DreamStudio注冊用戶來自全球50多個國家,已經(jīng)超過100萬,他們共同創(chuàng)建了超過1.7億張圖像。
Midjourney
Midjourney-Ai 一款搭載在Discord上的人工智能繪畫聊天機器人,一分鐘繪圖,效果出眾,至今仍然是AI繪圖領域里的佼佼者。對于普通人來說,使用Midjourney的門檻非常低,你只需從Midjourney官網(wǎng)點擊進入它們的Discord服務器,任意選擇一個新手頻道(#newbies),然后在聊天框里輸入或者調(diào)用“ / imagine”選項,輸入一句描繪你想要實現(xiàn)畫面的文字即可。
MiniMax名之夢
MiniMax名之夢,致力于成為通用人工智能時代基礎設施建設者和內(nèi)容應用創(chuàng)造者,靠譜的產(chǎn)品和技術規(guī)劃,充裕資金(全球頂級投資機構),信奉產(chǎn)品和技術驅(qū)動的商業(yè)模式變革,“不走捷徑”得用“智能創(chuàng)造極致體驗”。核心成員均來自于中美頂級科技/互聯(lián)網(wǎng)企業(yè)和海內(nèi)外知名院校。團隊擁有豐富的計算資源和數(shù)據(jù)壁壘,促使前沿技術與產(chǎn)品的結合。
深言科技
以自研的中文超大規(guī)模預訓練模型為核心構建工業(yè)級中文信息處理引擎,并研發(fā)最優(yōu)秀的產(chǎn)品,引領中國的語言信息處理智能化革命。由于天然的語言差異和屏障,國外的英文大模型無法用于中文語言信息處理場景。而中文大模型的研發(fā)遠未成熟,實際性能相較英文大模型仍有不小差距。這既是挑戰(zhàn),更是機遇——中文語言信息智能處理這一極為廣闊的市場仍然一片藍海。依靠這些模型強大的語言能力,文章自動寫作、摘要自動生成、人機交互對話等一系列應用迅速鋪開,并已產(chǎn)生巨大商業(yè)價值。
FlagOpen飛智(智源研究院)
北京智源人工智能研究院(簡稱:智源研究院 Beijing Academy of Artificial Intelligence,BAAI)是人工智能領域的新型研發(fā)機構,目前正在研發(fā)的有“悟道”人工智能大模型項目、“天演”人工智能生命模擬工程、“九鼎”智算平臺、AI技術賦能生命科學研究等。
GPT-3、OPT系列、悟道等預訓練模型在NLP領域取得了非常矚目的效果,但是不同代碼倉庫有著不同實現(xiàn)風格,并且在預訓練大模型過程中使用的技術也各不相同,造成了技術鴻溝。為了快速加載、訓練、推理不同大模型,使用最新最快的模型并行技術以及提高用戶訓練和使用模型的便捷性,智源人工智能研究院推出了FlagAI(飛智)基礎模型開源項目,為一鍵調(diào)大模型等功能提供支持。
FlagAI飛智是一個快速、易于使用和可擴展的AI基礎模型工具包。 支持一鍵調(diào)用多種主流基礎模型,同時適配了中英文多種下游任務。
報告申明
10.1 團隊介紹
非凡產(chǎn)研是非凡資本旗下專業(yè)的新商業(yè)創(chuàng)新及發(fā)展研究中心。非凡產(chǎn)研專注于商業(yè)場景下國內(nèi)及出海企業(yè)服務生態(tài)領域的研究,涉及方向包括:新營銷、新零售、新體驗等,來幫助品牌和商家在全球化和數(shù)字化的時代獲得先機和提升競爭力,同時,非凡產(chǎn)研致力于將數(shù)據(jù)技術、人工智能和自動化等新技術與不同領域傳統(tǒng)產(chǎn)業(yè)相結合,包括:消費零售、本地生活、醫(yī)療健康等,助力企業(yè)插上數(shù)智化的翅膀。團隊成員來自知名研究咨詢公司、私募基金和科技媒體等,是一支具有深入洞察、專業(yè)知識和豐富資源的分析師團隊。
10.2 免責聲明
本報告由非凡產(chǎn)研發(fā)布,本報告版權歸非凡產(chǎn)研所有。任何中文轉(zhuǎn)載或引用,需注明報告來源,國外機構如需轉(zhuǎn)載引用,請?zhí)崆奥?lián)系授權。
本報告為非凡產(chǎn)研作為第三方機構的獨立原創(chuàng)分析,報告內(nèi)容不代表任何企業(yè)的立場,且均不構成對任何人的投資建議。因此投資者務必注意,因據(jù)此做出的任何投資決策與非凡產(chǎn)研及其員工或者關聯(lián)機構無關。
在法律許可的情況下,非凡產(chǎn)研及其關聯(lián)機構可能持有報告中提到的公司的股權,或為其提供或爭取提供籌資或財務顧問等相關服務,其員工可能擔任報告中所提及公司的董事。