(電子商務(wù)研究中心訊) 最近十年,我們一直在建立一個移動優(yōu)先(mobile-first)的世界,而接下來的十年里,我們的將轉(zhuǎn)向人工智能優(yōu)先(AI-first)的世界。(Google CEO Sundar Pichai,2016年10月)
從Amazon和Facebook到Google和Microsoft,世界上最具影響力的技術(shù)公司的領(lǐng)導(dǎo)者都在表現(xiàn)出了對人工智能(AI)極大的熱愛。那么什么是AI?為什么如此重要?為什么會在現(xiàn)在成為熱點?雖然人們對于AI越來越感興趣,但是只有專家才能真正能夠理解這個領(lǐng)域。我們的目標是使更多人接觸到這個重要領(lǐng)域。
首先我們要解釋AI以及“機器學(xué)習(xí)”等關(guān)鍵術(shù)語的含義,闡述成果最豐富的AI領(lǐng)域“深度學(xué)習(xí)”是如何運作的,并對AI解決的問題及為什么這些問題很重要進行探索。我們還會分析,為什么二十世紀五十年代發(fā)明的AI技術(shù)會在今天迎來它的時代。
作為風(fēng)險投資人,我們一直在尋找能夠為客戶和公司創(chuàng)造價值的新潮流。我們相信AI會是一種比移動化和云計算更重要的變革。Amazon的CEO Jeff Bezos表示,“很難說在接下來的20年,AI會對社會造成怎樣的影響。”無論你是客戶、行政人員、企業(yè)家還是投資人,我們希望這篇文章能夠不同于那些天花亂墜的宣傳,真正為你解釋為什么這個新型潮流對我們來說如此重要。
一、什么是AI?
人工智能:關(guān)于智能程序的科學(xué)
1956年,達特茅斯學(xué)院的助理教授John McCarthy創(chuàng)造了“人工智能”(AI)一詞,指那些能夠表現(xiàn)出智能行為的硬件和軟件,用John McCarthy的話說,就是“制造智能機器,尤其是智能計算機程序的科學(xué)和工程。”
基礎(chǔ)的“AI”已經(jīng)存在了幾十年,在特定環(huán)境下通過基于一定規(guī)則的程序呈現(xiàn)基本的智能行為。但是取得的成績是有限的,因為用于處理很多現(xiàn)實世界問題的算法是很難人工進行編程的。
在進行醫(yī)療診斷、預(yù)測機器故障或是測定特定資產(chǎn)的市場價值等復(fù)雜活動時,會涉及到上千個數(shù)據(jù)組和變量之間的非線性關(guān)系。在這些情況下,我們很難用現(xiàn)有的數(shù)據(jù)得到“最佳”預(yù)測結(jié)果。而在其他領(lǐng)域,包括在圖像中識別目標和語言翻譯等,我們甚至無法創(chuàng)建規(guī)則來描述我們尋求的特征。我們怎么可能編寫一組適用于所有情形的程序,來描述一只小狗的外貌呢?
進行數(shù)據(jù)優(yōu)化和功能特征等復(fù)雜的預(yù)測時會遇到一些困難,假使我們將這種困難由程序員那里轉(zhuǎn)移到程序呢?這就是現(xiàn)代人工智能的責(zé)任。
機器學(xué)習(xí)也屬于AI技術(shù),所有機器學(xué)習(xí)都屬于AI,但AI并不只是機器學(xué)習(xí)(見表一)。從人們對AI的興趣可以看出對機器學(xué)習(xí)的熱情,這一領(lǐng)域的發(fā)展非常迅速并且意義重大。
有些問題對于人類來說非常復(fù)雜,而機器學(xué)習(xí)可以幫助我們將一部分負擔(dān)轉(zhuǎn)移給算法,來解決這些問題。1959年,AI的先驅(qū)Arthur Samuel曾經(jīng)寫道,機器學(xué)習(xí)是“一種賦予計算機無需明確編程就能學(xué)習(xí)的能力的研究領(lǐng)域”。
大部分機器學(xué)習(xí)的目標都是針對特定使用情況開發(fā)預(yù)測引擎。算法會接收到某一領(lǐng)域(比如一個人在過去看過的電影)的信息,對投入進行權(quán)衡,做出有用的預(yù)測(一個人在未來喜歡不同電影的可能性)。通過賦予“計算機學(xué)習(xí)的能力”,可以利用算法完成最優(yōu)化的任務(wù),最優(yōu)化也就是通過衡量可用數(shù)據(jù)中的變量,對未來進行準確預(yù)測。我們還可以更進一步,將特征詳述的任務(wù)也交給程序來做。
機器學(xué)習(xí)算法要經(jīng)過訓(xùn)練。算法首先接收到例子,并且已知這些例子的輸出,記錄下預(yù)測輸出與真實輸出的差距并調(diào)整輸入的權(quán)重提高預(yù)測的準確性,直到得出最優(yōu)值。因此,機器學(xué)習(xí)算法最典型的特征就是,預(yù)測的質(zhì)量會隨著經(jīng)驗的豐富而提升。我們提供的數(shù)據(jù)越多(一定程度上),預(yù)測引擎能得出的結(jié)果就越優(yōu)化。
機器學(xué)習(xí)的方法有超過15種,每一種都使用不同算法結(jié)構(gòu),依據(jù)得到的數(shù)據(jù)實現(xiàn)預(yù)測最優(yōu)化。“深度學(xué)習(xí)”是其中一種方法,在新的領(lǐng)域取得了突破性成果,我們將在下文中對此方法進行探索。此外一些沒有受到很多關(guān)注的技術(shù)也很有價值,它們適用于更廣泛的使用情形。除了深度學(xué)習(xí)外,“隨機森林”也是一種最有效率的機器學(xué)習(xí)算法,可以創(chuàng)造很多決策樹,使預(yù)測最優(yōu)化;
“貝葉斯網(wǎng)絡(luò)”使用概率性方法分析變量及各變量之間的關(guān)系;在支持向量機中輸入的是類別化的案例,它可以創(chuàng)造模型,把新的輸入分配到各個類別中。
每一種方法都有優(yōu)勢和不足,所以要結(jié)合起來使用(一種組合方法)。哪種算法會被選擇出來解決某一特定問題,取決于可用數(shù)據(jù)集等因素的性質(zhì)。實踐中,開發(fā)者傾向于通過實驗觀察哪些算法是有效果的。
機器學(xué)習(xí)的使用案例根據(jù)我們的需求和想象而不同。擁有正確的數(shù)據(jù)后,我們可以建立算法實現(xiàn)各種目的:根據(jù)某人之前的購買記錄推薦購買產(chǎn)品;預(yù)測汽車裝配線上的機器何時會發(fā)生故障;預(yù)測電子郵件地址是否錯誤;估計信用卡交易欺詐行為的可能性;還有很多其他目的。
深度學(xué)習(xí):將特征詳述工作交給算法
即使使用隨機森林、貝葉斯網(wǎng)絡(luò)、支持向量機等普通機器學(xué)習(xí)方法,也很難編寫出能很好地完成特定任務(wù)的程序,從理解語音到識別圖像中的對象。因為我們無法以實際、可靠的途徑來詳述特征。例如,如果想要編寫計算機程序來識別汽車的形象,我們無法在算法中詳述汽車的特征,來確保在所有情況下都能準確識別。汽車的形狀、大小和顏色多種多樣,位置、方向和形態(tài)也有所不同。背景、燈光和很多其他因素都會影響對象的外表。一組規(guī)則中需要包含的變量太多了,即使我們能夠全部包含進去,這種解決方案也不具備延展性。我們需要為每種需要識別的對象都編寫一組程序。
深度學(xué)習(xí)(DL)已經(jīng)徹底改變了人工智能世界。有超過15種實現(xiàn)機器學(xué)習(xí)的方法,深度學(xué)習(xí)就是其中一種,所有深度學(xué)習(xí)都屬于機器學(xué)習(xí),但是機器學(xué)習(xí)并不只是深度學(xué)習(xí)。
通過深度學(xué)習(xí),程序員可以不必完成特征詳述(根據(jù)數(shù)據(jù)定義需要分析的特征)或最優(yōu)化(如何權(quán)衡數(shù)據(jù)以實現(xiàn)準確預(yù)測)的任務(wù),而是全部交給算法來完成。
那么如何實現(xiàn)這些呢?深度學(xué)習(xí)的突破點在于模擬大腦,而不是模擬世界。我們的大腦會學(xué)習(xí)做有難度的事情,比如理解話語和識別物體,而且并不是通過詳盡的規(guī)則而是通過時間和反饋來學(xué)習(xí)。小的時候我們體驗這個世界(比如看見一張汽車的圖片),做出預(yù)測(汽車!)然后收到反饋(沒錯!)。我們沒有通過一組詳盡的規(guī)則,而是通過訓(xùn)練進行學(xué)習(xí)。
深度學(xué)習(xí)使用的就是這種方法。將人造的、以軟件為基礎(chǔ)的計算器連接在一起,類似于大腦中的神經(jīng)元。它們組成了一個“神經(jīng)網(wǎng)絡(luò)”,接收輸入并進行分析、作出判斷,如果判斷正確,就做出通知,如果輸出是錯誤的,算法就會對神經(jīng)元之間的聯(lián)系做出調(diào)整,改變未來的預(yù)測。最初網(wǎng)絡(luò)會出現(xiàn)很多次錯誤,但隨著我們輸入數(shù)以百萬計的例子,神經(jīng)元之間的聯(lián)系就會得到調(diào)整,最終幾乎在所有情形下,神經(jīng)網(wǎng)絡(luò)都會做出正確的判斷,這也就是熟能生巧。
通過這個過程,我們現(xiàn)在可以:
識別圖片中的元素;
實時語言翻譯;
語音控制設(shè)備(通過Apple Siri、Google Now、Amazon Alexa以及Microsoft Cortana);
預(yù)測基因變化會對DNA轉(zhuǎn)錄產(chǎn)生怎樣的影響;
分析客戶反饋中的情感;
通過醫(yī)學(xué)影像探測腫瘤。
深度學(xué)習(xí)并不能用于解決所有問題,其通常會需要利用大型數(shù)據(jù)集進行訓(xùn)練,需要廣泛的處理能力來訓(xùn)練和運行神經(jīng)網(wǎng)絡(luò)。“可解釋性”也是一個問題,要知道神經(jīng)網(wǎng)絡(luò)如何實現(xiàn)預(yù)測是非常困難的。但是深度學(xué)習(xí)使程序員從復(fù)雜的特征詳述工作中解放出來,為一系列重要問題提供成功的預(yù)測機制。深度學(xué)習(xí)最終會成為AI開發(fā)者的強大工具。
二.深度學(xué)習(xí)是如何工作的?
既然深度學(xué)習(xí)如此重要,了解其工作的基本要素也是非常有價值的。深度學(xué)習(xí)需要使用一個人工“神經(jīng)網(wǎng)絡(luò)”,即一組相互連接的“神經(jīng)元”(基于軟件的計算器)。
一個人工神經(jīng)元至少會接收一個輸入,其會以此為基礎(chǔ)進行數(shù)學(xué)計算,得到輸出結(jié)果。輸出結(jié)果會依賴于每個輸入的權(quán)重和神經(jīng)元中的“輸入-輸出函數(shù)”的結(jié)構(gòu)(圖5)。輸入-輸出函數(shù)會發(fā)生變化,神經(jīng)元可能是:
一個線性單元(輸出與總加權(quán)輸入成一定比例);
一個闕值單元(輸出可分為兩個等級,根據(jù)總輸入是否高于特定值確定其等級);或者Sigmoid單元(輸出不斷變化,與輸入變化不成線性關(guān)系)。
當(dāng)神經(jīng)元相互連接時就會產(chǎn)生神經(jīng)網(wǎng)絡(luò),一個神經(jīng)元的輸出會成為另一個神經(jīng)元的輸入。
神經(jīng)網(wǎng)絡(luò)會組成多層神經(jīng)元(所以會有“深度”學(xué)習(xí))。“輸入層(input layer)”接收信息,如一組圖片,網(wǎng)絡(luò)會對此進行處理。“輸出層(output layer)”負責(zé)提供結(jié)果,多數(shù)活動都發(fā)生在輸入層和輸出層之間的“隱層(hidden layers)”上。神經(jīng)網(wǎng)絡(luò)上每一層的每個神經(jīng)元的輸出都是下一層的一個神經(jīng)元的輸入(圖7)。
下面就以一個圖像識別算法為例,在圖像中識別人臉。將數(shù)據(jù)輸入神經(jīng)網(wǎng)絡(luò),由第一層來識別局部對比的模式等“低等級”特點,如輪廓。圖像穿過網(wǎng)絡(luò)后,會逐漸提取其中的“高等級”特點,從輪廓到鼻子,再到面部。
在輸出層,通過訓(xùn)練神經(jīng)網(wǎng)絡(luò)會得出關(guān)于圖片屬于某一類的可能性(人臉:97%;氣球:2%;樹葉:1%)。
訓(xùn)練神經(jīng)網(wǎng)絡(luò)的方式就是將大量帶有標記的例子展現(xiàn)在它們面前,可以檢測出來錯誤,算法也會對神經(jīng)元之間聯(lián)系的權(quán)重進行調(diào)整,來完善結(jié)果。多次重復(fù)這個優(yōu)化過程,就可以部署系統(tǒng)并對未標記的圖像進行評估。
以上是一個簡單的神經(jīng)網(wǎng)絡(luò),但是結(jié)構(gòu)可以變化,且多數(shù)比較復(fù)雜。變量包括同層神經(jīng)元之間的連接;區(qū)別每層神經(jīng)元的數(shù)量;神經(jīng)元之間的聯(lián)系向上一等級網(wǎng)絡(luò)輸出(遞歸神經(jīng)網(wǎng)絡(luò))。
設(shè)計和完善神經(jīng)網(wǎng)絡(luò)需要大量的技能,步驟包括為特定應(yīng)用組織網(wǎng)絡(luò)、提供合適的訓(xùn)練數(shù)據(jù)集,根據(jù)進展調(diào)整網(wǎng)絡(luò)結(jié)構(gòu),以及結(jié)合多種方法。
三.AI為什么很重要?
AI要處理的是非常有深度的難題,因此非常重要,這些問題的解決方案可以應(yīng)用于那些對人類幸福感非常重要的部門,從健康、教育和商業(yè)到交通、公共事業(yè)和娛樂。
二十世紀五十年代起,AI研究就關(guān)注了五個領(lǐng)域:
推理:通過邏輯推理解決問題的能力。
知識:表現(xiàn)關(guān)于世界知識的能力。(理解世界上的一些特定實體、事件和狀況;具有某些特性的要素;可分類的要素。)
計劃:制定和實現(xiàn)目標的能力(世界的未來有一種特定狀態(tài)是我們所期待的,可以通過一系列的活動影響到通向這種狀態(tài)的過程)。
交流:理解書面和口頭語言的能力。
感知:根據(jù)視覺影像、聲音和其他感官輸入對與世界有關(guān)的事情進行推理的能力。
AI的價值可以體現(xiàn)在很多方面,這些能力的進步帶來的不只是發(fā)展而是變革。AI的應(yīng)用事例包括以下方面:
推理:法律評定;金融資產(chǎn)管理;財務(wù)應(yīng)用處理;游戲;自主武器系統(tǒng)。
知識:醫(yī)療診斷;藥品研發(fā);媒體推薦;購買預(yù)測;金融市場貿(mào)易;欺詐防范。
計劃:物流;行程安排;導(dǎo)航;物理和數(shù)字網(wǎng)絡(luò)優(yōu)化;預(yù)見性維護;需求預(yù)測;庫存管理。
交流:聲音控制;智能代理,助理及客戶支持;書面及口頭語言實時翻譯;實時轉(zhuǎn)錄。
感知:自動駕駛;醫(yī)療診斷;監(jiān)控。
接下來幾年,幾乎所有部門都會在更多流程中應(yīng)用機器學(xué)習(xí)。比如簡單的企業(yè)功能,如一家公司中的人力資源(HR),就即將應(yīng)用機器學(xué)習(xí);
員工招聘可以更有目標性,可以使用智能工作匹配和部分自動化評估功能;
通過人員需求和缺席的預(yù)測性計劃可以強化員工管理;
如果能夠推薦更適合員工的學(xué)習(xí)內(nèi)容,員工學(xué)習(xí)也會更有效果;
通過對員工離職風(fēng)險的預(yù)測可以減少人員變動。
機器學(xué)習(xí)將變得正規(guī)化,成為開發(fā)人員標準工具的一部分,能夠完善并重塑現(xiàn)有流程。
機器學(xué)習(xí)的后續(xù)影響會超越即時影響。深度學(xué)習(xí)促進了計算機視覺的發(fā)展,例如可以實現(xiàn)車輛(轎車和卡車)自動駕駛。那么其又會帶來哪些影響呢?目前在英國有90%的人和80%的貨物是通過公路運輸?shù)?,如果使用自動駕駛車輛會產(chǎn)生以下影響:
安全(90%的交通事故是由駕駛員的疏忽引起的)
雇傭(英國有220萬運輸及物流行業(yè)的員工,年薪約為570億英鎊)
保險(Autonomous Research預(yù)計,之后英國的汽車保險費用將下降63%)
部門經(jīng)濟(客戶將使用按需交通服務(wù),代替自己的汽車);
汽車生產(chǎn)能力;城市計劃;規(guī)則及其他。
四.為什么現(xiàn)在會是AI的時代?
AI研究始于二十世紀五十年代,為什么在經(jīng)歷了多次失敗以后,現(xiàn)在迎來了轉(zhuǎn)折點?新算法的產(chǎn)生、數(shù)據(jù)通知能力的提升、更好的訓(xùn)練算法的硬件以及促使開發(fā)者使用AI技術(shù)的云服務(wù)。
1.經(jīng)過改進的算法
盡管深度學(xué)習(xí)并不是新技術(shù),首個有效多層神經(jīng)網(wǎng)絡(luò)的詳細說明發(fā)布于1965年,但是在過去十年里算法的發(fā)展確實對深度學(xué)習(xí)產(chǎn)生了很大影響。
由于卷積神經(jīng)網(wǎng)絡(luò)(CNN)的發(fā)展,我們在圖像中識別物體的能力也得到了提高(圖9)。受到動物視覺皮質(zhì)的啟發(fā),神經(jīng)網(wǎng)絡(luò)中的每一層都是特定模式存在的過濾器。2015年,微軟的基于CNN的計算機視覺系統(tǒng)(準確度:95.1%)在圖片中識別物體的能力超過了人類(準確度:94.9%)。“據(jù)我們所知”,他寫道,“我們的成果的表現(xiàn)首次超過了人類。”CNN更加廣泛的應(yīng)用還包括視頻和語音識別。
同時,遞歸神經(jīng)網(wǎng)絡(luò)(RNNs)出現(xiàn)后,語音和字跡的識別能力也在迅速提高(圖10)。RNNs的反饋聯(lián)系能夠確保數(shù)據(jù)進入一個循環(huán),這不同于只能正向輸送的常規(guī)神經(jīng)網(wǎng)絡(luò)。有一種強大的新型RNN叫做“長短時記憶(LSTM)”模型。通過附加的聯(lián)系和存儲單元,RNN能夠記憶幾千個步驟之前看見的數(shù)據(jù),并通知以下解釋,這對于語音識別來說非常有價值,對下一個詞的解釋可以從前面的單詞那里得知。2012年開始,Google開始使用LSTM來支持Android系統(tǒng)中的語音識別,僅六周前,微軟的工程師宣布,他們的系統(tǒng)誤字率為5.9%,這是首次大致等同于人類的水平。
2.專門化硬件
繪圖處理器(GPUs)是專門的電子電路,極大削減了深度學(xué)習(xí)所需的訓(xùn)練神經(jīng)網(wǎng)絡(luò)的時間。
訓(xùn)練神經(jīng)網(wǎng)絡(luò)廣泛應(yīng)用了矩陣計算方法。所以對3D游戲有用的GPUs非常適合加速深度學(xué)習(xí)的發(fā)展,一個簡單的GPU就能夠?qū)⒂?xùn)練效率提升5倍,在較大的問題上,收獲或許增加了不只10倍。如果結(jié)合上那些為了廣泛使用深度學(xué)習(xí)框架而調(diào)整的軟件開發(fā)裝備,訓(xùn)練速度會有更大的提升。(圖11)
3.大規(guī)模數(shù)據(jù)
用于深度學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò)通常都需要利用大型數(shù)據(jù)組進行訓(xùn)練,從幾千個例子到幾百萬個例子。幸運的是,數(shù)據(jù)的創(chuàng)造和可用性在以指數(shù)方式增長?,F(xiàn)在,隨著進入數(shù)據(jù)的“第三次浪潮”,人類每天會產(chǎn)生2.2艾字節(jié)(23億千兆字節(jié))的數(shù)據(jù);世界上所有數(shù)據(jù)中有90%都產(chǎn)生于過去的24個月。
數(shù)據(jù)創(chuàng)造的“第一次浪潮”開始于二十世紀八十年代,涵蓋文檔和交易數(shù)據(jù),可以聯(lián)網(wǎng)的臺式PC的普及也加速了這次浪潮。接下來是數(shù)據(jù)的“第二次浪潮”,是非結(jié)構(gòu)化媒體(電子郵件、照片、音樂和視頻)的一次爆發(fā),普及化的智能手機聯(lián)網(wǎng)后會產(chǎn)生網(wǎng)頁數(shù)據(jù)和元數(shù)據(jù)?,F(xiàn)在我們正在邁入數(shù)據(jù)的“第三時代”,工業(yè)和家中都可以部署機器傳感器,創(chuàng)造額外的監(jiān)控、分析和元數(shù)據(jù)。
假定今天我們創(chuàng)造出的大量數(shù)據(jù)都是通過互聯(lián)網(wǎng)傳送的,膨脹的網(wǎng)絡(luò)交通就會成為大量增長的數(shù)據(jù)量的防火墻。1992年,人類每天傳送100GB的數(shù)據(jù),而到了2020年,我們每秒就將傳送61,000GB數(shù)據(jù)。
我們能夠使用的通用數(shù)據(jù)越來越多,專業(yè)數(shù)據(jù)資源加速了機器學(xué)習(xí)的進程。例如ImageNet,是一個可以自由使用的數(shù)據(jù)庫,擁有超過一千萬個帶標簽的圖像。這個數(shù)據(jù)庫加速了對象分類深度學(xué)習(xí)算法的發(fā)展。
4.云服務(wù)
行業(yè)內(nèi)頂尖的云計算供應(yīng)商會提供云端的機器學(xué)習(xí)基礎(chǔ)架構(gòu)及服務(wù),能夠促進開發(fā)者對機器學(xué)習(xí)的使用。
Google、Amazon、Microsoft和IBM都會通過提供云端基礎(chǔ)架構(gòu)(建模和迭代環(huán)境、可擴展的“GPUs即服務(wù)”和相關(guān)托管服務(wù))來降低開發(fā)機器學(xué)習(xí)功能的成本和難度。
此外,他們提供的云端機器學(xué)習(xí)服務(wù)(從圖像識別到語言翻譯)范圍也在擴大,開發(fā)人員可以直接在自己的應(yīng)用中使用這些服務(wù)。Google機器學(xué)習(xí)提供了一些很容易獲得的服務(wù),包括視覺(物體識別、明確內(nèi)容檢測、人臉檢測和圖像情感分析);語音(語音識別和語音文字轉(zhuǎn)換);文本分析(實體識別、情感分析、語言檢測及翻譯);以及求職(列舉工作機會以及資格匹配)。Microsoft Cognitive Services能夠提供超過21種視覺、語音、語言、知識和搜索領(lǐng)域的服務(wù)。
5.利益和創(chuàng)業(yè)
在過去五年里AI領(lǐng)域的公共利益增長了六倍(圖13),風(fēng)投公司對AI公司的投資也大幅增加(圖14)。我們已經(jīng)進入了一個良性循環(huán),機器學(xué)習(xí)領(lǐng)域的進步正在吸引投資、創(chuàng)業(yè)以及注意力。而后者又會反過來加速機器學(xué)習(xí)的發(fā)展。
五.前景如何?
機器學(xué)習(xí)能帶來的利益是無窮的,我能夠看到的就包括從無人駕駛汽車到人機互動的新途徑。還有很多利益沒有這么明顯,但是能夠提供日常的業(yè)務(wù)流程和客戶服務(wù)的能力和效率。
有時我們的期望過高,超出了短期的發(fā)展?jié)摿?,我們希望未來能夠真正認識AI,隨著機器學(xué)習(xí)被用于改善和重新設(shè)想現(xiàn)有的系統(tǒng),希望我們能夠認識到AI的價值。
歷史上,產(chǎn)業(yè)革命會通過新的能量來源和傳動裝置改變生產(chǎn)和交流方式。18世紀80年代,第一次產(chǎn)業(yè)革命通過蒸汽動力實現(xiàn)了生產(chǎn)自動化。19世紀70年代,第二次產(chǎn)業(yè)革命通過電力實現(xiàn)了大量生產(chǎn)。20世紀70年代以來,第三次產(chǎn)業(yè)革命通過電子工業(yè)和軟件技術(shù)實現(xiàn)了生產(chǎn)及通訊的自動化?,F(xiàn)在,軟件遍布整個世界,信息處理成為了價值創(chuàng)造的首要來源。機器學(xué)習(xí)使我們的世界更加智能化,將產(chǎn)生歷史性的利益。
第四次工業(yè)革命:一場深刻的系統(tǒng)性變革來源:THINKTANK新智囊
對于所有行業(yè)和企業(yè)而言,問題不再是“我是否會被他人顛覆”,而是“顛覆會何時到來,會以什么形式出現(xiàn),對我和我所在的組織會產(chǎn)生怎樣的影響”。
當(dāng)今時代,我們面臨著紛繁復(fù)雜的挑戰(zhàn),其中最嚴峻、最重大的挑戰(zhàn)莫過于如何理解并塑造本次新技術(shù)革命,這不亞于人類的一次變革。這次革命剛剛開始,正在徹底顛覆我們的生活、工作和互相關(guān)聯(lián)的方式。無論是規(guī)模、廣度還是復(fù)雜程度,第四次工業(yè)革命都與人類過去經(jīng)歷的變革截然不同。
我們尚未完全了解這次新技術(shù)革命的速度和廣度。僅以移動設(shè)備為例,如今,移動設(shè)備將地球上幾十億人口聯(lián)結(jié)到了一起,具有史無前例的處理和存儲能力,并為人們提供獲取知識的途徑,由此創(chuàng)造了無限的可能性。另外,各種新興突破性技術(shù)出人意料地集中出現(xiàn),涵蓋了諸如人工智能、機器人、物聯(lián)網(wǎng)、無人駕駛交通工具、3D(三維)打印、納米技術(shù)、生物技術(shù)、材料科學(xué)、能源儲存、量子計算等諸多領(lǐng)域。盡管其中很多創(chuàng)新成果還處于初期階段,但是在物理、數(shù)字和生物技術(shù)相結(jié)合的推動下,它們在發(fā)展過程中相互促進并不斷融合,現(xiàn)在已經(jīng)發(fā)展到了一個轉(zhuǎn)折點。各行各業(yè)都在發(fā)生重大轉(zhuǎn)變,主要表現(xiàn)為:新的商業(yè)模式出現(xiàn),現(xiàn)有商業(yè)模式被顛覆,生產(chǎn)、消費、運輸與交付體系被重塑。社會層面的一個范例是,我們的工作與溝通方式,以及自我表達、獲取信息和娛樂的方式正在發(fā)生改變。同樣,政府、各類組織機構(gòu)以及教育、醫(yī)療和交通體系正在被重塑。如果我們用創(chuàng)新的方式利用技術(shù),改變?nèi)藗兊男袨楹蜕a(chǎn)、消費體系,我們就有望為環(huán)境再生和保護提供支持,避免因外部效應(yīng)產(chǎn)生隱性成本。無論從規(guī)模、速度還是廣度來看,本次技術(shù)革命帶來的變化都具有歷史性意義。新興技術(shù)的發(fā)展和運用還存在巨大的不確定性,這意味著我們尚不清楚本次工業(yè)革命將如何推動各行業(yè)變革,但變革的復(fù)雜性和各行業(yè)的互聯(lián)性表明,國際社會所有利益相關(guān)者,包括政界、商界、學(xué)術(shù)界和公民社會在內(nèi),都有責(zé)任共同努力,加深對新興趨勢的理解。
為了塑造一個反映我們共同目標和價值觀的美好未來,共識至關(guān)重要。我們必須對下列問題形成全面了解并達成全球共識:技術(shù)正在如何改變當(dāng)代人以及子孫后代的生活?技術(shù)正在如何重塑人類賴以生存的經(jīng)濟、社會、文化和環(huán)境?
這些改變是如此深刻,以至于人類在其發(fā)展歷史上從未迎來如此美好的前景,也從未面臨如此嚴峻的風(fēng)險。然而我擔(dān)心的是,決策者們往往囿于傳統(tǒng)的(非顛覆性)線性思維,或者過于關(guān)注眼前的危機,而難以對影響未來的各種顛覆和創(chuàng)新力量進行戰(zhàn)略性思考。
我知道,一些學(xué)者和專業(yè)人士認為我所討論的這些進步只是第三次工業(yè)革命的延續(xù)。但在我看來,我們正在經(jīng)歷一場具有自身特性的第四次革命,主要有以下三大原因:速度:和前幾次工業(yè)革命不同,本次革命呈現(xiàn)出指數(shù)級而非線性的發(fā)展速度,這是因為我們目前生活在一個高度互聯(lián)、包羅萬象的世界,而且新技術(shù)也在不斷催生更新、更強大的技術(shù)。
廣度與深度:第四次工業(yè)革命建立在數(shù)字革命的基礎(chǔ)之上,結(jié)合了各種各樣的技術(shù),這些技術(shù)正給我們的經(jīng)濟、商業(yè)、社會和個人帶來前所未有的改變。它不僅改變著我們所做的事情和做事的方式,甚至在改變?nèi)祟愖陨?。系統(tǒng)性影響:它包含國家、公司、行業(yè)之間(和內(nèi)部)以及整個社會所有體系的變革。
我寫這本書的目的是提供一本關(guān)于第四次工業(yè)革命的“入門讀物”。本書介紹了此次工業(yè)革命的本質(zhì)、后果和影響,以及我們應(yīng)采取什么措施利用本次工業(yè)革命為共同利益服務(wù)。本書適用于所有對未來新事物有興趣,并致力于利用本次顛覆性變革的機會,塑造一個更美好世界的人。
《第四次工業(yè)革命》具有以下三個主要目標:
幫助人們更好地認識技術(shù)革命的全面性、速度及其全方位影響;
構(gòu)建技術(shù)革命的思維框架,列出核心問題與可能的應(yīng)對措施;
提供一個平臺,激勵公共部門與私營部門就技術(shù)革命問題開展相關(guān)合作。
總之,技術(shù)并非我們無法控制的一個外在因素。我們不必囿于“要么接受,要么拒絕”這樣非此即彼的二元選擇。相反,我們要把握這次劇烈的技術(shù)變革機會,反思我們的本質(zhì)與世界觀。我們越深入思考如何利用這場技術(shù)革命,就越能審視自身以及這些技術(shù)所催生的潛在社會模式,我們也就更有機會推動革命的發(fā)展,從而改善世界狀況。
推動第四次工業(yè)革命的發(fā)展,賦權(quán)于民并以人為本,而不是去人性化并造成社會分裂,這絕非某一個利益相關(guān)群體或行業(yè)靠一己之力就能完成的工作,也不是某一個國家或地區(qū)單槍匹馬就能完成的任務(wù)。這次工業(yè)革命的本質(zhì)和全球性,意味著它會對所有國家、經(jīng)濟體、行業(yè)和公眾產(chǎn)生影響,同時也會受到他們的影響。因此,我們必須跨越學(xué)術(shù)、社會、政治、國家和行業(yè)的界限,投入大量精力開展多方合作。這樣的互動與合作,對于國際社會就第四次工業(yè)革命形成充滿正能量和希望的統(tǒng)一認識必不可少,它能讓所有個體、群體和地區(qū)都能參與當(dāng)前的轉(zhuǎn)型進程,并從中受益。
一場深刻的系統(tǒng)性變革
技術(shù)和數(shù)字化將會改變一切,這個觀點是本書的創(chuàng)作前提。“這次不同了”是一個被濫用甚至經(jīng)常錯用的金句,但基于本書,這句話卻是非常恰當(dāng)?shù)?。簡而言之,各項重大技術(shù)創(chuàng)新即將在全球范圍內(nèi)掀起波瀾壯闊、勢不可當(dāng)?shù)木拮儭U驗檫@場變革規(guī)模極大、范圍極廣,所以目前的顛覆和創(chuàng)新才會顯得如此激烈。如今,創(chuàng)新的發(fā)展速度和傳播速度比以往任何時候都快。airbnb(空中食宿)、優(yōu)步和阿里巴巴等顛覆者,幾年前還籍籍無名,但如今早已家喻戶曉。問世于2007年的蘋果手機,如今在街頭巷尾隨處可見。截至2015年底,全球智能手機總量更是多達20億部。2010年,谷歌宣布研制出首輛無人駕駛汽車。用不了多久,我們就會看到許多無人駕駛汽車行駛在公路上。
這樣的事例不勝枚舉。速度只是第四次工業(yè)革命的一個方面,規(guī)模收益也同樣驚人。數(shù)字化意味著自動化,自動化反過來意味著企業(yè)的規(guī)模收益不會遞減(至少遞減的部分會少一些)。為幫助讀者從總體上理解這個道理,我們拿1990年的底特律(當(dāng)時主要的傳統(tǒng)產(chǎn)業(yè)中心)與2014年的硅谷做一個比較。1990年,底特律最大的三家企業(yè)的總市值、總收入和員工總數(shù)分別為360億美元、2500億美元和120萬人。相比之下,2014年,硅谷最大的三家企業(yè)的總市值高達1.09萬億美元,其2470億美元的總收入與前者不分伯仲,但它們的員工數(shù)量僅約為前者的1/10,只有13.7萬人。與10年前或15年前相比,今天創(chuàng)造單位財富所需的員工數(shù)量要少得多,這是因為數(shù)字企業(yè)的邊際成本幾近為零。此外,在數(shù)字時代,對于許多供應(yīng)“信息商品”的新型公司而言,其產(chǎn)品的存儲、運輸和復(fù)制成本也幾乎是零。一些顛覆性的技術(shù)企業(yè)似乎不需要多少資本,就能實現(xiàn)自身發(fā)展。比如,instagram和Whatsapp等公司并不需要太多啟動資金,借助第四次工業(yè)革命的力量,這些企業(yè)不僅改變了資本的作用,還提升了自身業(yè)務(wù)規(guī)模。這一點充分表明,規(guī)模收益有助于進一步擴大企業(yè)規(guī)模,并影響整個系統(tǒng)的改革。
除速度和廣度之外,第四次工業(yè)革命的另外一個特點是,不同學(xué)科和發(fā)現(xiàn)成果之間的協(xié)同與整合變得更為普遍。不同技術(shù)相伴相生,催生出許多以前只能在科幻小說中才能看到的有形創(chuàng)新成果。比如,數(shù)字制造技術(shù)已經(jīng)可以和生物學(xué)相互作用。一些設(shè)計師和建筑師正在將計算機設(shè)計、增材制造、材料工程學(xué)和合成生物學(xué)結(jié)合在一起,創(chuàng)造出新的系統(tǒng),實現(xiàn)微生物、人體、消費產(chǎn)品乃至住宅之間的互動。通過這種方式,他們制造出(甚至可以說是“培植出”)的物體具有持續(xù)自我改變和調(diào)整的能力(這是動植物的典型特征)。
在《第二次機器革命》一書中,布萊恩約弗森和麥卡菲指出,以當(dāng)今計算機的聰明程度,我們根本無法預(yù)知幾年后它們會有怎樣的應(yīng)用。從無人駕駛汽車和無人機,到虛擬助手和翻譯軟件,人工智能(AI)隨處可見,并改變著我們的生活。人工智能之所以取得巨大進步,既得益于計算能力的指數(shù)級增長,也得益于我們現(xiàn)在可以獲得大量的數(shù)據(jù)。不論是利用軟件發(fā)現(xiàn)新藥,還是利用算法來預(yù)測人的文化喜好,都離不開大量的數(shù)據(jù)。我們在數(shù)字世界里留下的都是像“面包屑”一樣的數(shù)據(jù),許多算法是有能力學(xué)習(xí)這些數(shù)據(jù)的,所以才有了新型的“機器學(xué)習(xí)”和自動發(fā)現(xiàn)技術(shù)。這些技術(shù)可以讓“智能”的機器人和計算機實現(xiàn)自我編程,從基本原理中找到最佳解決方案。所謂的智能助手是快速發(fā)展的人工智能領(lǐng)域的一個分支,蘋果公司的siri語音服務(wù)等應(yīng)用讓我們感受到了這個技術(shù)的威力。要知道,智能個人助手出現(xiàn)的時間不過才兩年而已。今天,語音識別和人工智能的發(fā)展突飛猛進,人機交談將很快成為常態(tài),技術(shù)專家所說的“環(huán)境計算”(ambient computing)也將成為現(xiàn)實。利用環(huán)境計算技術(shù),機器人個人助手可以隨時記筆記并回答用戶提問。未來,我們的設(shè)備將對個人生活產(chǎn)生更大影響,這些設(shè)備會聆聽我們的想法、判斷我們的需求,并在必要時主動為我們提供幫助。
第四次工業(yè)革命是把“雙刃劍”
第四次工業(yè)革命在帶來巨大好處的同時,也會帶來巨大挑戰(zhàn),其中不平等現(xiàn)象的加劇尤其令人擔(dān)憂。不平等現(xiàn)象加劇所帶來的挑戰(zhàn)很難量化,因為我們絕大部分人既是消費者又是生產(chǎn)者,所以創(chuàng)新與顛覆對我們生活水平和福祉的影響既有正面的,也有負面的。
最大的受益者似乎還是消費者。第四次工業(yè)革命產(chǎn)生了一批新產(chǎn)品、新服務(wù),這些產(chǎn)品和服務(wù)可以在不產(chǎn)生任何額外成本的情況下,提高消費者的個人生活效率。如今,預(yù)約出租車、查航班、買產(chǎn)品、付費用、聽音樂、看電影—所有這些事務(wù)都可以遠程完成。技術(shù)給消費者帶來的好處是有目共睹的?;ヂ?lián)網(wǎng)、智能手機和成千上萬的應(yīng)用軟件讓我們生活得更為輕松,也提高了我們的總體工作效率。我們用來閱讀、瀏覽、通信的一臺小小的平板電腦,其運算能力相當(dāng)于30年前5000臺臺式電腦的運算能力總和,且其存儲信息的成本逐步趨近于零。
第四次工業(yè)革命帶來的挑戰(zhàn)顯然主要落在了供應(yīng)方身上,即勞動和生產(chǎn)領(lǐng)域。過去幾年間,在絕大部分最發(fā)達的國家以及中國等快速發(fā)展經(jīng)濟體中,勞動力對GDP(國內(nèi)生產(chǎn)總值)的貢獻比重均有大幅下滑。這當(dāng)中有一半是因為創(chuàng)新驅(qū)使企業(yè)用資本取代勞動力,導(dǎo)致生產(chǎn)設(shè)備相對價格出現(xiàn)下滑。因此,第四次工業(yè)革命的最大受益者是智力和實物資本提供者—創(chuàng)新者、投資人、股東,這正是工薪階層與資本擁有者貧富差距日益懸殊的原因。這一現(xiàn)象也導(dǎo)致很多工人對未來失去希望,認為其實際收入這輩子不會有起色,而他們子女未來的生活也不會比他們這代人更好。不平等現(xiàn)象加劇以及人們對不公正的日益擔(dān)憂是個巨大的挑戰(zhàn)。
此外,所謂的平臺效應(yīng)也在加劇利益和價值向少部分人手中集中。平臺效應(yīng)指的是以數(shù)字業(yè)務(wù)為主的組織通過打造網(wǎng)絡(luò)平臺,匹配多種產(chǎn)品和服務(wù)的買家和賣家,從而獲得越來越大的規(guī)模收益。
平臺效應(yīng)導(dǎo)致的結(jié)果是,為數(shù)不多但勢力龐大的幾家平臺主宰了市場。它的好處是顯而易見的,特別是對消費者而言。通過這些平臺,消費者可以獲得更高的價值和更多的便利,同時支付更低的成本。然而,這些平臺的社會風(fēng)險也是顯而易見的。如果要避免價值和權(quán)力落到少數(shù)人手中,我們就必須設(shè)法平衡數(shù)字平臺(包括行業(yè)平臺)的效益與風(fēng)險,確保其開放性,并為協(xié)作式創(chuàng)新提供機會。
這些影響我們經(jīng)濟、社會和政治體制的根本性變革一旦發(fā)生,便很難消除,哪怕我們在一定程度上逆轉(zhuǎn)全球化進程,也很難消除其影響。對于所有行業(yè)和企業(yè)而言,問題不再是“我是否會被他人顛覆”,而是“顛覆會何時到來,會以什么形式出現(xiàn),對我和我所在的組織會產(chǎn)生怎樣的影響”。顛覆在實實在在地發(fā)生,我們也無法逃避其影響,但這并不意味著我們在顛覆來臨時就毫無招架之力。我們有責(zé)任確立一套共同的價值觀,引導(dǎo)政策選擇并實施變革,讓第四次工業(yè)革命成為所有人的機遇。(來源: 戰(zhàn)略前沿技術(shù))