美女高潮潮喷出白浆视频,欧美村妇激情内射,日本少妇被爽到高潮无码,CHINESE猛男自慰GV

當(dāng)前位置:100EC>電商人物>百度研究院副院長余凱:大數(shù)據(jù)與人工智能(PPT)
百度研究院副院長余凱:大數(shù)據(jù)與人工智能(PPT)
發(fā)布時(shí)間:2015年04月21日 08:59:34

(電子商務(wù)研究中心訊)  本講座選自百度研究院副院長、深度學(xué)習(xí)實(shí)驗(yàn)室主任,兼任負(fù)責(zé)百度圖片搜索產(chǎn)品高級(jí)總監(jiān)余凱博士所做的題為《大數(shù)據(jù)與人工智能》的演講。余凱率先在中 國推動(dòng)人工智能在互聯(lián)網(wǎng)行業(yè)的技術(shù)研發(fā)和創(chuàng)新,余凱博士帶領(lǐng)的團(tuán)隊(duì)把深度學(xué)習(xí)成功應(yīng)用在廣告,搜索、圖象、語音各個(gè)方面,取得了很多突破性的進(jìn)展。

  講座摘要

  首先,余凱簡要介紹了什么是智能,并就智能對生活中的影響、滲透的行業(yè)和歷史演變進(jìn)行展開,提出了萬物互聯(lián)導(dǎo)致數(shù)據(jù)暴增,進(jìn)而導(dǎo)致萬物智能的觀點(diǎn)。之后,余 博士以百度大腦為線索,提出了當(dāng)今社會(huì)百度大腦所思考到的人機(jī)關(guān)系和深度學(xué)習(xí),并分享了百度大腦在業(yè)界廣泛應(yīng)用的案例展示。

  演講全文

  數(shù)據(jù)科學(xué)已經(jīng)在決策科學(xué)、社會(huì)科學(xué)、經(jīng)濟(jì)學(xué)里面扮演越來越重要的角色,所以這種交叉融合,這種碰撞對我們每一個(gè)人來講都是學(xué)習(xí)的機(jī)會(huì),也是一些施展才華的空間。最近在各個(gè)場合有一些分享,今天我尤其要把這個(gè)講座做好。今天是我兒子第一次坐在下面聽我的講座。

  過去我們做的這些工作是跟數(shù)據(jù)有關(guān)系的。一個(gè)大數(shù)據(jù)、一個(gè)人工智能,這兩個(gè)放在一起,今天很多的企業(yè)會(huì)這么重視,在這里給大家分享一下我們自己的故事。百度 在過去兩年多的時(shí)間里面,在人工智能領(lǐng)域有很多技術(shù)方面的投入。今年李彥宏在兩會(huì)上提出中國大腦,很受關(guān)注;麻省理工學(xué)院科技評論雜志去年專門發(fā)表了一篇 評論性文章,介紹百度的人工智能之夢。在國外主流的科技雜志里面報(bào)道一個(gè)中國企業(yè)的科技研發(fā),還是比較少的。我自己感到非常的振奮。

  百度的背景,和很多的互聯(lián)網(wǎng)公司都是一樣的,從技術(shù)的緯度來講,他本質(zhì)上是一個(gè)基于大數(shù)據(jù)的人工智能公司。我們是提供一個(gè)搜索引擎,這個(gè)搜索引擎下面有一個(gè) 非常精致的結(jié)構(gòu),它可以搜索到各種信息、知識(shí),而且服務(wù)是完全免費(fèi)的、給用戶帶來價(jià)值的。但是我們獲得了了大量的搜索行為數(shù)據(jù),并實(shí)現(xiàn)它的商業(yè)價(jià)值,就得 通過廣告、推送服務(wù)。從數(shù)據(jù)到價(jià)值,這中間就需要大量的技術(shù),尤其是基于大數(shù)據(jù)的人工智能技術(shù),包括機(jī)器學(xué)習(xí),自然語言處理,語音識(shí)別,圖像識(shí)別。

  最近在全社會(huì),無論是在中國還是美國,還是科技媒體,還是研究機(jī)構(gòu),還是商業(yè)公司,都在談自動(dòng)駕駛、機(jī)器人、物聯(lián)網(wǎng)、個(gè)性化、VR、AR。其實(shí)這些都是AI 的各個(gè)領(lǐng)域,現(xiàn)在AI已經(jīng)成為科技創(chuàng)新的主戰(zhàn)場,它不光是未來時(shí),而且是現(xiàn)在進(jìn)行時(shí)。我們看電影《超能陸戰(zhàn)隊(duì)》,看似是未來的東西,但是今天很多領(lǐng)域正在 發(fā)生,也在產(chǎn)生價(jià)值。

  到底什么是人工智能?嚴(yán)肅的科學(xué)定義到今天為止,沒有一個(gè)廣泛接受的定義。比如說,有一種說法叫強(qiáng)人工智能,有一種說法叫弱人工智能,還有基于符號(hào)邏輯的、也有基于統(tǒng)計(jì)模型的,有不同的觀點(diǎn)。拋開這些不同的觀點(diǎn),通常一個(gè)人工智能系統(tǒng)有這樣幾個(gè)方面:

  第一,我們希望這個(gè)系統(tǒng)具有感知的能力,就像人一樣,有五官,可以感知周圍的環(huán)境是什么樣的。

  第二,獲取這個(gè)感知以后,對面臨的環(huán)境有一個(gè)理解。比如說對于一個(gè)機(jī)器人來講,他在感知到這個(gè)環(huán)境以后,如果想到后面去跟一個(gè)同學(xué)聊天,他需要尋找最佳路徑。他必須要理解,那條路是走不通的,那條是可以走的。

  第三,在理解的基礎(chǔ)上做出決策,從而達(dá)成目的或完成任務(wù)

  一個(gè)機(jī)器要感知,然后理解,然后決策,這是一個(gè)過程。今天在市場上面無處不在充斥著智能產(chǎn)品:智能湯勺、智能水杯等等。我們把一個(gè)老式的收音機(jī)和智能設(shè)備放 在一起比較,他們有什么不同?區(qū)別一個(gè)系統(tǒng)、一個(gè)產(chǎn)品是不是真的具有智能的能力,有一個(gè)很重要的緯度,就是這個(gè)系統(tǒng)能不能隨著用戶用它的次數(shù)越來越多,它 變得越來越聰明,它是不是真的隨著經(jīng)驗(yàn)積累在不斷的演化。如果它是這樣的,它就是一個(gè)能夠自我學(xué)習(xí)、自我進(jìn)化、自我演化的、智能的系統(tǒng)。所以,學(xué)習(xí)能力是 智能的本質(zhì)屬性之一。

 

  在座有的年紀(jì)跟我相仿,在小學(xué)的時(shí)候有過一篇課文,講的是一個(gè)科學(xué)巨匠做小板凳的故事,他做的那個(gè)板凳非常的丑陋,但是我們能不能說這個(gè)小朋友不聰明?如果 你看他過去幾天做的每一個(gè)小板凳,他一個(gè)比一個(gè)做的好,他具有不斷的從經(jīng)驗(yàn)里面去學(xué)習(xí)的能力,使我們發(fā)現(xiàn)這個(gè)小朋友是非常具有智慧的。你看一個(gè)系統(tǒng)今天的 能力不是最重要的,最重要的是它的增長曲線,隨著大數(shù)據(jù)不斷增加,不斷去使用這個(gè)系統(tǒng),它能變得越來越聰明。

  這里面 我提到了經(jīng)驗(yàn)。經(jīng)驗(yàn)就是數(shù)據(jù),數(shù)據(jù)就是經(jīng)驗(yàn)。我們在機(jī)器學(xué)習(xí)里面有一個(gè)詞叫經(jīng)驗(yàn)數(shù)據(jù)。隨著經(jīng)驗(yàn)演化,就是隨著數(shù)據(jù)的不斷增長,增長你的能力。為什么我們迎 來一個(gè)大數(shù)據(jù)的時(shí)代?因?yàn)閺腜C互聯(lián)網(wǎng)到移動(dòng)互聯(lián)網(wǎng),帶來了一個(gè)數(shù)據(jù)的爆增,在我們?nèi)粘I罾锩?,每一個(gè)人都在貢獻(xiàn)著大量的數(shù)據(jù)。

  這樣一個(gè)場景,是在圣彼得教堂門口的廣場上面,很多人來等待教皇選舉結(jié)果。在八年以后,在同樣一個(gè)地方,可能是同樣一群人,同樣的故事仍在上演。但從一個(gè)緯度來看,移動(dòng)互聯(lián)網(wǎng)在改變每個(gè)人的生活,每個(gè)人的手持設(shè)備在跟著你,它無時(shí)不刻的在產(chǎn)生數(shù)據(jù)。

  今天,每個(gè)人身上連著兩到三個(gè)移動(dòng)設(shè)備,比如說手機(jī)、iPad,這樣一個(gè)趨勢往前演進(jìn),人機(jī)交互是指在這個(gè)環(huán)境里面有無數(shù)個(gè)設(shè)備跟你感知、交互。現(xiàn)在手表也已經(jīng)是一個(gè)智能終端了。

  總的來看,具體的趨勢是我們將進(jìn)入一個(gè)萬物互聯(lián)的時(shí)代。隨之帶來的是每個(gè)你的設(shè)備都會(huì)記錄你的數(shù)據(jù),人跟設(shè)備的連接,人跟人的連接,物與物的連接,設(shè)備與設(shè) 備的連接都在產(chǎn)生數(shù)據(jù)。所以,這是一個(gè)機(jī)會(huì),萬物互聯(lián)將形成大量數(shù)據(jù)無處不在的生態(tài),給我們帶來的機(jī)會(huì)就是智能化時(shí)代的來臨。

  2014年,我們突然看到那么多科幻的電影,那么多人在討論這樣那樣的,包括習(xí)總書記也在院士大會(huì)上談到機(jī)器人。所以這不是偶然,這有一個(gè)時(shí)代的背景。

  在大數(shù)據(jù)的時(shí)代,智能變得越來越重要。有一個(gè)技術(shù),最近很多研究機(jī)構(gòu),包括公司都有很大的投入,這個(gè)技術(shù)就叫深度學(xué)習(xí)。深度學(xué)習(xí)為什么會(huì)在這個(gè)時(shí)代這么受大 家的關(guān)注?谷歌、微軟、Facebook都有專門的研究團(tuán)隊(duì),F(xiàn)acebook2013年9月份第一次成立了研究院。今天很多中國的互聯(lián)網(wǎng)公司都成立了這樣的研究院。

  百度在這方面做了很多的工作,其中一個(gè)表現(xiàn)就是百度大腦項(xiàng)目,這個(gè)項(xiàng)目是一個(gè)有著上千臺(tái)服務(wù)器,包括PC服務(wù)器和GPU服務(wù)器的大規(guī)模數(shù)據(jù)處理系統(tǒng)。去年我講的是百億級(jí)的產(chǎn)品,世界上最大級(jí)的深度神經(jīng)網(wǎng)絡(luò),最近我們把它升級(jí)到千億級(jí)的系統(tǒng)。

 

  基于這樣一個(gè)工程的能力,我們能夠去開發(fā)各種各樣深度學(xué)習(xí)的算法,用在語音、圖象、自然語音理解、廣告的用戶匹配、用戶的建模等等。

  百度大腦目前最成功、最重要的四個(gè)利用的領(lǐng)域:

  第一,搜索。我們用深度學(xué)習(xí)作用在自然語音、文本、網(wǎng)絡(luò)的語意上面,去衡量他們語意的相關(guān)性。

  第二,廣告。因?yàn)閺V告是要智能的匹配,因?yàn)槿绻@個(gè)廣告不被用戶點(diǎn)擊,我們掙不到錢。

  第三,圖象。包括今天李彥宏講到了自動(dòng)駕駛,自動(dòng)駕駛里面圖像技術(shù)是非常重要的。

  第四,語音識(shí)別和理解。最近這幾年業(yè)界取得的進(jìn)展,包括百度做的工作。語音識(shí)別在三十年的時(shí)間里面是一個(gè)進(jìn)展非常緩慢的領(lǐng)域。但是最近三四年時(shí)間里有一個(gè)突飛猛進(jìn)的進(jìn)展,原因的核心就是基于大數(shù)據(jù)的深度學(xué)習(xí)技術(shù)。

  這些應(yīng)用領(lǐng)域在業(yè)務(wù)結(jié)構(gòu)里面扮演什么樣的角色?它怎么把這些事情串起來為公司的核心業(yè)務(wù)產(chǎn)生影響。

  第一,理解意圖。比如說我們的用戶來到百度這個(gè)平臺(tái),傳統(tǒng)上來講,他用關(guān)鍵詞表達(dá)他的搜索需求,但是我們看到最近這兩年有一個(gè)趨勢:第一,用戶需求表達(dá)越來越復(fù)雜,以前很多是搜索信息,現(xiàn)在很多是服務(wù)的需求,這里面有很多復(fù)雜的語意來描述需求。

  第二,更多自然的方式表達(dá)你的需求。比如說自然的語音、句子去問問題,比如說在移動(dòng)終端上面用語音表達(dá)。現(xiàn)在有的APP就是拍個(gè)照,小朋友幫助你做題。這種自然的表達(dá)方式是第二個(gè)趨勢。你用深度學(xué)習(xí)理解自然語言、語音識(shí)別、理解圖象變成是理解用戶的意圖。

  第二,你在理解了意圖以后,你需要連接用戶跟他需要的信息。你在信息、文章那一端需要有更好的理解,這個(gè)理解需要有更好的匹配。匹配用戶的需求,就是優(yōu)化搜索結(jié)果的智能排序。

  第三,精準(zhǔn)推送廣告和服務(wù)。深度學(xué)習(xí)在每一個(gè)領(lǐng)域都發(fā)揮著重要的作用

  為什么深度學(xué)習(xí)在今天受到重視?

  第一點(diǎn),我覺得是一個(gè)很浪漫主義的原因,因?yàn)槲覀兛偸窃谙胛覀兊臋C(jī)器能不能復(fù)制人的智能,復(fù)制生物的智能。所以有一個(gè)觀點(diǎn)是,深度學(xué)習(xí)可能跟人腦的機(jī)理是有關(guān)系的。確實(shí)也是,最早期的去啟發(fā)做深度學(xué)習(xí)的研究,確實(shí)是受到人腦的啟發(fā)。

  第二點(diǎn),特別適合大數(shù)據(jù)。其實(shí)到今天,深度學(xué)習(xí)為什么重要的第一個(gè)原因是最不重要的,因?yàn)槟闳パ芯盔B類怎么飛行,跟我要造一個(gè)飛機(jī)是不一樣的事情。但對于我 們來講,尤其對我們工業(yè)界來講,我們希望能夠造出智能的機(jī)器,他不是去再現(xiàn)人的智能,而是要利用大數(shù)據(jù)去延伸或者互補(bǔ)人的能力。

  第三,端到端的學(xué)習(xí)。過去做模式識(shí)別或者機(jī)器學(xué)習(xí)通常會(huì)分為兩步,第一,根據(jù)你對問題的理解,人工的、人為的去做一些數(shù)據(jù)的預(yù)處理,這里面對人的要求是很高 的,你需要非常精準(zhǔn)的對問題進(jìn)行理解。但是你一旦換一個(gè)問題,你需要重新去理解。深度學(xué)習(xí)把學(xué)習(xí)跟判定是連在一起的,前面不是人工的,它也是學(xué)習(xí),但是一 個(gè)一氣呵成的從端到端的學(xué)習(xí),這個(gè)非常重要。因?yàn)樗屇氵@個(gè)學(xué)習(xí)更加智能,它可以讓你從一個(gè)領(lǐng)域遷移到另外一個(gè)領(lǐng)域,它可以減少人工帶來的不必要的麻煩。

  第四,提供一套建模語音。深度學(xué)習(xí),你不需要對問題有很好的理解,這是一個(gè)錯(cuò)誤的觀點(diǎn)。因?yàn)樯疃葘W(xué)習(xí)跟我們在機(jī)器學(xué)習(xí)里面的圖模型一樣,也是一套語言系統(tǒng), 他讓你表達(dá)你對這個(gè)問題的理解,如果你對這個(gè)問題不理解,深度學(xué)習(xí)對你來講沒有用。在不同的問題里面,我們需要開發(fā)不同的深度學(xué)習(xí)的模型。

  回到第一個(gè)浪漫主義的觀點(diǎn),深度學(xué)習(xí)跟人腦的關(guān)系。計(jì)算機(jī)視覺里面一個(gè)很著名的深度學(xué)習(xí)的模型是卷積神經(jīng)網(wǎng)絡(luò)。他們做這個(gè)的時(shí)候受到一個(gè)模型的啟發(fā),這個(gè)模型80年代獲得諾貝爾醫(yī)學(xué)生理學(xué)獎(jiǎng)。他講的是視覺神經(jīng)系統(tǒng)早期在視覺皮層里面怎么樣處理視覺信息。

  用很多的圖像數(shù)據(jù)訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò),這個(gè)網(wǎng)絡(luò)能夠非常接近的體現(xiàn)視覺神經(jīng)系統(tǒng)的行為。每一層的神經(jīng)元是一個(gè)特征提取器,一個(gè)具體的神經(jīng)元對什么特征敏感,這 里面講的是他對不同朝向的邊界敏感。更高一層,把下面這一層提取的結(jié)果,去組成更復(fù)雜的模式匹配。如果是兩條邊你結(jié)合在一起會(huì)形成一個(gè)物體的各個(gè)部位,比 如說鼻子的提取,再往下走,就更具有語意,他可以把下面的東西組成更加豐富的物體結(jié)構(gòu)。這里面他是一個(gè)從信號(hào)逐層抽象、逐層變換的過程。跟我們今天所了解 的生物視覺系統(tǒng)是非常相關(guān)的。但基本上我們只是知道這個(gè)聯(lián)系,今天為止,我們做的很多的工作跟這個(gè)聯(lián)系并沒有太多的關(guān)系,也未受這個(gè)聯(lián)系的束縛。

  從另外一個(gè)觀點(diǎn)來講,從統(tǒng)計(jì)和計(jì)算方面來分享。在機(jī)器學(xué)習(xí)里面,我們關(guān)心的是推廣誤差,他不是看在現(xiàn)有數(shù)據(jù)集上面效果怎么樣,而是在未知的數(shù)據(jù)上,這個(gè)系統(tǒng) 在訓(xùn)練的時(shí)候沒有看到的地方,叫推廣誤差。去年夏天,因?yàn)槲覀兗倚『⑹窃?a target="_blank" href="http://qjkhjx.com/zt/world/">美國長大,剛剛回來,剛剛從一年級(jí)開始學(xué)習(xí),中文不太好,他有一次考完試以后跟我 講,考的不好,70幾分;第二天他特別高興的跟我講,爸爸,我考了98分,我說這太好了,一天之內(nèi)進(jìn)步這么快。他說因?yàn)榻裉斓目碱}跟昨天是一樣的。這不能 真實(shí)反應(yīng)學(xué)習(xí)者的能力。推廣誤差要在你沒有見過的數(shù)據(jù)集上面衡量他的效果怎么樣。

  一個(gè)經(jīng)典的分析方法是把推廣誤差分 析成兩部分,我們來看錯(cuò)誤源在什么地方。第一個(gè)叫Approximation error,也就是假設(shè),沒有假設(shè)就沒有學(xué)習(xí),你在學(xué)習(xí)做推廣的時(shí)候就一定有假設(shè),你從已知推向未知,中間一定有一個(gè)結(jié)構(gòu)在里面。古代我們講近朱者赤,近 墨者黑,這有一個(gè)相似性-如果是相似的物體具有相似的屬性。這里面隱含著函數(shù)平滑假設(shè),我們做一個(gè)假設(shè),通常反映在你的模型中間,所有的假設(shè)可能是錯(cuò)的。 在統(tǒng)計(jì)學(xué)里面有一個(gè),假設(shè)不完美,你在假設(shè)空間里面一定能夠找到最完美的那個(gè)。

  第二推廣來源是Estimation error,這是來源于數(shù)據(jù)的不完美。你的訓(xùn)練數(shù)據(jù)和測試的數(shù)據(jù)來源分布不一樣。更多的時(shí)候是說你的數(shù)據(jù)是有限樣本,如果你在有限樣本上面得到的估計(jì)量是不準(zhǔn)確的。因?yàn)槲覀兊墓烙?jì)量是在無限樣本里面去估計(jì)他。

  光分析這兩個(gè)東西是不夠的。通常來講,在統(tǒng)計(jì)學(xué)的范疇里去分析這兩個(gè)東西,統(tǒng)計(jì)學(xué)家關(guān)心的點(diǎn),跟計(jì)算機(jī)科學(xué)不太一樣。計(jì)算機(jī)科學(xué)關(guān)心的是,我今天跟老板申請 五百臺(tái)機(jī)器,老板說不行就五臺(tái)。你說老板,給我五個(gè)機(jī)器,我要算兩個(gè)月搞定,老板說,你今天不搞定不能回家。所以是有限的資源下面去分析這個(gè)問題,在資源 的有限性上面,你要去分析這個(gè)問題。這里面一般是求解的不完美,考慮計(jì)算的不完美。

  這里面給我們最近的機(jī)器學(xué)習(xí)提供 了最近的誤差,我一開始在機(jī)器學(xué)習(xí)上面右層的集成,最好的一層是20層。第二,大量的數(shù)據(jù),讓你在這上面經(jīng)驗(yàn)性的判斷接近你的期望值。第三,我要設(shè)計(jì)一個(gè) 非常精巧的算法,求得一個(gè)非常完美的解,這個(gè)完美的解算法非常復(fù)雜。一個(gè)能用的算法,它得有比較好的性質(zhì),讓你可以消化大的數(shù)據(jù)。把這三點(diǎn)都放在一起,大 家可以理解,為什么在大數(shù)據(jù)的時(shí)代深度學(xué)習(xí)變得這么重要。

  我們看這兩個(gè)緯度,隨著數(shù)據(jù)規(guī)模的增長,效果是怎么樣的。傳統(tǒng)的人工智能算法可能由于這個(gè)模型的空間是有限的,復(fù)雜度不夠高,數(shù)據(jù)多了沒有用。或者你的算法本身不能處理大數(shù)據(jù),比如說他的算法復(fù)雜度是數(shù)據(jù)量的三次方。一萬個(gè)數(shù)據(jù)點(diǎn)你可以看懂,但是如果是十萬個(gè)你就搞不定。

  但是深度學(xué)習(xí)算法,由于它的模型足夠的好,又能夠掌握主大數(shù)據(jù),所以他能夠不斷吸收數(shù)據(jù)紅利,去年百度首席科學(xué)家AndrewNg帶領(lǐng)團(tuán)隊(duì)在語音識(shí)別問題上 取得了重大進(jìn)展,把數(shù)據(jù)加到了幾萬小時(shí),效果不斷的加強(qiáng)。如果你的商業(yè)模式能夠擁有這樣一個(gè)曲線,我要恭喜你,因?yàn)榇髷?shù)據(jù)真正成為商業(yè)壁壘。。

  第二,深度學(xué)習(xí)是一個(gè)靈活的建模語音。我們用不同的語音模型表達(dá)你的點(diǎn),比如說圖象,因?yàn)樗莾删S的,用卷積神經(jīng)網(wǎng)絡(luò)更加適合。我們?nèi)ニ阉髡Z意相關(guān)性,傳統(tǒng) 的做法是人工抽取很多特征,變成一個(gè)學(xué)習(xí)問題,這里面完全是端到端的。我關(guān)心的是對于一個(gè)搜索的Query,我關(guān)心的是這兩個(gè)相關(guān)性,但是它絕對的相關(guān)程 度我不關(guān)心。深度神經(jīng)網(wǎng)絡(luò)給你的是一個(gè)語言,讓你去表達(dá)你對問題的理解。

  這是最近非常成功的一個(gè)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)。它叫Long—short term memory,它最近取得很好的進(jìn)展:即在任何一個(gè)地方,時(shí)間跟歷史的相關(guān)性是變化的。

  比如說自然語言處理,你如果碰到一個(gè)右符號(hào),你只要溯源到左符號(hào)那個(gè)地方,把中間所有的東西拿出來分析。根據(jù)你當(dāng)前所處的狀態(tài),你是應(yīng)該去找一個(gè)更長的。你 遇到一個(gè)句號(hào),你做語意理解的時(shí)候,你把過去歷史所有的都要清零。在時(shí)間面前,時(shí)間和歷史是不一樣的。這個(gè)模型比以前的模型更加的rich。

  我們在過去做字符識(shí)別的時(shí)候,一般先把字符分成一個(gè)一個(gè)單的圖片,再識(shí)別它是什么東西,但是我們發(fā)現(xiàn)對于這樣的問題是不可行的。在這種情況下,你可以做的是把整個(gè)字符序列放進(jìn)去,并希望輸出的是一個(gè)完整的字符序列?,F(xiàn)在在這些領(lǐng)域應(yīng)用都是最好的效果。

  用另外一個(gè)更加不同的神經(jīng)網(wǎng)絡(luò)表達(dá)我的問題。我不是識(shí)別這個(gè)圖象里面有什么東西,而是述說圖片的故事:下午的陽光照在房間,有藍(lán)色的地毯和白色的沙發(fā)…今天 我們用理解圖象的神經(jīng)網(wǎng)絡(luò),經(jīng)過很多非線性的變換,生成很多表達(dá)。他從這個(gè)詞生成一個(gè)圖象,再生成下一個(gè)詞,我希望這個(gè)句子跟圖象是有關(guān)的,使整個(gè)的語言 也跟這個(gè)圖象有關(guān)。根據(jù)你對這個(gè)問題的理解,神經(jīng)網(wǎng)絡(luò)深度學(xué)習(xí)給你提供了一個(gè)非常豐富的符號(hào)語言系統(tǒng)讓你去表達(dá)你這個(gè)問題應(yīng)該怎么搜索。

  還有很多其他的例子,用深度學(xué)習(xí)提高搜索的先進(jìn)性,用了深度學(xué)習(xí)以后,比沒有用深度學(xué)習(xí)有翻倍的提升,包括語音的系統(tǒng)。最近我們用的語音系統(tǒng),是一個(gè)真正的 中文語音識(shí)別系統(tǒng),我們用幾萬小時(shí)的聲音來訓(xùn)練它,在識(shí)別率上面有很大提升。大家看新聞可能看到了,我們在英文的識(shí)別也是優(yōu)于我們的競爭對手。

  這是另外一個(gè)很有意思的例子,很小的一個(gè)產(chǎn)品,但是它是人工智能很多技術(shù)在一起的綜合體系。這個(gè)是我的一個(gè)朋友,紐約大學(xué)的教授研發(fā)的,他到上海來,去餐館 看到這樣一個(gè)菜單,他拍照識(shí)別,有一個(gè)OCR,翻譯成英文,通過TTS就可以翻譯出來。在紐約你想找川菜館,他識(shí)別成中文,翻譯成英文,通過這個(gè)英文隨便 給一個(gè)老外你問他。這個(gè)東西正在成為現(xiàn)實(shí),中間的時(shí)延做的越來越好。

  這是百度作業(yè)幫,小朋友夏天玩的沒有時(shí)間做作業(yè)了,但快要開學(xué)了怎么辦?如果我小時(shí)候有這個(gè)玩意兒,我會(huì)很開心,因?yàn)槲矣懈嗟臅r(shí)間玩。當(dāng)然這個(gè)技術(shù)要善加利用,你可以去找到關(guān)鍵的識(shí)別點(diǎn)。

  這一度讓很多朋友玩的很high,每個(gè)小人物都有一個(gè)成明星的夢想,我們就能滿足這樣的需求。我訪問谷歌的時(shí)候,有個(gè)是做深度學(xué)習(xí)最有名的多倫多大學(xué)的教 授,現(xiàn)在在谷歌工作。當(dāng)時(shí)他問我,深度學(xué)習(xí)還能活五年嗎?我說不能,他聽了很沉悶。但是其中的思想是有價(jià)值的,比如說分層次的思想,在非神經(jīng)網(wǎng)絡(luò)的系統(tǒng)和 其他的系統(tǒng)都有作用。我們用深度學(xué)習(xí)做了這么好玩的東西,我們可以玩一玩,他說好,來玩玩。他得到了這個(gè)結(jié)果非常開心,立刻分享給他的老婆。

  最近我們團(tuán)隊(duì)有一個(gè)挺好的結(jié)果,去年Facebook在測試上面,得到世界上最好的結(jié)果97.35%,前幾天百度深度學(xué)習(xí)研究院得到了99.85%的成績, 終結(jié)了刷榜。常常我們會(huì)聽說到某一個(gè)團(tuán)隊(duì)在一個(gè)數(shù)據(jù)上面做到怎么樣的效果,怎么必須要客觀的看,那只是證明他在這個(gè)數(shù)據(jù)集上做的最好,不代表他把這個(gè)問題 給解決了,也不代表他的這個(gè)問題就可用了。人臉識(shí)別,今天誰要告訴你,說人臉識(shí)別可以用來代替指紋識(shí)別,我告訴你,那肯定是忽悠,沒有到那個(gè)程度,但是終 究有一天會(huì)做到的。

  基于圖象的理解,你可以做圖片搜索,他不光做視覺相似形的匹配,還有語意的匹配。這里的結(jié)果看起來都不錯(cuò),有一些細(xì)致的區(qū)別。這邊下面是倒影,是水,這邊看似是水,但是大部分是草坪、陸地,這邊的結(jié)果全都是倒影、都是水。很細(xì)致的不同。

  去年全球最好的物體檢測模型,他告訴你有這個(gè)頭盔,他也告訴你這個(gè)頭盔在什么地方,用一個(gè)框給框出來?;诖髷?shù)據(jù)的人工智能在過去幾年已經(jīng)發(fā)生了變化,我們 靜態(tài)來看、把這幾年的進(jìn)展串在一起看,效果還是很驚人的。在這個(gè)分類中,2010年世界最好結(jié)果,錯(cuò)誤率接近30%。每一年不同的團(tuán)隊(duì)在這上面努力工作, 每一年的錯(cuò)誤率非常驚人的在降低,朝著零趨勢發(fā)展。2014年最好的結(jié)果是百度取得的--7%。斯坦福的學(xué)者人工做了一下比對,他們發(fā)現(xiàn)人的識(shí)別率是 5%,今年我們聽到微軟和谷歌的朋友已經(jīng)做到大概3%、4%了。當(dāng)然也有一些誤導(dǎo),比如說他能認(rèn)識(shí)六七種不同的青蛙,誰能認(rèn)識(shí)那么多種不同的青蛙呢?人的 能力還是有限的。

  過去的搜索引擎包括幾個(gè)環(huán)節(jié),數(shù)據(jù)信息的感知、處理、理解、學(xué)習(xí),到?jīng)Q策、行動(dòng)、創(chuàng)造,這是三個(gè)不同階段。過去我們主要是從互聯(lián)網(wǎng)上獲取這些信息,今天因?yàn)?是移動(dòng)互聯(lián)網(wǎng),我們的服務(wù)離人越來越近,所以你需要更多從人的數(shù)據(jù)里面獲取很多內(nèi)容。我們跟清華大學(xué)的朱勇武(音)老師有973的項(xiàng)目,從人,還有物理世 界,物聯(lián)網(wǎng)(手機(jī)上面有各種各樣的傳感器,里面有一種重要的傳感器是GPS,對物理世界的感知),這些緯度都變得越來越重要。相反,互聯(lián)網(wǎng)上的數(shù)據(jù)以前是 唯一,現(xiàn)在只是其中的一個(gè)信息來源。把這些信息都獲取,我們也需要去向更加先進(jìn)的人機(jī)交互的領(lǐng)域發(fā)展。比如說更加先進(jìn)的傳感器,我們現(xiàn)在在做3D建模,它 是自動(dòng)駕駛很重要的一個(gè)方面。因?yàn)檐囋谑裁吹胤娇梢宰?,什么地方不能走,哪個(gè)地方是主道,哪個(gè)地方是輔道…要不然這個(gè)車不知道怎么走。

  以前傳統(tǒng)的互聯(lián)網(wǎng)的信息分析以后,我們通常去做預(yù)測、廣告、搜索.但是今天,我們不光是在數(shù)字世界里面去做一些事情,我們是不是也在物理世界做一些事情。有 一位專家說的很好,清華大學(xué)張?jiān)菏空f,機(jī)器人是互聯(lián)網(wǎng)服務(wù)的最后一公里。比如說今天你在網(wǎng)上預(yù)定一個(gè)比薩,那邊有人讀到了這個(gè)信息,他來給你做這個(gè)比薩; 某個(gè)人辛辛苦苦把這個(gè)比薩送過來…這里面有很多環(huán)節(jié)可以去優(yōu)化。比如說這個(gè)比薩是不是真的做的非常的個(gè)性化,是不是非常符合你的口味?比如說今天我們在移 動(dòng)互聯(lián)網(wǎng)上對每個(gè)用戶的畫像,可以做幾十萬個(gè)來描述你的興趣。將來的這個(gè)比薩會(huì)做的非常的個(gè)性化。加多少胡椒粉都是針對你的口味,可以做到千人千面,可以 讓每個(gè)人都感覺是VIP。到底誰能做這件事情?機(jī)器人。因?yàn)樗堰@些數(shù)據(jù)瞬間讀到他的數(shù)據(jù)庫里面。誰來最高效的把這個(gè)服務(wù)最后完成,送到你家里來?機(jī)器 人。張華院士說機(jī)器人是互聯(lián)網(wǎng)服務(wù)的最后一公里,很有道理,很深刻。

  當(dāng)然人工智能還有一個(gè)很高的層次就是探索和發(fā) 現(xiàn)。去探索過去沒有的東西,3D打印在這里面扮演一個(gè)東西,他把一個(gè)計(jì)算的結(jié)果變成一個(gè)物理的現(xiàn)實(shí)。計(jì)算是沒有邊界的,計(jì)算生成的結(jié)果基本上也是沒有任何 的邊界,所以他可以生成任何的東西,3D打印就可以幫助他實(shí)現(xiàn)。將來的智能延伸到物理世界里面去創(chuàng)造以前從來沒有過的東西,這是一個(gè)可以預(yù)見的未來。今天 對網(wǎng)絡(luò)模型的規(guī)模有不斷的追求,我經(jīng)??梢月牭侥衬硢挝豢梢詫?shí)現(xiàn)超大規(guī)模的神經(jīng)網(wǎng)絡(luò),這里面可以稍微做一些類比,我們可以看到不同物種的變化是很大的。但 是如果你看他們的變化之間平均的連接,他們的區(qū)別其實(shí)沒有那么大。我們發(fā)現(xiàn)更高層次的智慧物種,他有更大規(guī)模的神經(jīng)網(wǎng)絡(luò),但是他的網(wǎng)絡(luò)連接是稀疏的。你的 物種不斷增多,你的連接卻沒有變化,所以他一定是越來越稀疏的。這對我們是有一些啟發(fā)的?! ?/p>

  今天我們來比較一下人類大 腦跟Supercomputer。人的大腦一般是1.5KG,2%的位置,但是它要消耗我們2%的能量,所以腦子是很消耗能量的。為什么中午會(huì)犯困,因?yàn)?你吃飯以后血液都到消化道里面去了。某某朋友一天非常集中的做一件事情,最后會(huì)累的虛脫,哪怕他沒有怎么動(dòng)就是這個(gè)原因。我們的大腦有一千億個(gè) neurons,每個(gè)數(shù)理有5000個(gè)神經(jīng)原,每一個(gè)連接是200次/秒。我們大腦的計(jì)算能力是10的17次方。它是一個(gè)非常高效的計(jì)算,每瓦能量完成的 計(jì)算量是5個(gè)Gliops。跟中國的天河二號(hào)比較一下,它現(xiàn)在的計(jì)算能力還沒有達(dá)到人腦計(jì)算的一半,它現(xiàn)在是34個(gè)petaliops,它的計(jì)算效率是每 瓦2.14Gliops。

  這是我們和清華大學(xué)做的一個(gè)項(xiàng)目,它是真正的自行車,以前我們見到的自行車都是假的自行 車,因?yàn)樗皇亲孕?。我們在做這個(gè)項(xiàng)目的時(shí)候有一些思考,這個(gè)思考就是人跟車的關(guān)系,我們覺得它未來是人跟馬的關(guān)系,是朋友。如果你養(yǎng)一匹馬,很親以后, 它跟你有一個(gè)交流,它也是懂你的,它也有自己的想法。

  這是我們在百度做的自動(dòng)駕駛項(xiàng)目。我們不把它叫做無人駕駛,我 們叫做“高度自動(dòng)駕駛”項(xiàng)目。首先這是一個(gè)非常典型的機(jī)器人項(xiàng)目,一個(gè)自動(dòng)駕駛的車,裝了這么多的傳感器。這個(gè)車的后背箱堆滿了服務(wù)器。感知、理解、決策 控制,車的計(jì)算要直接控制、操控這個(gè)車物理的東西。這里面中國跟國外還有一些差距,首先要實(shí)現(xiàn)線控,中國絕大部分的車都不是線控。我們做自動(dòng)駕駛,你要控 制剎車,怎么控制?不是一個(gè)接口、一個(gè)計(jì)算機(jī)寫進(jìn)去,他是一個(gè)大的鐵桿子、這邊裝了馬達(dá),鐵桿子踩在剎車上。我們跟寶馬合作,是因?yàn)樗峁┚€控的技術(shù)。這 個(gè)車我們叫做小紅,小紅,大白,這是我們改裝的第一輛車,第二輛、第三輛。首先是對道路的感知,這里是三維高精度的感知。對車的定位要能夠做到厘米量級(jí)的 定位。這里面需要一些相當(dāng)?shù)膫鞲衅骷夹g(shù)、機(jī)器人技術(shù)。這個(gè)是在G7上面采用的。大家看到劃的很高,因?yàn)槲覀兪侨S的東西,很容易劃的很高,都是計(jì)算出來 的。

  我們對車整合動(dòng)力學(xué)的系統(tǒng)建了這個(gè)模型做仿真,在路上走我們要做模擬的仿真,模擬仿真做的差不多以后,我們再實(shí)際的去調(diào)試。

  自動(dòng)駕駛要飛入尋常百姓家,關(guān)鍵是你要用低成本的傳感器實(shí)現(xiàn)很強(qiáng)的智能感知能力。谷歌自動(dòng)駕駛有一個(gè)很嚴(yán)重的問題,他用的傳感器比車本身都貴。他的傳感器要70萬人民幣。但是我們要突破一個(gè)技術(shù),就是怎么讓低成本的傳感器大規(guī)模的應(yīng)用。

  這是我們做的是基于圖象的實(shí)時(shí)道路場景理解。比如說識(shí)別道路上的汽車,在這件事情上我們真的做的比別人好。這個(gè)藍(lán)色的點(diǎn)是我們的標(biāo)注人員做的。這些車是疊著 排在路邊,人在標(biāo)注的時(shí)候不容易精確的說這輛車、這輛車、這輛車,不容易看清。這個(gè)地方陰影的遮擋。有一輛車在這里,被一個(gè)交通標(biāo)志遮擋起來了,人不容易看到,但是目前我們的算法能夠做到這樣的水平。

  最后看一下我們對自動(dòng)駕駛發(fā)展路徑的看法。為什么我們不認(rèn)為我們要做的是無人駕駛?真正的無人駕駛要實(shí)現(xiàn),還有一個(gè)相當(dāng)長的路徑,除了技術(shù)的能力以外,還有 政府的政策法規(guī),還有基礎(chǔ)建設(shè),還有保險(xiǎn)公司怎么判定這個(gè)問題,出了問題到底是誰的錯(cuò),這些事情已經(jīng)遠(yuǎn)超技術(shù)本身,還有倫理的問題。真正到無人駕駛,你要 經(jīng)歷幾個(gè)階段:第一階段,輔助駕駛。第二,主動(dòng)駕駛。第三,特定條件下的自動(dòng)駕駛。第四,高度的自動(dòng)化駕駛。比如說輔助駕駛,當(dāng)前這個(gè)階段是一個(gè)輔助駕駛 的階段,因?yàn)檫@個(gè)車告訴你哪邊有車,哪邊有人,如果要出事故,他會(huì)提醒你。輔助駕駛告訴你檢測的結(jié)果,他不控制這個(gè)車。控制這個(gè)車變成了主動(dòng)駕駛。特定環(huán) 境下面,很多的車廠跟我們一樣都認(rèn)為在特定的場景,像某些高速公路,在兩到三年的時(shí)間里面會(huì)實(shí)現(xiàn)智能的自適應(yīng)巡航。現(xiàn)在車的巡航只是保持速度,如果前面的 車并道過來了,你是不是會(huì)做一些改變,或者減低車速,現(xiàn)在的車做不到。如果這個(gè)車本身在巡航狀態(tài),他是不停在拐彎的,你會(huì)不會(huì)車道跟隨?這個(gè)會(huì)最先實(shí)現(xiàn)。 在某些比較先進(jìn)的地方,你到了賓館,車就不用管了。將來這個(gè)車是自動(dòng)駕駛的,他把你的車移到那個(gè)地方?;蛘咴谝粋€(gè)大型的物流中心,或者在一個(gè)礦山里面,他 是一個(gè)自動(dòng)駕駛。最后到高度的自動(dòng)駕駛。

  人車一體,人不能放棄對車的控制,就像現(xiàn)在的飛機(jī)一樣,飛機(jī)在空中的很多時(shí)候它是自動(dòng)駕駛的狀態(tài),你喝杯咖啡沒有問題,但是任何時(shí)候你要重新恢復(fù)你的控制,你可以做到。因?yàn)槿藢@個(gè)事情負(fù)責(zé)。

 

  關(guān)于人和機(jī)器的關(guān)系,從我自己親身經(jīng)歷的例子來說。我們過去的團(tuán)隊(duì)在兩年前做過兩個(gè)事情,一個(gè)事情是讓你自己照的照片找一個(gè)長的最像的明星。還有一個(gè)是你拍 一個(gè)照,理解了以后,生成一首詩。這里面涉及到計(jì)算機(jī)視覺,涉及到自然語言。但是從市場的反應(yīng)來講,你們可以想象到,哪個(gè)更受歡迎?因?yàn)檫@跟每個(gè)人都相 關(guān),每個(gè)普通人都有一個(gè)想當(dāng)大明星的夢想,哪怕是一個(gè)虛幻,至少是這個(gè)產(chǎn)品跟每個(gè)用戶之間的關(guān)聯(lián)。拍照寫詩為什么不受歡迎?因?yàn)樗莝how off,他是秀百度的機(jī)器有多牛,不是秀我多牛。這里面有一個(gè)我們的思考,機(jī)器往前,我們回到人工智能的原點(diǎn),這個(gè)原點(diǎn)叫圖靈測試,圖靈測試一直在指導(dǎo)人 工智能研究的方向,他的目的是研究這個(gè)智能的機(jī)器能夠取代人。圖靈測試就是如果拿一個(gè)布檔著,這邊是機(jī)器還是人我就不知道了。我們下國際象棋,目前他是 PASS了圖靈測試的。這種導(dǎo)致了你的做法,你不斷研究跟人可以PK的機(jī)器,這是不是我們真正想做的,是不是真正的方向。站在今天可以去思考。

  我剛才講到了象棋,IBM的深藍(lán)有一個(gè)劃時(shí)代的成果,它做的比最好的象棋冠軍能力還好,看似這樣一個(gè)偉大的科技進(jìn)展,它其實(shí)沒有給IBM帶來任何的價(jià)值,沒 有給這個(gè)社會(huì)產(chǎn)生任何的影響,也沒有使這個(gè)社會(huì)變得更加美好。為什么?因?yàn)樗鼰o非是造一個(gè)跟人能力差不多可以PK的機(jī)器。我們看另外一個(gè)東西,搜索引擎, 無論是谷歌還是百度,它這個(gè)技術(shù)不完美,因?yàn)槲覀兝硐氲募夹g(shù)是能夠給他扔一個(gè)問題,他能夠自動(dòng)尋找問題的答案。他做的不完美,他是扔一堆排序的結(jié)果,你自 己搞清楚。但是他對這個(gè)社會(huì)產(chǎn)生了巨大的影響。他能讓北京清華附小一個(gè)家庭環(huán)境非常優(yōu)越的小孩子跟一個(gè)鄉(xiāng)村里面的小孩子,只要有網(wǎng)絡(luò)的情況下,獲取知識(shí)、 獲取信息的能力是一樣的。他是因?yàn)槌删土嗣總€(gè)人,讓每一個(gè)普通的人更有知識(shí),他獲得信息,能夠做更加明智的判斷,這個(gè)事情跟這個(gè)社會(huì)的大需求發(fā)生了共振, 產(chǎn)生了巨大的影響。

  我們思考自動(dòng)駕駛也是這樣,我們是要去思考、去做真正的替代人去駕駛的,還是去做車成就人的,還是你可以獲取更大的自由。谷歌的這個(gè)車一開始是沒有方向盤 的。這個(gè)車真的是你想要的嗎?最近他們把方向盤加上去了。我們希望車跟人的關(guān)系,就像人跟馬的關(guān)系一樣。你在萬馬奔騰的環(huán)境里面,你騎著這個(gè)馬,你不需要 特別細(xì)微的控制這個(gè)馬,它自己知道怎么走,避障,跟周圍的馬協(xié)調(diào)距離,你要把握大方向。你甚至在馬上面如果打瞌睡,馬也可以帶著你走,你什么時(shí)候想要控制 它,你是可以控制的。自動(dòng)駕駛是要構(gòu)建人車一體、以人為主的駕駛環(huán)境。

  最后,我覺得什么是一個(gè)偉大的技術(shù)?它不在于讓機(jī)器更偉大,它的偉大之處,是讓每個(gè)平凡的人更有創(chuàng)造力、更加自我、更偉大。這是人工智能和技術(shù)發(fā)展的方向。

  世界是我們的,也是機(jī)器人的,但是歸根到底是屬于會(huì)控制機(jī)器人的人的。謝謝大家!

  提問環(huán)節(jié)

  提問1:借用張?jiān)菏空f的最后一公里,前面在你的思路中,什么是最先一公里?最先一公里和最后一公里是什么關(guān)系?

  余凱:信息的搜集、整理是目前來講先要去做的。

  提問2:假如我們可以確定機(jī)器智能的發(fā)展一定會(huì)威脅人的生存,機(jī)器超過人的時(shí)候,一個(gè)很嚴(yán)重的問題就是人沒有用了。

  余凱:首先,我們現(xiàn)在太早去思考這個(gè)問題了,因?yàn)槲覀儸F(xiàn)在離那個(gè)階段還非常遠(yuǎn)。第二,我不認(rèn)為將來機(jī)器會(huì)超過人或者駕馭人。他應(yīng)該還是人的工具。我覺得它在 很多能力方面是超過我們,但是最后它還是受人的駕馭。有一點(diǎn)是:機(jī)器人沒有好奇心。我現(xiàn)在想不到讓一個(gè)計(jì)算模型具有對未知世界探索的好奇心。因?yàn)槿巳ヌ剿?未知世界好奇,不斷的拓展知識(shí)的邊界,機(jī)器人是去執(zhí)行我們的想法。

  提問3:我正在寫一篇文章,這一篇文章的一個(gè)觀點(diǎn)是,當(dāng)機(jī)器要保證自己不斷電的情況下,沒有人的參與,它會(huì)不會(huì)有好奇心?

  余凱:會(huì)不會(huì)有好奇心我就不知道了。這種哲學(xué)討論我們可以永遠(yuǎn)討論。因?yàn)槟且惶鞗]有到來之前,我們可以不斷的去猜測。我的觀點(diǎn),我們想做對社會(huì)有用的東西。

  提問4:剛才余博士介紹很多激動(dòng)人心的人工智能方面的成果??墒俏覀儸F(xiàn)在去看應(yīng)用層面,包括剛才介紹很多百度的應(yīng)用,好玩但是不實(shí)用,比如說魔圖、百度拍植 物,都不實(shí)用,或者是一個(gè)輔助性。余博士的角度看,在應(yīng)用層面,出現(xiàn)一個(gè)endto-end的應(yīng)用可能會(huì)出現(xiàn)哪一個(gè)領(lǐng)域?

  余凱:這些人工智 能的技術(shù)對于現(xiàn)實(shí)商業(yè)的影響其實(shí)是巨大的。因?yàn)榻裉斓恼麄€(gè)搜索、廣告系統(tǒng)、電子商務(wù)、大數(shù)據(jù)金融,這些技術(shù)在這里面,你有和沒有,是生和死的問題,不是錦 上添花的事情。但是那些好玩的事情,他自己也在不斷的演進(jìn)。我們講的圖象識(shí)別,大家有沒有聽說過MobilEye?這家公司就是做車輛和行人識(shí)別感知系 統(tǒng),它現(xiàn)在做到很大。還有一個(gè)大數(shù)據(jù)公司叫Palentir,他就是人工智能大數(shù)據(jù)的方法用在國家安全領(lǐng)域,他現(xiàn)在是一百多億美金的估值。近期來講,你總 會(huì)覺得技術(shù)發(fā)展比你想象的要慢。近期大家總是高估技術(shù)對人類的影響,但是在十年的時(shí)間里面,你一定是低估技術(shù)對你生活的影響。

  提問5:在您的演講里面有一個(gè)細(xì)節(jié),您跟Hinton教授談的時(shí)候,說這一波深度學(xué)習(xí)浪潮很快就過去了。在五年之后,在深度學(xué)習(xí)之后是什么樣的發(fā)展方向,什么樣的技術(shù)引領(lǐng)下一個(gè)發(fā)展方向?

  余凱:在某一個(gè)方面做的事情,特別是計(jì)算機(jī)科學(xué),常常是自己埋葬自己。很多年前,計(jì)算機(jī)體系結(jié)構(gòu),現(xiàn)在做的時(shí)候它不是一個(gè)你要探索的學(xué)科。深度學(xué)習(xí)一定會(huì)成 為一個(gè)非常俗氣的東西,每個(gè)人都會(huì)用。至于未來的方向,我不能講太遠(yuǎn)、太哲學(xué)的,我更愿意講現(xiàn)實(shí)的?,F(xiàn)實(shí)來講,自然語言理解是一個(gè)非常重要的方向,期待一 個(gè)突破性的進(jìn)展。

  提問6:我是電子系的學(xué)生,深度學(xué)習(xí)的算法用在硬件上面,您覺得這方面的潛力大嗎?

  余凱:這個(gè)會(huì)非常有潛力,因?yàn)榘堰@些智能的算法用在硬件里面,可以放進(jìn)各種智能設(shè)備中,這是我很期待的方向。

  提問7:我替經(jīng)濟(jì)管理系的同學(xué)們問一個(gè)問題,經(jīng)管和商業(yè)領(lǐng)域比較喜歡研究數(shù)據(jù)和商業(yè)之間的邏輯關(guān)系,剛才你講的非線性邏輯,是不是跟商業(yè)之間就沒有關(guān)系?

  余凱:現(xiàn)在深度學(xué)習(xí)可能不太適合你所講的這個(gè)領(lǐng)域。至于發(fā)現(xiàn)數(shù)據(jù)結(jié)構(gòu)之間的關(guān)系,到目前為止沒有任何所謂的精益學(xué)習(xí)模型是適合這個(gè)的,是人做的。如果你要發(fā) 現(xiàn)一個(gè)數(shù)據(jù)之間的因果關(guān)系,或者是其他關(guān)系,有一個(gè)大數(shù)據(jù)的說法,因果性不重要,相關(guān)性不重要。我覺得那都無所謂。發(fā)現(xiàn)這些關(guān)系涉及到一個(gè)很難的問題,這 不光是精益學(xué)習(xí)的問題。

  提問8:我是清華的學(xué)生,對大數(shù)據(jù)挖掘和人工智能比較感興趣。您前面說我們現(xiàn)在低估了人工智能發(fā)展的水平,前一段時(shí)間比爾蓋茨推薦了,我們要警惕人工智能未來十幾年的發(fā)展,那個(gè)帖子是說未來十幾年人工智能可能會(huì)達(dá)到現(xiàn)在我們看到的科幻片的發(fā)展水平,您對此事如何看?

  第二個(gè)問題,您在講PPT的過程中提到,統(tǒng)計(jì)學(xué)家說,任何假設(shè)都可能是錯(cuò)誤的,我們現(xiàn)在在人工智能很多算法里面套用的公式都是借用統(tǒng)計(jì)規(guī)律,比如我們常用的 誤差,我們默認(rèn)為它不同于正確分?jǐn)?shù)。以前統(tǒng)計(jì)學(xué)家統(tǒng)計(jì)數(shù)據(jù)的時(shí)候?qū)?shù)據(jù)量的限制,是不是以前有一些規(guī)律。我們現(xiàn)在做的算法都是借用了這些統(tǒng)計(jì)規(guī)律的東西。 我們最根本的東西都錯(cuò)了,導(dǎo)致人工神經(jīng)網(wǎng)絡(luò)不能很好的模擬大腦的思考。

  余凱:第一個(gè)問題也陷入到哲學(xué)的討論。我覺得 他們那些人站的高度比較高,他們可以想這些事情,對于我來講,我想的是,后三個(gè)月我怎么把這些事情做好,我怎么樣讓洛賓在政協(xié)會(huì)議上說我們的車到年底就能 在道路上跑了,我要保證這個(gè)事情發(fā)生。他們的擔(dān)憂不是不可能發(fā)生的,因?yàn)橛幸恍E用技術(shù)現(xiàn)象的發(fā)生。有一個(gè)研究通過人臉的識(shí)別,把這個(gè)東西裝在機(jī)關(guān)槍上。 他射擊的精度一定是比任何人都射擊的要準(zhǔn)確,機(jī)關(guān)槍每一個(gè)子彈都直中眉心,這個(gè)技術(shù)現(xiàn)在是可以實(shí)現(xiàn)的,這個(gè)不是未來時(shí)。

  串場:如果擊斃恐怖分子的話,還是有用的。

  余 凱:你要討論這個(gè)使用在什么地方。如果你允許一個(gè)機(jī)器自己判斷殺不殺這個(gè)人。機(jī)器人第一定律就是這個(gè)機(jī)器人永遠(yuǎn)不能殺人。這個(gè)擔(dān)心是有的,但是他有更多好 的方向,我們可以做很多的事情。比如說核能,到今天為止,以前我們擔(dān)心它毀滅人類,但是它成為一個(gè)穩(wěn)定的能源。人總是更聰明,一定能夠駕馭這個(gè)危險(xiǎn)。

  你的第二個(gè)問題,所有這些理論都是一個(gè)比較理想化的模型,你在應(yīng)用中還是要去領(lǐng)會(huì)。因?yàn)樗@個(gè)模型本身不錯(cuò),但他只是一個(gè)數(shù)學(xué)公式,應(yīng)用到問題里面,你要看 這個(gè)理想化模型是不是反應(yīng)你這個(gè)問題里面主要的矛盾。如果是主要的矛盾,他很有可能是有用的,他不是完美,是已經(jīng)找到了最好的。

  提問9:有一些文學(xué)數(shù)據(jù),我們不知道他符合什么的時(shí)候,我們就經(jīng)常默認(rèn)他符合正態(tài)分布,

  余凱:其實(shí)不是這樣的,如果你了解正態(tài)分布的原因的話,你了解到這個(gè)地方用的是正態(tài)分布,有的地方用的不是正態(tài)分布,這個(gè)物理的東西你要理解。

  提問10:我代表在場看現(xiàn)場直播的場外觀眾提一個(gè)問題,您能不能推薦一本入門級(jí)的精益學(xué)習(xí)的書。對如何引導(dǎo)中學(xué)生挖掘數(shù)據(jù)方面的興趣?

  余凱:這算是我個(gè)人回答,不能代表公司。今天我講的都是我個(gè)人的一些東西,回答你的問題都是我個(gè)人的觀點(diǎn)。如果是入門級(jí)的書,有一本七十年代寫的書, 《Patternclassification and scene analysis》是寫深度學(xué)習(xí)的書。那本書有兩部分,只看第一部分,不要看第二部分。我的一些朋友也是這種看法。(來源:數(shù)據(jù)派微信公眾號(hào))

 

浙江網(wǎng)經(jīng)社信息科技公司擁有18年歷史,作為中國領(lǐng)先的數(shù)字經(jīng)濟(jì)新媒體、服務(wù)商,提供“媒體+智庫”、“會(huì)員+孵化”服務(wù);(1)面向電商平臺(tái)、頭部服務(wù)商等PR條線提供媒體傳播服務(wù);(2)面向各類企事業(yè)單位、政府部門、培訓(xùn)機(jī)構(gòu)、電商平臺(tái)等提供智庫服務(wù);(3)面向各類電商渠道方、品牌方、商家、供應(yīng)鏈公司等提供“千電萬商”生態(tài)圈服務(wù);(4)面向各類初創(chuàng)公司提供創(chuàng)業(yè)孵化器服務(wù)。

網(wǎng)經(jīng)社“電數(shù)寶”電商大數(shù)據(jù)庫(DATA.100EC.CN,免費(fèi)注冊體驗(yàn)全庫)基于電商行業(yè)18年沉淀,包含100+上市公司、新三板公司數(shù)據(jù),150+獨(dú)角獸、200+千里馬公司數(shù)據(jù),4000+起投融資數(shù)據(jù)以及10萬+互聯(lián)網(wǎng)APP數(shù)據(jù),全面覆蓋“頭部+腰部+長尾”電商,旨在通過數(shù)據(jù)可視化形式幫助了解電商行業(yè),挖掘行業(yè)市場潛力,助力企業(yè)決策,做電商人研究、決策的“好參謀”。

【投訴曝光】 更多>
【原創(chuàng)報(bào)告】 更多>
《2025年Q1中國電商平臺(tái)商家投訴數(shù)據(jù)報(bào)告》
《2025年Q1中國電子商務(wù)用戶體驗(yàn)與投訴數(shù)據(jù)報(bào)告》
《2025中國農(nóng)產(chǎn)品電商發(fā)展報(bào)告》
《2025中國預(yù)制菜電商發(fā)展報(bào)告》
《2024中國電子商務(wù)“死亡”數(shù)據(jù)報(bào)告》
《2024中國電子商務(wù)用戶體驗(yàn)與投訴監(jiān)測報(bào)告》
《2024中國數(shù)字生活消費(fèi)投訴數(shù)據(jù)與典型案例報(bào)告》
《2024年中國數(shù)字教育用戶體驗(yàn)與投訴數(shù)據(jù)報(bào)告》
《2024中國出口跨境電商消費(fèi)投訴數(shù)據(jù)與典型案例報(bào)告》
《2024中國綜合電商消費(fèi)投訴數(shù)據(jù)與典型案例報(bào)告》
《2024中國在線旅游消費(fèi)投訴數(shù)據(jù)與典型案例報(bào)告》
《2024中國社交電商消費(fèi)投訴數(shù)據(jù)與典型案例報(bào)告》
《2024中國電商服務(wù)商消費(fèi)投訴數(shù)據(jù)與典型案例報(bào)告》
《2024中國生鮮電商消費(fèi)投訴數(shù)據(jù)與典型案例報(bào)告》
《2024中國在線票務(wù)用戶體驗(yàn)與投訴數(shù)據(jù)報(bào)告》
《2024中國物流科技投訴數(shù)據(jù)與典型案例報(bào)告》
《2024中國品牌電商消費(fèi)投訴數(shù)據(jù)與典型案例報(bào)告》
《2024年度中國二手電商市場數(shù)據(jù)報(bào)告》
《2024中國產(chǎn)業(yè)電商消費(fèi)投訴數(shù)據(jù)與典型案例報(bào)告》
《2024中國進(jìn)口跨境電商消費(fèi)投訴數(shù)據(jù)與典型案例報(bào)告》

【版權(quán)聲明】秉承互聯(lián)網(wǎng)開放、包容的精神,網(wǎng)經(jīng)社歡迎各方(自)媒體、機(jī)構(gòu)轉(zhuǎn)載、引用我們原創(chuàng)內(nèi)容,但要嚴(yán)格注明來源網(wǎng)經(jīng)社;同時(shí),我們倡導(dǎo)尊重與保護(hù)知識(shí)產(chǎn)權(quán),如發(fā)現(xiàn)本站文章存在版權(quán)問題,煩請將版權(quán)疑問、授權(quán)證明、版權(quán)證明、聯(lián)系方式等,發(fā)郵件至NEWS@netsun.com,我們將第一時(shí)間核實(shí)、處理。

        平臺(tái)名稱
        平臺(tái)回復(fù)率
        回復(fù)時(shí)效性
        用戶滿意度
        微信公眾號(hào)
        微信二維碼 打開微信“掃一掃”
        微信小程序
        小程序二維碼 打開微信“掃一掃”