人工智能发展现状
作者:Chen Zhang
鏈接:https://www.zhihu.com/question/20102212/answer/126994210
來源:知乎
著作權(quán)歸作者所有。商業(yè)轉(zhuǎn)載請聯(lián)系作者獲得授權(quán),非商業(yè)轉(zhuǎn)載請注明出處。
隨著深度學習技術(shù)的成熟,AI人工智能正在逐步從尖端技術(shù)慢慢變得普及。AlphaGo和人類的對弈,并不是我們以往所理解的電子游戲,電子游戲的水平永遠不會提升,而AlphaGo則具備了人工智能最關(guān)鍵的“深度學習”功能。AlphaGo中有兩個深度神經(jīng)網(wǎng)絡(luò),Value Networks(價值網(wǎng)絡(luò))和 Policy Networks(策略網(wǎng)絡(luò))。其中Value Networks評估棋盤選點位置,Policy Networks選擇落子。這些神經(jīng)網(wǎng)絡(luò)模型通過一種新的方法訓練,結(jié)合人類專家比賽中學到的棋譜,以及在自己和自己下棋(Self-Play)中進行強化學習。也就是說,人工智能的存在,能夠讓AlphaGo的圍棋水平在學習中不斷上升。
人工智能的技術(shù)應(yīng)用主要是在以下幾個方面:
自然語言處理(包括語音和語義識別、自動翻譯)、計算機視覺(圖像識別)、知識表示、自動推理(包括規(guī)劃和決策)、機器學習和機器人學。按照技術(shù)類別來分,可以分成感知輸入和學習與訓練兩種。計算機通過語音識別、圖像識別、讀取知識庫、人機交互、物理傳感等方式,獲得音視頻的感知輸入,然后從大數(shù)據(jù)中進行學習,得到一個有決策和創(chuàng)造能力的大腦。
從上世紀八九十年代的PC時代,進入到互聯(lián)網(wǎng)時代后,給我們帶來的是信息的爆炸和信息載體的去中心化。而網(wǎng)絡(luò)信息獲取渠道從PC轉(zhuǎn)移到移動端后,萬物互聯(lián)成為趨勢,但技術(shù)的限制導致移動互聯(lián)網(wǎng)難以催生出更多的新應(yīng)用和商業(yè)模式。而如今,人工智能已經(jīng)成為這個時代最激動人心、最值得期待的技術(shù),將成為未來10年乃至更長時間內(nèi)IT產(chǎn)業(yè)發(fā)展的焦點。
人工智能概念其實在上世紀80年代就已經(jīng)炒得火熱,但是軟硬件兩方面的技術(shù)局限使其沉迷了很長一段時間。而現(xiàn)在,大規(guī)模并行計算、大數(shù)據(jù)、深度學習算法和人腦芯片這四大催化劑的發(fā)展,以及計算成本的降低,使得人工智能技術(shù)突飛猛進。
一、驅(qū)動人工智能發(fā)展的先決條件
物聯(lián)網(wǎng)——物聯(lián)網(wǎng)提供了計算機感知和控制物理世界的接口和手段,它們負責采集數(shù)據(jù)、記憶、分析、傳送數(shù)據(jù)、交互、控制等等。攝像頭和相機記錄了關(guān)于世界的大量的圖像和視頻,麥克風記錄語音和聲音,各種傳感器將它們感受到的世界數(shù)字化等等。這些傳感器,就如同人類的五官,是智能系統(tǒng)的數(shù)據(jù)輸入,感知世界的方式。而大量智能設(shè)備的出現(xiàn)則進一步加速了傳感器領(lǐng)域的繁榮,這些延伸向真實世界各個領(lǐng)域的觸角是機器感知世界的基礎(chǔ),而感知則是智能實現(xiàn)的前提之一。
大規(guī)模并行計算——人腦中有數(shù)百至上千億個神經(jīng)元,每個神經(jīng)元都通過成千上萬個突觸與其他神經(jīng)元相連,形成了非常復(fù)雜和龐大的神經(jīng)網(wǎng)絡(luò),以分布和并發(fā)的方式傳遞信號。這種超大規(guī)模的并行計算結(jié)構(gòu)使得人腦遠超計算機,成為世界上最強大的信息處理系統(tǒng)。近年來,基于GPU(圖形處理器)的大規(guī)模并行計算異軍突起,擁有遠超CPU的并行計算能力。
從處理器的計算方式來看,CPU計算使用基于x86指令集的串行架構(gòu),適合盡可能快的完成一個計算任務(wù)。而GPU從誕生之初是為了處理3D圖像中的上百萬個像素圖像,擁有更多的內(nèi)核去處理更多的計算任務(wù)。因此GPU天然具備了執(zhí)行大規(guī)模并行計算的能力。云計算的出現(xiàn)、GPU的大規(guī)模應(yīng)用使得集中化的數(shù)據(jù)計算處理能力變得前所未有的強大。
大數(shù)據(jù)——根據(jù)統(tǒng)計,2015年全球產(chǎn)生的數(shù)據(jù)總量達到了十年前的20多倍,海量的數(shù)據(jù)為人工智能的學習和發(fā)展提供了非常好的基礎(chǔ)。機器學習是人工智能的基礎(chǔ),而數(shù)據(jù)和以往的經(jīng)驗,就是人工智能學習的書本,以此優(yōu)化計算機的處理性能。
深度學習算法——最后,這是人工智能進步最重要的條件,也是當前人工智能最先進、應(yīng)用最廣泛的核心技術(shù),深度神經(jīng)網(wǎng)絡(luò)(深度學習算法)。2006年,Geoffrey Hinton教授發(fā)表的論文《A fast learning algorithm for deep belief nets》。他在此文中提出的深層神經(jīng)網(wǎng)絡(luò)逐層訓練的高效算法,讓當時計算條件下的神經(jīng)網(wǎng)絡(luò)模型訓練成為了可能,同時通過深度神經(jīng)網(wǎng)絡(luò)模型得到的優(yōu)異的實驗結(jié)果讓人們開始重新關(guān)注人工智能。之后,深度神經(jīng)網(wǎng)絡(luò)模型成為了人工智能領(lǐng)域的重要前沿陣地,深度學習算法模型也經(jīng)歷了一個快速迭代的周期,Deep Belief Network、Sparse Coding、Recursive Neural Network, Convolutional Neural Network等各種新的算法模型被不斷提出,而其中卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)更是成為圖像識別最炙手可熱的算法模型。
二、IT巨頭在人工智能上的投入
技術(shù)的進步使得人工智能的發(fā)展在近幾年顯著加速,IT巨頭在人工智能上的投入明顯增大,一方面網(wǎng)羅頂尖人工智能的人才,另一方面加大投資力度頻頻并購,昭示著人工智能的春天已經(jīng)到來。
科技企業(yè)巨頭近幾年在人工智能領(lǐng)域密集布局,巨頭們通過巨額的研發(fā)投入、組織架構(gòu)的調(diào)整、持續(xù)的并購和大量的開源項目,正在打造各自的人工智能生態(tài)圈。在未來,人工智能將不再是尖端技術(shù),而會成為隨處可見的基礎(chǔ)設(shè)施。對于人工智能初創(chuàng)企業(yè)而言,既要尋找與巨頭的合作契合點,又要避開正面沖突。
IBM
IBM Watson由90臺IBM服務(wù)器、360個計算機芯片組成,是一個有10臺普通冰箱那么大的計算機系統(tǒng)。它擁有15TB內(nèi)存、2880個處理器、每秒可進行80萬億次運算。現(xiàn)在已經(jīng)逐步進化到四個批薩盒大小,性能也提升了240%。Watson存儲了大量圖書、新聞和電影劇本資料、辭海、文選和《世界圖書百科全書》等數(shù)百萬份資料。Watson是基于IBM“DeepQA”(深度開放域問答系統(tǒng)工程)技術(shù)開發(fā)的。DeepQA技術(shù)可以讀取數(shù)百萬頁文本數(shù)據(jù),利用深度自然語言處理技術(shù)產(chǎn)生候選答案,根據(jù)諸多不同尺度評估那些問題。IBM研發(fā)團隊為Watson開發(fā)的100多套算法可以在3秒內(nèi)解析問題,檢索數(shù)百萬條信息然后再篩選還原成“答案”輸出成人類語言。
產(chǎn)業(yè)布局:IBM公司自2006年開始研發(fā)Watson,并在2011年2月的《危險地帶》(Jeopardy!)智力搶答游戲中一戰(zhàn)成名。一開始IBM想把Watson打造為超級Siri,主要還是賣硬件。但是后來轉(zhuǎn)型為認知商業(yè)計算平臺,2011年8月開始應(yīng)用于醫(yī)療領(lǐng)域。例如在腫瘤治療方面,Watson已收錄了腫瘤學研究領(lǐng)域的42種醫(yī)學期刊、臨床試驗的60多萬條醫(yī)療證據(jù)和200萬頁文本資料。Watson能夠在幾秒之內(nèi)篩選數(shù)十年癌癥治療歷史中的150萬份患者記錄,包括病歷和患者治療結(jié)果,并為醫(yī)生提供可供選擇的循證治療方案。目前癌癥治療領(lǐng)域排名前三的醫(yī)院都在運行Watson,并在今年8月正式進入中國。
2012年3月,Watson則首次應(yīng)用于金融領(lǐng)域,花旗集團成為了首位金融客戶。Watson幫助花旗分析用戶的需求,處理金融、經(jīng)濟和用戶數(shù)據(jù)以及實現(xiàn)數(shù)字銀行的個性化,并幫助金融機構(gòu)找出行業(yè)專家可能忽略的風險、收益以及客戶需求。
硬件:人腦模擬芯片SyNAPSE
SyNAPSE(Systems of Neuromorphic Adaptive Plastic Scalable Electronics,即“自適應(yīng)塑料可伸縮電子神經(jīng)形態(tài)系統(tǒng)”)芯片,含有100萬個可編程神經(jīng)元、2.56億個可編程突觸,每消耗一焦耳的能量,可進行460億突觸運算。在進行生物實時運算時,這款芯片的功耗低至70毫瓦(mW),比現(xiàn)代微處理器功耗低數(shù)個數(shù)量級。
谷歌在一系列人工智能相關(guān)的收購中獲益。2013年3月,谷歌以重金收購DNNresearch的方式請到了深度學習技術(shù)的發(fā)明者Geoffrey Hinton教授。2014年年初,谷歌以4億美元的架構(gòu)收購了深度學習算法公司——DeepMind,也就是推出AlphaGo項目的公司。該公司創(chuàng)始人哈薩比斯是一位橫跨游戲開發(fā)、神經(jīng)科學和人工智能等多領(lǐng)域的天才人物。
云平臺:TensorFlow數(shù)據(jù)庫,機器學習的核心是讓機器讀懂數(shù)據(jù)并基于數(shù)據(jù)做出決策。當數(shù)據(jù)規(guī)模龐大而又非常復(fù)雜時,機器學習可以讓機器變得更聰明。TensorFlow在數(shù)據(jù)輸入和輸出方面都有驚人的精度和速度,它被確切地定義為人工智能工具。
產(chǎn)業(yè)布局:谷歌無人駕駛汽車、基于Android智能手機的各種app應(yīng)用與插件、智能家居(以收購的NEST為基礎(chǔ))、VR生態(tài)、圖像識別(以收購的Jetpac為基礎(chǔ))。
2013年12月,Facebook成立了人工智能實驗室,聘請了卷積神經(jīng)網(wǎng)絡(luò)最負盛名的研究者、紐約大學終身教授Yann LeCun為負責人。Yann LeCun是紐約大學終身教授,是卷積神經(jīng)網(wǎng)絡(luò)領(lǐng)域的重要推動者,而該技術(shù)的最主要應(yīng)用就是圖像識別的自然語言處理,這與Facebook的需求和已經(jīng)積累的數(shù)據(jù)類型非常匹配。在Yann LeCun的幫助下,2014年Facebook的DeepFace技術(shù)在同行評審報告中被高度肯定,其臉部識別率的準確度達到97%。而他領(lǐng)導的Facebook人工實驗室研發(fā)的算法已經(jīng)可以分析用戶在Facebook的全部行為,從而為用戶挑選出其感興趣的內(nèi)容。
AI技術(shù):視覺DeepFace技術(shù)(收購http://face.com)、語音識別(收購Mobile technologies)、自然語義(收購Wit.AI)、神經(jīng)網(wǎng)絡(luò)訓練+機器學習
云平臺:開發(fā)者平臺Parse、Torch開源深度學習模塊
硬件: Big Sur(基于GPU的用于訓練神經(jīng)網(wǎng)絡(luò)的硬件系統(tǒng),開源)
產(chǎn)業(yè)布局:語音助手Moneypenny、VR生態(tài)(收購Oculus Rift、Sourroud360全景攝像機促進內(nèi)容發(fā)展)
百度
2014年5月,被稱為“谷歌大腦之父”的AndrewNG(吳恩達)加盟百度,擔任首席科學家,負責百度“百度大腦”計劃。大數(shù)據(jù)是人工智能的基礎(chǔ),而作為天然的大數(shù)據(jù)企業(yè),百度擁有強大的數(shù)據(jù)獲取能力和數(shù)據(jù)挖掘能力。2014年7月14日,百度憑借自身的大數(shù)據(jù)技術(shù)14場世界杯比賽的結(jié)果預(yù)測中取得全中的成績,擊敗了微軟和高盛。2014年9月,百度正式發(fā)布整合了大數(shù)據(jù)、百度地圖LBS的智慧商業(yè)平臺,旨在更好在移動互聯(lián)網(wǎng)時代為各行業(yè)提供大數(shù)據(jù)解決方案。
AI技術(shù):語音識別Deep Speech、視覺識別“智能讀圖”、自然語言與智能語義、自動駕駛、深度學習
解決方案:基于智能手機的語音服務(wù)系統(tǒng)(度秘)
開發(fā)者云平臺: 百度云
產(chǎn)業(yè)布局:汽車領(lǐng)域無人駕駛、基于智能手機的各種app應(yīng)用與插件。
Microsoft
AI技術(shù):語音、視覺、自然語言、分布式機器學習
云平臺:Microsoft Azure(存儲、計算、數(shù)據(jù)庫、live、媒體功能)、分布式機器學習工具包DMTK(自然語言處理,推薦引擎,模式識別,計算機視覺以及預(yù)測建模等)、人工智能平臺Project Malmo
產(chǎn)業(yè)布局:語言助手(微軟小冰、Cortana小娜、Tay)、VR(Hololens全息眼鏡)
Apple
AI技術(shù):自然語言(收購Vocal IQ)、收購可視化地圖MapsenseGPS公司 Coherent Navigation
產(chǎn)業(yè)布局:汽車領(lǐng)域無人駕駛、SIRI語音助手
Amazon
云平臺:Amazon Web Services(存儲、計算、模式識別和預(yù)測,其中視頻識別API 收購Orbeus)
阿里
云平臺(阿里云IaaS,可視化人工智能平臺DTPAI)
產(chǎn)業(yè)布局 :智能家具、物聯(lián)網(wǎng)
騰訊
AI技術(shù):視覺、智能計算與搜索實驗室
產(chǎn)業(yè)布局:智能硬件
三、人工智能的生態(tài)
科技巨頭圍繞人工智能產(chǎn)業(yè),開展了大量的收購;標的包括人工智能初創(chuàng)企業(yè)(算法)、大數(shù)據(jù)公司(算法或數(shù)據(jù))和芯片研發(fā)公司(計算能力)。截至至2016年7月底,谷歌在其中的收購次數(shù)最多達到了13次。巨頭們在人工智能領(lǐng)域的并購呈現(xiàn)兩個特點:一是連續(xù)多次買入,二是標的規(guī)模較小。
從2013年開始,科技巨頭大多加大了對人工智能的自主研發(fā),同時通過不斷開源,試圖建立自己的人工智能生態(tài)系統(tǒng),開源力度不斷增加。比如Google 開源TensorFlow 后,Facebook、百度和微軟等都加快了開源腳步。最早走向人工智能工具開源的是社交巨頭Facebook,于去年1月宣布開源多款深度學習人工智能工具。而谷歌、IBM和微軟幾乎于去年11通同時宣布開源。谷歌發(fā)布了新的機器學習平臺TensorFlow,所有用戶都能夠利用這一強大的機器學習平臺進行研究,被稱為人工智能界的Android。IBM則宣布通過Apache軟件基金會免費為外部程序員提供System ML人工智能工具的源代碼。微軟則開源了分布式機器學習工具包DMTK,能夠在較小的集群上以較高的效率完成大規(guī)模數(shù)據(jù)模型的訓練,在今年7月微軟又推出了開源的Project Malmo項目,用于人工智能的訓練。
人工智能已經(jīng)逐漸建立起自己的生態(tài)格局,由于科技巨頭的一系列布局和各種平臺的開源,人工智能的準入門檻逐漸降低。未來幾年之內(nèi),專業(yè)領(lǐng)域的智能化應(yīng)用將是人工智能主要的發(fā)展方向。無論是在專業(yè)還是通用領(lǐng)域,人工智能的企業(yè)布局都將圍繞著基礎(chǔ)層、技術(shù)層和應(yīng)用層三個層次的基本架構(gòu)。
基礎(chǔ)層就如同大樹的根基,提供基礎(chǔ)資源支持,由運算平臺和數(shù)據(jù)工廠組成。中間層為技術(shù)層,通過不同類型的算法建立模型,形成有效的可供應(yīng)用的技術(shù),如同樹干連接底層的數(shù)據(jù)層和頂層的應(yīng)用層。應(yīng)用層利用輸出的人工智能技術(shù)為用戶提供具體的服務(wù)和產(chǎn)品。
位于基礎(chǔ)層的企業(yè)一般是典型的IT巨頭,擁有芯片級的計算能力,通過部署大規(guī)模GPU和CPU并行計算構(gòu)成云計算平臺,解決人工智能所需要的超強運算能力和存儲需求,初創(chuàng)公司無法進入。技術(shù)層的算法可以拉開人工智能公司和非人工智能公司的差距,但是巨頭的逐步開源使算法的重要程度不斷降低。應(yīng)用層是人工智能初創(chuàng)企業(yè)最好的機遇,可以選擇合理的商業(yè)模式,避開巨頭的航路,更容易實現(xiàn)成功。
總結(jié)
- 上一篇: 【1】初识pr界面布局和工作流
- 下一篇: CE-植物大战僵尸(1)