作者:吳寧川 / 日期:2016-04-14
前方高能預警
這是一部關于人工智能的全方位透視貼,深度!重磅!長!!請保持饑餓,保持愚蠢,耐心地花上20分鐘,我保證你會對AI有個全新的認知~
1956年的夏天,一場在美國達特茅斯(Dartmouth)大學召開的學術會議,多年以后被認定為全球人工智能研究的起點。2016年的春天,一場AlphaGo與世界頂級圍棋高手李世石的人機世紀對戰,把全球推上了人工智能浪潮的新高。
經歷了兩次起伏,人工智能現在進入了全球爆發的前夜。僅在中國就有上億人直接或間接地觀看了AlphaGo與李世石的比賽,而這一事件,正好發生在60年這個時間節點上,可以說是全球人工智能界承上啟下的里程碑式事件。因為,AlphaGo的算法是前60年人工智能研究都很少觸及的領域:增強學習,即無監督的深度學習,而前60年的主流算法為有監督的深度學習。
中國有句古話叫做60年一輪回。然而對于人工智能來說,往后的60年并不僅是輪回,而是新生。這一次,隨著前60年有監督深度學習算法的理論研究和工程化的成熟,以及硬件計算能力的大幅提升和成本的飛速降低,在云計算、大數據和移動互聯網的融合推動下,人工智能在很多方面都有了突破性進展。
更為重要的是,除了微軟、IBM等大公司外,谷歌、Facebook、百度等互聯網巨頭紛紛向人工智能領域投巨資進行研發,各國政府也開始意識到人工智能是未來社會的戰略制高點,甚至人工智能有可能成為未來社會的一部分。
實際上,隨著計算機的發明,人們一直在探討,這到底會導致什么樣的人工智能?一種預見是可以產生功能性的人工智能,這就是今天有監督深度學習所廣泛取得的成果。還有一種觀點是人工智能可以模仿人的思維和感情活動,這就是無監督深度學習將要開創的未來。
當智能機器可以自己張開眼睛看世界,通過自主探索世界來獲得智能的話,未來可能出現的變化究竟有多“無窮大”?
1
上篇:未來AI的五大元素
增強學習算法更接近生物學習的行為特征,具有探索未知世界的能力。AlphaGo對增強學習算法的探索,打開了“無窮大”的大門……
1、承上啟下者,AlphaGo
當AlphaGo戰勝李世石的消息傳來,深藍之父Murray Campbell就此評價說:“這是人工智能一個時代的結束。”
兩次人機大戰時隔20年,這其中最重要的差別在于象棋與圍棋的復雜度差異巨大。人工智能之所以能夠先戰勝國際象棋冠軍,在于國際象棋可以窮盡接近所有可能的棋局,而圍棋就不一樣了。圍棋棋局究竟有多少種變化?普林斯頓的研究人員給出了一個最小的數字:19x19格圍棋的合法棋局數為10的171次方,這個數字接近無窮大。
AlphaGo對戰李世石
根據美國Wired網站長期跟蹤谷歌的記者Cade Metz的報道,AlphaGo前期通過一個已知職業棋手的3000萬步數據庫進行訓練,在獲得相當的熟練度后,AlphaGo開始用增強學習算法與另一個AlphaGo程序相互博弈,探索未知的但與取勝有關的棋局,用以培養自己的“智能”。圍棋對于人工智能來說,相當于是求解一個開放式的問題。
機器學習算法大致可以分為3種:監督學習(如回歸、分類)、非監督學習(如聚類、降維)和增強學習。人工智能前60年,主要通過有監督的深度學習算法,解決語音識別、圖像識別、自然語言理解等總樣本量有上限的相對“有窮大”問題。
增強學習算法主要從任意初始狀態開始,機器與外部環境持續交互,通過不斷試錯和累積回報來“學習”最佳策略,在這個過程中外界不給予直接指導(監督),只給予間接的或是遠距離的回報(Reward)。舉例來說,訓練室內機器人完成某個任務,在這個過程中人類并不干涉,只有當機器人接近完成任務時才給予正反饋。
換句話說,增強學習算法更接近生物學習的行為特征,具有探索未知世界的能力。AlphaGo對增強學習算法的探索,打開了“無窮大”的大門。
2、語音識別走下神壇
微軟是人工智能領域的另一巨頭。微軟人工智能首席科學家、美國IEEE電氣和電子工程師協會院士鄧力長期投身于語音識別研究,在自動語音與說話者識別、口語識別與理解、語音-語音翻譯、機器翻譯、圖像和多模態信息處理等領域做出了重大貢獻,憑借在深度學習與自動語音識別方向的杰出貢獻,獲得了2015年度IEEE信號處理技術成就獎。
微軟人工智能首席科學家鄧力
鄧力表示,有監督的深度神經網絡已歷經了研究與確認,被認為是能夠解決語音和圖像識別的最有效的工具。基本上到2012年的時候,有監督深度神經網絡用于語音識別就已經成功取得突破。當時,微軟研究院全球院長Rick Rashid在天津成功演示了一個全自動同聲翻譯系統,實時把英文演講翻譯成中文并以中文語音輸出。
Rick Rashid演示中的語音識別部分采用了有監督學習的深度神經網絡工具,最先由鄧力和他的微軟同事于2009~2010間與多倫多大學的Geoffrey Hinton 教授合作開發。如今,微軟的語音識別技術已經工程化并廣泛用于微軟的多個產品中。
作為中國的國家隊,科大訊飛在智能語音技術領域有著長期的研究積累,并在語音合成、語音識別、口語評測、自然語言處理等多項技術上有著國際領先的成果。2008年6月,科大訊飛參加NIST(美國標準技術研究院)舉辦的說話人識別SRE大賽,就在3項關鍵指標中,獲得兩項第一、一項第三、綜合評比第一的好成績。
科大訊飛是中國唯一以語音技術為產業化方向的“國家863計劃成果產業化基地”、“國家規劃布局內重點軟件企業”、“國家高技術產業化示范工程”,并被原信息產業部確定為中文語音交互技術標準工作組組長單位,牽頭制定中文語音技術標準。
基于自主知識產權的智能語音技術,科大訊飛已推出從大型電信級應用到小型嵌入式應用,從電信、金融等行業到企業和消費者用戶,從手機到車載、從家電到玩具等不同應用場景的多種產品,還發布了“訊飛語音云”平臺。目前,科大訊飛已占有中文語音技術市場70%以上市場份額,開發伙伴超過5000家,以訊飛為核心的中文語音產業鏈已初具規模。
3、計算機視覺逼近拐點
視覺識別是人工智能的一個重要研究領域,沒有視覺識別能力的機器人無法真正與外界交互。2015年,在微軟等大公司的推動下,計算機視覺已經逼近全面突破的拐點。
ImageNet是全球頂級的計算機視覺挑戰賽,挑戰賽項目之一是對1000 類、120萬張互聯網圖片進行分類,每張圖片人工標注5個相關類別,計算機識別的結果只要有一個和人工標注類別相同就算對。對于該圖片集,人眼辨識錯誤率大概為5.1%,目前只有谷歌和微軟等個別參賽團隊的算法能夠達到低于5%的結果。
2015年12月10日,微軟亞洲研究院視覺計算組在ImageNet計算機識別挑戰賽中再次打破紀錄,獲得圖像分類、圖像定位以及圖像檢測全部三個主要項目的冠軍,將系統錯誤率降低至3.57%。在計算機視覺識別領域,卷積神經網絡(即為有監督的深度學習)是主要的算法。微軟亞洲研究院視覺計算組首席研究員孫劍介紹說,他所帶領的研究團隊使用了高達152層的深層卷積神經網絡算法,比以往任何成功的算法層數多達5倍以上。
而在另一方面,微軟亞洲研究院硬件計算組與清華大學電子工程系一直在硬件加速領域合作了,從2013年開始雙方一起研究怎樣把深層卷積神經網絡與智能硬件結合起來,其成果就是基于FPGA(可編程芯片)技術的A-Eye視覺芯片。微軟的研究表明,高端GPU的圖像處理能力是FPGA的2到3倍,但FPGA的功耗約是高端GPU的1/10,多個FPGA結合能以低功耗達到GPU的處理能力。
據微軟亞洲研究院硬件計算組主管研究員徐寧儀介紹,A-Eye視覺芯片包括了一個基于軟件的壓縮算法和基于FPGA芯片的硬件實現,其本質上是通過軟件壓縮和定制的硬件加速,讓計算機視覺識別算法適用于普通的智能終端。基于A-Eye技術的高性能智能視覺芯片,可以廣泛用于智能安防、嬰兒和老人看護、無人汽車和無人機等各種需要計算機視覺的領域。
目前卷積神經網絡的圖像識別能力有賴于輸入的原始數據集,例如用花卉圖像集訓練出來的算法就只能識別花卉。基于Bing搜索引擎的大數據,接下來微軟正在探索通用型視覺識別算法和工程化實現。一旦工程化實現了通用型視覺識別技術,智能機器張眼看世界的那一天就不遠了。
4、開始探索情感算法
整個人工智能研究的起源,在于一個基本的假設,即能夠用機械的方式模仿人類的思維。人工智能前60年,就在這個方向上不斷地探索。但是,能否用機械的方式模仿人類的感情呢?
情感的表達遠非“0”或“1”那么簡單,就像人類的愛情絕非對與錯那樣絕對。如何讓機器理解人類的情感,又如何把情感與知識進一步結合,發展出全新的計算架構?情感計算前進之路更加艱難,直到微軟“小冰”的出現。
微軟小冰有可能成為有史以來首個情感算法機器人
最開始作為一個聊天機器人,微軟小冰由微軟亞洲互聯網工程院開發,2014年5月29日,一代小冰開始了微信公測,在3天內贏得了超過150萬個微信群、逾千萬用戶的喜歡。2015年8月20日,第三代微軟小冰正式發布。2015年11月小冰發布了計算視覺功能,從此,小冰還能根據圖片和視頻與用戶聊天。
然而,微軟小冰的意義絕不僅僅是聊天機器人。微軟全球執行副總裁沈向洋說,希望小冰成為一個慢慢融入人類社會的機器人、每一個用戶的個人助手,而且是一個真正通過情感計算,理解用戶、能夠交流、能夠溝通的人工智能機器人。在更深層上,微軟小冰正在成為整個微軟的人工智能基礎設施,小冰的研究成果正擴散到微軟產品與服務的方方面面。
初步統計,僅在微軟亞洲研究院就有將近15個研究團隊與負責小冰的算法研究,而包括以色列、紐約、休斯頓總部的微軟研究院也正為小冰提供技術支持,涉及包括大數據、自然語言互動、計算機視覺、SR(語音識別)、TTS(文字到語音轉換)、IoT等十幾個領域。
想象一下,未來的家庭里將出現智能手表、智能音箱、智能電視機、智能冰箱、智能燃氣表、智能玩具等多種智能設備,人們無法再通過一個個APP與這些智能設備溝通,就必須出現一個超級APP來管控所有的智能設備,微軟小冰就有望成為這樣的超級人機交互界面。
5、從底層芯片突破人工智能
2016年3月24日,在ARM公司與重慶市的戰略合作簽約儀式上,重慶市長黃奇帆在致辭中表示“一切人工智能的源頭,集中在芯片上”。
黃奇帆市長可能沒有意識到,這個論斷也是未來60年人工智能發展的重要主題之一。在人工智能前60年的發展中,馮·諾依曼架構的瓶頸已經成為共識,在接下來的60年里,如何打破馮·諾依曼架構的瓶頸,已經成為各大公司和各國政府戰略級的研究項目。
IBM TrueNorth神經元芯片
2014年8月,IBM研究院在《科學》雜志上介紹了一款名為“TrueNorth”神經元芯片,它從底層模仿了人腦結構而且用普通半導體材料就能制造出來。TrueNorth表面上看起來和普通處理器沒有太大區別,它的核心區域內擠滿了4096個處理核心,用來模擬超過百萬個人腦神經元和2.56億個神經突觸。
2008年初,IBM TrueNorth研究項目獲得了美國五角大樓高級計劃研究局(DARPA)的5300萬美元資助,DARPA認為這項研究有助于突破馮·諾伊曼計算機體系。TrueNorth由三星代工生產,具備量產的基礎。基于TrueNorth芯片,IBM已經研發出了神經元計算機原型機,能夠以低功耗實現更高準確率的圖像識別、視頻處理等人工智能關鍵性功能。
2015年4月,IBM研究院Mark Ritter在他的一篇博客中,介紹了IBM在量子計算機方面的研究突破。IBM的T.J.沃森研究實驗室的一組科學家和工程師,正處于開發首臺真正量子計算機的前沿。2015年4月,這個團隊在科學雜志《NatureCommunications》(《自然通訊》)上發布了一篇重要的論文,介紹了在實現可行性量子計算機中的兩個關鍵性進展。
1981年在MIT召開的首屆量子計算會議上,諾貝爾獎獲得者Feynman挑戰科學家們研究量子計算機。與現代計算科學的方式方法截然不同,在量子計算前提下,整個計算基礎設施必須被重新想象與重構。除了IBM外,谷歌與微軟也集合了科學家與高校的力量投入量子計算的研究。Mark Ritter認為,IBM有望首先實現量子計算機,而當前正在進入量子計算研究的黃金時代。
除了遠期的神經元芯片和量子計算機外,NVIDIA、Intel、ARM等公司通過改進現有的芯片設計,把人工智能推進到底層芯片中。NVIDIA的GPU被用于數據中心的大規模分布式機器學習環境,區別于傳統CPU的Intel Xeon Phi更強調與CPU協同工作的GPU技術,而在移動互聯網時代遙遙領先的ARM則在智能汽車、可穿戴設備、智能家電、物聯網、工業裝置等領域圍繞未來人工智能場景來思考一代又一代的芯片設計。
ARM全球CEO Simon Segars在接受采訪時表示,必須以更具成本效益的方式實現人工智能應用,只有當AI的成本和價格是普通人都能夠承擔時,AI才是真正達到了人們期望的目標。2016年3月,ARM宣布與臺積電合作展開7nm芯片的研究,能以更高性價比廣泛應用于智能終端和數據中心,預計在2017~2019年量產。目前,其它芯片公司還停留在10nm芯片的競爭。此外,ARM還加入了由Facebook發起的開源硬件項目OCP,該項目邀請開源硬件社區共同設計下一代數據中心的硬件設備,ARM就在與Paypal聯合開發低功耗的定制化芯片。
2
下篇:全球第一波人工智能商業化浪潮
盡管人工智能已經有了60年的歷史,但是人工智能的規模化商業浪潮卻一直遲遲沒有到來。之前,盡管有微軟、谷歌、Facebook等大公司不斷投資人工智能技術,但大多把研究成果用于自身業務的優化與效率提升。因此,可以說2016年IBM在全球范圍內傾全力推出的“認知商業”,才是真正意義上的人工智能商業化第一波浪潮。
早在1960年4月25日,在一份給IBM管理者的備忘錄中,當時的首席執行官小沃森談及IBM面臨的問題是制造“會思考的機器”。從大型機到小型機、從PC到POWER服務器、從“深藍”到“IBM Watson”,IBM對“會思考的機器”的思考從未停止過。尤其自20世紀90年代人工智能研究陷入低潮以來,IBM是少數堅持投入人工智能研究的企業。
作為世界上第一家百年IT企業,IBM堅持每年研發經費投入超過60億美元。自從近年來遭遇轉型困境后,人工智能研究成果的商業化自然成為了IBM的首選。
1、“IBM Watson”橫空出世
2016年3月1日,IBM大中華區董事長陳黎明在IBM論壇2016上,宣布IBM公司105年的歷史上第3個代表商業戰略的品牌“認知商業”落地中國。此前早在1997年,IBM就描繪了“電子商務”的愿景;2008年,IBM推出了“智慧的地球”。
IBM大中華區董事長陳黎明宣布IBM認知商業戰略在中國正式落地
“認知商業”基于IBM推出的認知計算,其核心為新一代IBM Watson技術及Watson APIs。這個命名實際上來自IBM創始人 Thomas J. Watson 老沃森的姓氏,而IBM Watson則是繼“深藍”之后的下一個超級認知計算平臺。提起“深藍”,可謂無人不知。1997年5月1日,國際象棋大師卡斯帕羅夫最終以25:35的比分輸給了IBM RS/6000SP“深藍”計算機,舉世震驚。
由于象棋是高度結構化游戲,實際上“深藍”并不需要太高的學習能力。有關資料顯示,1997年版的“深藍”每秒鐘可以計算2億步,存儲了100多年來優秀棋手對局的200多萬棋局。在“深藍”成功后,IBM研究院進而挑戰人工智能的深度問答(Deep Q&A),這是人工智能的一個重要分支,具有極為廣闊的應用空間。
IBM Watson最早現身在2011年2月美國老牌益智節目“危險邊緣”(Jeopardy!),與節目史上最強的兩位答題高手一較高下,并最終以優異的表現打敗了人類選手。從2004年提出挑戰“Jeopardy!”的構想,到2011年IBM Watson真正打敗“Jeopardy!”,中間差不多經歷了6年的時間。為什么會這么困難?
Watson并不是簡單的機器學習系統,當IBM的研究員開始嘗試構造Watson時,發現傳統的機器學習算法行不通。傳統的機器學習算法先歸納知識,把知識形成規則,再讓機器根據規則進行響應。這不足以讓Watson在“Jeopardy!”節目中勝出,由于數據量過于龐大,IBM研究員意識到必須讓Watson能夠自行學習知識而盡量減少人工干預。
經過學習和訓練,Watson的Deep Q&A系統能夠從原始信息中自動抽取知識,對知識進行分類并且能夠分析和理解自然語言。如此,Watson就能夠像人類一樣學習,并從已經發生的事件進行推理和總結經驗。由于這樣的任務已經超出了前代超級計算機的能力,IBM的研究員從頭設計了IBM Watson系統,包括軟件和硬件體系。
2011年打敗“Jeopardy!”的時候,IBM Watson是由10臺IBM商用服務器Power750組成的計算系統。2014年初的時候,IBM Watson的體積已由1個臥室縮小到3個披薩盒子那么大,運算速度是之前的 24 倍,智能水平是之前的24倍。
2、IBM Watson的商業化進程
在小沃森的備忘錄里,強調“計算機永遠不會取代人的主動性,也不會取代人類的創造性思維。”計算機就是要把人類從無意義的、重復性的思維模式中解放出來。因此,在IBM Watson的商業化推廣中,IBM提出了“認知計算”,強調的人與機器共存。在認知計算時代,并不是機器取代人類,而是人機協作共同創造更好的結果。
2014年1月12日,IBM宣布將投資逾10億美元,創建一個新的IBM Watson 業務集團,基于云計算交付模式,實現認知計算技術的商業化,從這一點開始標志著IBM又一次拉開了世紀轉型。
位于紐約的IBM Watson大樓
在創建IBM Watson業務集團的同時,IBM公布了幾項基于Watson的新功能:IBM Watson Discovery Advisor、IBM WatsonAnalytics以及IBM Watson Explorer 等,分別用于大數據探索、基于自然語言的數據可視化分析和應用程序開發框架。目前Watson Analytics在全球已經擁有超過100萬注冊用戶,2016年3月在大中華區剛推出就獲得了近2萬個注冊用戶。
IBM Watson業務集團總部位于紐約的“硅巷”(Silicon Alley),總部大樓內為創業者提供了相關的孵化器,也為IBM客戶提供了客戶解決方案中心用于體驗認知技術,還有一個設計實驗室來幫助IBM客戶和合作伙伴持續提升認知應用及服務的用戶體驗。實際上,在宣布的10億美元投資中,還包括了1億美元的風險投資,用于構建IBM Watson生態圈。
為了擴展可用的Watson數據源,IBM Watson Content Marketplace結合了各種獨特且多樣化的第三方數據,其中的數據和信息可被IBM客戶、合作伙伴、開發者和其它機構用于Watson支持的應用和服務中。迄今為止,該市場接入了Wikivoyage、疾病控制中心、Cancer.gov、美國臨床腫瘤學會等多家醫療機構的合作內容,以及美聯社、Barchart.com、晨星機構(Morningstar)、RxWiki和WAND等新聞報道檔案、健康管理、金融服務、腫瘤學、醫藥、工程及其它領域的知識庫。IBM還與Twitter、Facebook、蘋果等公司建立戰略聯盟,以便能夠存取相關的數據。
IBM專門推出了AlchemyData,通過聚合超過7.5萬個來源的新聞和博客內容,利用自然語言處理(NLP)加以強化,讓Watson應用能夠采集市場信號、實現業務流程自動化和趨勢分析。IBM后來收購的AlchemyAPI,就是一家提供人工智能文本和圖像分析服務的前沿公司。
2015年3月,IBM宣布將向物聯網投資超過30億美元。利用這一投資,在2015年10月IBM公司透露了收購The Weather Channel的B2B、移動和云業務的計劃,并于2016年1月完成收購,IBM將向包括中國、印度、巴西、墨西哥和日本在內的5大新興市場擴展weather.com。氣象數據在業務運營、市場營銷、風險管理等商業領域,有著廣泛的價值。
2015年4月IBM成立Watson Health,加強在醫療和健康行業的布局,先后收購了包括Explorys(一家可以查看5000萬份美國患者病例的分析公司)、Phytel(處理各類健康數據及提供數據分析的云軟件公司)、醫療影像公司Merge Healthcare 公司。其中,Merge的技術平臺普遍應用在7500余家美國醫院及全球眾多著名臨床研究機構和制藥公司。
2016年剛開年,IBM就宣布進行了郭士納以來一次大型的組織調整。這次調整涉及了IBM的三大部門——全球行業事業部門、整合認知解決方案部門以及云計算部門,筆者認為其中的商業邏輯將會是全球行業事業部門梳理行業用戶需求、整合認知解決方案部門根據需求開發認知解決方案、云計算部門提供平臺支持。
2016年3月1日,IBM向中國市場推出“認知商業”品牌,在中國市場展開了鋪天蓋地的宣傳推廣活動。3月15日,IBM宣布基于認知計算的IBM營銷云落地中國,特別加入了對于微信的支持。
3、算法經濟時代到來,算法將統治世界
IBM正在轉型為一家認知計算公司,其背后的大邏輯是全球正在進入一個算法經濟時代。自去年以來,Gartner就在多份報告中強調,算法連通了人、事物、業務及信息,將創造全新的商業價值。在未來,算法將成為企業的核心資產,代替企業把大數據轉化為商業洞察、自動化業務流程以及差異化產品與服務。一句話,算法將統治世界。
IBM正在拉動全球第一次人工智能商業化浪潮
在一個算法經濟時代,人工智能算法僅是眾多算法中的一種。IBM董事長Ginni Rometty在去年10月的Gartner全球峰會上說,Watson并不僅僅是人工智能,人工智能算法是Watson背后32個引擎中的一個。實際上在過去的幾年間,除了推動Watson認知計算的商業化之外,IBM一直在不余遺力的收購商業算法公司,納入到IBM整體的算法體系。
IBM于2011年花費近4億美元收購了一家叫做Algorithmics的公司,其業務就是用商業算法來計量金融交易的風險。Algorithmics參與了國際巴寒爾協議的咨詢與建議,不斷跟蹤巴寒爾協議進展并把新的規范編入算法中,再把算法賣給各國的銀行用于金融風險監控。據有關統計,在收購Algorithmics之前,IBM就已經花費了140億美元用于收購25家分析公司。
當然,在整個IBM算法體系中,Watson認知計算是“皇冠上的明珠”。IBM Watson業務集團高級副總裁Michael Rhodin說:“在IBM 100年的歷史上,Watson是我們最重要的創新之一。” IBM 董事長 Ginni Rometty在去年10月的Gartner全球峰會上說,推動全球邁向“認知商業”時代,“這是我們的登月工程。”
在已經推出的Watson API中,包括:文本轉語音API,歷經12年的研發,最新加入的情商功能讓文本轉語音的時候能適應語境與情緒;語調分析器API,可對文本中的語調進行分析,獲得更好的觀察;情緒分析API,通過復雜的自然語言處理,感知外部環境中用戶情緒的變化;視覺識別API,可以定制化適應不同企業的圖像識別需求等等。據統計,Watson API每月被調用高達13億次,并且還在快速增長。
目前已經有36個國家、17個行業的企業在使用Watson的認知技術,全球超過7.7萬名開發者在使用Watson Developer Cloud平臺,超過350家生態系統中合作伙伴及企業內部創新團隊正在構建基于認知技術的應用、產品和服務,其中100家企業已將產品推向市場。
可以說,基于自身轉型的需求和龐大的企業經濟體量,IBM正在真正拉動全球第一次人工智能商業化浪潮。而在這次大浪潮之下,首先受益的將是商業智能算法公司,包括IBM、SAS、QLIK、Tableau等商業智能軟件公司將迎來黃金時代。
4、創業者把AI擴散到社會的每一個角落
隨著AlphaGo在全社會引起了巨大的反響,新一輪人工智能創業潮正在醞釀中。2016年3月26日,科大汛飛與專注天使輪投資的阿爾法公社宣布了AI領域聯合天使投資計劃,未來將在AI領域展開批量投資。科大訊飛高級副總裁江濤表示,在未來社會里AI將成為水和電一樣的基礎性資源,創業者們將把AI擴散到社會的方方面面。
阿爾法公社與科大訊飛聯合宣布批量支持AI創業
為什么說AI將成為基礎性社會資源?原因很簡單,今天的互聯網已經成為了基礎性的社會資源。而在萬物互聯網時代,物聯網的規模遠遠大于今天的互聯網。除了接入現有的互聯網設備外,未來的物聯網還將接入大量機器對機器(M2M)網絡。在一個更為復雜和龐大的物聯網前提下,人工智能就必須成為整個物聯網的關鍵組成部分,進而成為基礎性資源。
如果說過去的人工智能創業必須要在基礎科研層面有所突破,如今這個壁壘已經被打破。谷歌、微軟、Facebook等大公司以及卡耐基·梅隆大學、NYU等高校紛紛開源核心的機器學習算法,谷歌的TensorFlow、微軟的DMTK、Facebook的Torch、卡耐基·梅隆大學的Petuum、加州伯克利分校的Caffe等,都提供了成熟的人工智能和深度學習算法模塊。而IBM Watson認知計算云服務,本身就是以低價格向全社會大規模輸出人工智能的能力。
值得注意的是,大公司開源出來的機器學習算法并不是簡單的宣傳“噱頭”,而是貨真價實的“干貨”。微軟開源版DMTK包含了目前世界上最大規模的主題模型和分布式詞向量模型,DMTK還是分布式機器學習工具,讓創業者很簡單就在多機環境甚至是集群系統中部署大規模機器學習算法,大幅降低了機器學習創業的門檻。為什么這么多大公司都紛紛開源自己的核心機器學習算法呢?原因很簡單:爭奪下一個生態。
當然,也有人擔心大公司將壟斷未來的人工智能社會。2015年12月12日,特斯拉CEO ElonMusk在Twitter上宣布正式啟動非盈利人工智能項目OpenAI。OpenAI是一個非營利性的人工智能研究公司,目標是“推動數字智能的發展,同時不被財務回報所限制,從而造福整個人類”。OpenAI籌措了10億美元作為經費,從谷歌等公司挖來了人工智能專家,專門研究人工智能技術并答應無償公開。顯然,OpenAI是人工智能創業的又一劑強心針。
另一方面,人工智能創業迎來黃金期,還有另一個時代背景。微軟亞洲研究院人工智能研究組首席研究員、卡耐基·梅隆大學博士生導師劉鐵巖告訴記者,近年來全球機器學習領域的三大趨勢包括更大規模的機器學習、更深度的機器學習以及更強交互性的機器學習,這些都是基于大數據與云計算的興起。正是因為廉價的云計算和大數據技術,人工智能才有可能擴散到社會的每一個角落。(本文為節選,全文見《商業價值》雜志4月刊封面文章)