<cite id="n1d7t"><strike id="n1d7t"></strike></cite>
<cite id="n1d7t"><video id="n1d7t"></video></cite>
<var id="n1d7t"><video id="n1d7t"><listing id="n1d7t"></listing></video></var>
<var id="n1d7t"></var>
<var id="n1d7t"><video id="n1d7t"><thead id="n1d7t"></thead></video></var>
<cite id="n1d7t"><video id="n1d7t"></video></cite>
<cite id="n1d7t"><video id="n1d7t"></video></cite>
[更多專訪]

關于“暗知識”和“人工智能”的對話

「導語」AlphaGo戰勝了世界圍棋冠軍,但無論是聶衛平還是設計AlphaGo的谷歌工程師都無法理解AlphaGo為什么這樣走棋,這就是人工智能中令人困惑的“不可解釋性”問題。從這個問題出發,發現了一類全新的知識——“暗知識”。

一直以來人類知識可分為兩類:“明知識”和“默知識”。明知識就是那些可以用語言、文字或公式清晰表達和描述的知識;默知識則是個人在感覺上能把握但無法清晰描述的知識,也即我們常說的“只可意會,不可言傳”的那類知識。今天,人工智能突然發掘出了人類既無法感受又無法表達和描述的“暗知識”—隱藏在海量數據中的萬事萬物間的關系。介紹了機器學習五大流派從數據中挖掘暗知識的方法以及各自適用的領域,尤其是神經網絡的基本工作原理和目前在商業上應用廣泛的幾種形態。

本文是對話錄,作為對照,也引述了業界重要研究者的觀點和見解,相互驗證、互為解讀。

價值中國:請您談一談,提出“暗知識”概念的相關背景?

王維嘉:過去兩年我在硅谷做人工智能方面的投資,同時對那些基礎的東西非常有興趣。

我發現了一個重要的東西叫“暗知識”,“暗知識”就是人類無法理解的知識。什么叫人類無法理解的知識?這還要從阿爾法狗下圍棋開始說起。阿爾法狗下圍棋,讓全世界第一次注意到人工智能的神奇?聺嵲谙峦昶搴笸纯蘖魈,說我根本不可能打過他。它也讓聶衛平五體投地,說阿爾法狗至少是20段。正當我們被阿爾法狗一棒子打暈的時候,他的妹妹又出現了,他的妹妹就是“阿爾法折疊”。2018年年底,谷歌在科學雜志上發布了“阿爾法折疊”的研究成果,根據DNA的序列測出一個蛋白質的三維結構。

大家知道,蛋白質是一個超級大的分子,它的三維結構決定了蛋白質的性質,所有的生物、人體、植物動物的細胞都由蛋白質組成。人類今天對蛋白質的理解還是非常淺的。

2017年的諾貝爾化學獎頒給了冷凍電鏡的發明者Richard Henderson,冷凍電鏡是干什么的呢?用來看蛋白質的三維結構。過去人類不知道,也無法看到蛋白質的三維結構,現在有了冷凍電鏡,我們終于可以看到蛋白質的三維結構。怎么看呢?要把細胞冷凍了以后,照幾十萬張照片才能畫出一個蛋白質的三維結構。所以,只要看清楚一個蛋白質的三維結構,那就是頂級期刊的一篇文章。

阿法蝶(疊)從基因序列準確預測蛋白質結構

那么一臺冷凍電鏡多少錢呢?一千萬美金。我們去耶魯,耶魯人非常驕傲:我們有一臺電鏡。清華有兩臺。但是今天,“阿爾法折疊”只用人工智能就可以把它猜出來。怎么猜出來的?不知道。這就帶來了一個巨大的問題:阿爾法狗下圍棋,谷歌的工程師并不知道他怎么下,聶衛平也不知道。人工智能里出現了一個巨大的問題,就是不可解釋性。

林永青:作為開場白,有一點明顯的感觸就是,相比較2016年阿法狗戰勝人類圍棋冠軍的時候,今天業界的專家包括維嘉學長在內的業界專家,人們在情緒上更為樂觀了,或許這兩年大家更多地發現“人工智能”的局限性,更多地自我認同了人類的種種核心或獨特優勢。

我傾向于用“維度”來解釋人類知識或人類認知。由于人類自身“生物熵”的局限性,我的“猜測”(卡爾-波普爾的知識論術語)是人類最多只能處理三個維度的信息(知識)。因此,人類認識論的哲學爭論,也只不過停留在“一元論”與“二元論”這個非?蓱z的層級。

什么是“維度”?就是“思維”的維度。維度問題離不開“時間”因素——今天多數人的“時空觀”,只能理解到三維空間加上第四維時間——加上了時間維度,人們大致可以在認知上處理多維的,;但是,在“同時或共時”的約束下,人們。機器智能的區別就是維度區別。

愛因斯坦有句名言:想像力比知識更重要。不是嗎?我們的知識,只是二維(最多三維)的因果或相關連接,而多維的想像力,就是我們一無所知的暗知識。

我有一個“猜想”,所謂“解釋”,就是為知識建立某一角度(同一維度)或某一維度的“連接”。黑格爾很早就驗證了“因果鏈”在邏輯上是蒼白的,只是歸納法的運用而已,所以,我認為解釋也不過是一種類比或隱喻,既不是演繹推理,也不是統計歸納,因此“解釋”也就是一種意識連接、一種“無法解釋”的暗知識“涌現”。

{延伸解讀}波普爾:《猜想與反駁:科學知識的增長》

人類目前對于人工智能及人類智能的相關知識,都還只是非常早期的“猜想”。需要長期的驗證或反駁,來進行證實或證偽。

《猜想與反駁:科學知識的增長》,是英國哲學家卡爾-波普爾創作的哲學著作,首次出版于1963年。

該書是由波普爾不同時期的文章和講演組成的,除導論《論知識和無知的來源》外,分“猜想”和“反駁”兩部分。圍繞著知識通過猜想與反駁,不斷清除錯誤而增長這一主題展開論述,廣泛涉獵知識論、科學論、真理論,以及自然科學史和社會科學史等領域。 

闡述了其批判理性主義方法論的主要著作,認為科學開始于問題,即理論由證偽暴露出問題;從靈感出發,提出各種大膽的猜測,形成科學理論,然后對各種理論進行檢驗,從觀察和實驗中達到逼真度較高的新理論。新理論為科學技術的發展所證偽,又出現新問題。

波普指出,古典的經驗主義和理性主義都是錯誤的,無論觀察還是理性都不是知識的源泉。因為“我們的知識有各種各樣的源泉;至今沒有一種源泉有權威性。”

真正的認識論問題不是關于知識源泉問題,而是知識的正確性、即是否同事實相一致的問題。知識的進步在于批判地考察那些大膽的猜想。波普從哲學史和科學史的大量材料出發,全面的闡述了他的科學哲學思想,并在此基礎上提出了科學發現的方法,即猜想—反駁方法論。

價值中國:“暗知識”的提出,相信對于人類的認識論哲學,又推進了一步。請對此問題做些解讀。

王維嘉:我們人類從來沒有這樣憋屈過,因為我們自以為是整個宇宙智能最高的生物,沒有任何事情是我們不可理解的,所有的事情都應該有因果?墒菫槭裁吹搅私裉,我們居然不能理解?這就讓我們回到人類是如何獲取知識的這個問題。

過去兩千年來,一直有兩派在激烈地爭論。一派是理性主義。他們認為,概念是天生就有的,知識來自于推理,萬事萬物都有因果。這派的代表有柏拉圖,一直到笛卡爾。另外一派是從亞里士多德到蘇格蘭學派,他們認為人生出來天生是白紙一張,知識來自于感官,來自于經驗,萬世萬物沒有什么因果,只是相關。我們中國人更傾向于哪一派呢?經驗主義。中國人覺得,所有的經驗不通過感受和感官怎么能得到呢?

經驗主義的一個重要的方法論叫“歸納”。我見到一只天鵝是白的,兩只天鵝是白的……第一萬只天鵝是白的,那么我就得出結論——天鵝是白的,直到出現了第一只黑天鵝。所以,歸納法也是錯的,是不可靠的。

簡單做個小結。理性主義和經驗主義的歷史爭論,對于知識的進步基本無用。比如,理性主義對于人類從上帝手中解放自己,所謂“祛魅”有一些作用,對后人理解知識,卻沒有什么用處。經驗主義的出發點,也只是為了阻擊理性入侵宗教或道德等“形而上”領域,對理解“客觀知識”也幾乎無用。包括近代最重要的哲學家康德,在知識論上,我也認為是貢獻甚微。

但是,我們現在在腦神經科學等領域取得一點點進展,這可能幫助我們在微觀上理解知識有所助益;而在宏觀上,需要哲學來對知識做出整體性把握,方法是通過重新解釋由“科學帶來的真實性論據”。

價值中國:理性主義和經驗主義爭論了上千年,實質上并沒有什么知識進步。那么從今天的科學成果來解釋,人類的獲取知識的機制是什么?

王維嘉:為什么這兩派爭了兩千年,誰都不服誰?原因是他們在瞎爭,因為他們都不理解人類學習的微觀機制是什么樣的。人類學習的微觀機制一直到70年前才開始被搞清,它就基于大腦神經元的連接。人類有860億個神經元。

這個學習機制是怎么發現的?我們要歸功于巴甫洛夫。他發現,給狗喂食的時候搖鈴,一旦形成了習慣,即使沒有食物,一搖鈴狗也會流口水。這就是條件反射。1949年,加拿大科學家赫布就如何解釋這個現象提出了一個猜想:同時受激發的兩個神經元會連接起來。比如,嗅覺細胞聞到了狗食的香味,同時聽覺細胞聽到了鈴聲,這兩個細胞是同時受刺激的,一旦同時受刺激,它倆就連起來了,在連接的地方就形成了學習。下一回當你只聽到鈴聲,這個細胞就被激活,就會刺激“口水”細胞。這一猜想后來被無數的科學實驗證明是對的,被稱為“赫布學習定律”。

人類所有的學習都是這樣的一個微觀機制。再微觀下去,每個神經有上千個突觸,每個突觸之間是有電流通過的,所謂神經元之間的連接,實際是離子變成了電流,然后建立了神經元之間的傳導,其中的間隙只有20納米。知道了學習的微觀機制,我們就可以回過頭來看人類的知識是怎么獲得的。

價值中國:請對所定義的不同種類的知識,做一介紹。

王維嘉:我們今天理解的知識叫“明知識”,就是可以用文字、公式、程序、語言表達出來的知識。直到70年前,波蘭尼、哈耶克發現了一種知識叫“默知識”,或者叫“默會知識”。比如學自行車,全世界沒有一個人騎自行車是看手冊學會的,都是騎上去歪歪扭扭摔幾跤學會的。你教孩子學自行車,其實你也不知道是怎么學的。這種知識在生活中大量存在,比如繪畫、舞蹈和拉提琴等等都是這樣的默會知識。默會知識的基本原理就是:大腦神經元建立了聯系,但這樣的聯系非常復雜,是無法用語言表達的。我們所有的重大決定,最后都是由老板拍板。老板怎么拍板?索羅斯說,“我所有的重大決定都是靠胃做出來的,如果我的胃疼,說明這個決定不好。”

比如說,喬布斯從來不做市場調查,他說,“我的市場調查,就是每天早上出門前對著鏡子看我自己。”為什么?當智能手機出來之前,你去做用戶調查,問:你認為一個智能手機是什么樣的?你想要什么樣的智能手機?全世界沒有一個人說得出來,這就是默知識,我們冥冥中知道要什么東西,但是說不出來。那怎么辦?只能靠企業家去試錯,在喬布斯成功之前,硅谷試了20年,從掌上電腦到不成功的手機和觸屏,出現了各種各樣的東西,有不知道多少家公司失敗,最后到喬布斯成功。所以,因為默知識不可集中,所以創新必須是分散的,永遠不可集中。

講完了明知識和默知識,我們現在就可以講機器發現的暗知識。什么叫暗知識?就是人類不可感受又不可表達的一類新知識。我們如果劃一個坐標軸,橫軸是可表達,縱軸是可感受,那我們會發現,人類已有的知識都在右邊,有浮力定律等即可感受、也可表達的明知識;還有集合論、廣義相對論、量子力學等可表達而不可感受的明知識,它們是從方程里推出來的,是先有數學而后才有的物理發現。默知識是不可表達,但是可感受。這四個象限正好缺了第四象限,就是既不可表達又不可感受,這就是今天機器發現的這類知識,也就是阿爾法狗下圍棋、“阿爾法折疊”算蛋白質三維結構的這類知識。

如果用一個冰山來表達的話,人類已知的明知識,就是冰山的一小角,暗知識是冰山下面的最大塊的東西。波蘭尼,也就是第一個發現默知識的奧匈科學家,說:“我們知道的比我們說出來的要多。”但是暗知識就是整個海洋,也就是說,未來機器發現的知識會讓我們人類已有的兩千年到今天為止的知識顯得微不足道。我們人類以為,我們已經可上九天攬月,可以做基因編輯,但是實際上是什么也沒有。暗知識是未來統治和占領整個知識空間的最大量的一種知識。

大家說,你說的“暗知識”是不是一種哲學概念,這跟我有什么關系?太有關系了。上海交通大學兩位教授用1800張照片來訓練機器,照片中有罪犯、有好人,最后機器可以以90%的準確率來判斷是否是罪犯。這項研究在國際上引起了巨大的爭議。我到以色列看一家公司,他們也說在做同樣的東西,而且以色列海關準備用于查恐怖分子。我最終沒有投這家公司,因為我感覺這東西太懸乎了,但是有可能機器的確比人看得準。為什么?不知道,我看你就像罪犯!

社會積分系統。如果說今天攝象頭布滿了所有地方,那每個人從早上起來,從小到大所有的行為都在攝象頭下,最后攝象頭就根據你的行為,給你算出社會積分。你說我表現這么好,憑什么打這么低的分?不知道。這就是未來我們將遇到的重大問題,不可解釋的問題。

再如諾曼底登陸,為什么在諾曼底而不是卡拉斯登陸?機器算出來說要在卡拉斯登陸,那么盟軍司令聽不聽?聽它的可能就打勝仗,不聽它的就打敗仗。但是我們根本不懂為什么要這樣做?未來一個重大的決定很可能就是由機器做出來的,你可以選擇不聽機器的,但是你會失敗。但是為什么呢?不知道。因為是暗知識。這些生死攸關的決定,到底敢不敢交給機器來做?

所以,人類歷史上第一次被一腳踢出了知識獲取的回路。過去所謂知識就是人去學東西,現在機器自己學,和我們人沒有什么關系了,我們人一邊兒涼快去了,我們成了“吃瓜群眾“了。

因此,我們正面臨著一個新時代的到來,它不僅僅是AI技術的改進,而且從哲學、從認識論上給我們提出了根本的挑戰,也就是說,機器認知時代到來。這個時代無所不在的傳感器在記錄著所有的物理量——溫度,氣溫,每個人的活動,血液、心臟的跳動……然后將這些數據通過5G網絡傳到云端,機器再把萬世萬物當中隱蔽的相關性找出,并憑借相關性去做事,去改進我們生活或者是破壞我們的生活,去優化生產或者進行互相殘殺。

現在的問題是,我們人類無法理解“暗知識”,而且我們人類越來越渺小,我們人類的知識現在剛剛開始,未來的機器知識會越來越多,我們人類就像最后幾個小島,被暗知識這個海洋所淹沒。那么,我們就面臨一個重大的問題——人類和機器的關系。誰聽誰的?事實上,我們等于在無意中給自己創造了一個上帝,這樣一個時代的到來,會產生什么樣的問題?會怎樣顛覆我們每個行業?會不會突然造成大規模的失業?未來的社會、政治、軍事戰爭會是什么形態?這些都會受到暗知識的影響。

林永青:我還是堅持用“維度”哲學觀,可以很好地解釋各類知識。20世紀初,當思想家們區分“明知識”和“默知識”的時候,其實只用了一個“維度”,即“知識是否可表達”?今天,維嘉學長又提出了“暗知識”的概念,實際上是增加了一個“維度”,即“知識是否可感受”。

因此,我們可以做出結論說,知識的進展,極大概率上是“維度增加的問題。”同時,知識維度的增加,只需要是一個形式“連接”的問題,至于“連接”為何會發生?這也仍是一種至今無法解釋的“量子躍遷”。但我們可以確信的是,維度增加了,知識也就發展了。

{延伸閱讀}金觀濤,“暗知識”:當代理性自負的解毒藥

人工智能革命之基礎——神經元網絡的自我學習及其與環境互動所能達到的極限,都超不過圖靈機的行為組合。從20 世紀下半葉至今,伴隨著人工智能的快速、高度發展,關于它能否在未來某一天具有意識的討論,一直是在電腦和人腦差別的框架中展開的。我認為,只要發展出相應的數學理論,就能了解神經元網絡學習已做出的和可能做的一切。但有一點是毫無疑問的,它不可能具有自我意識、主體性和自主性。

為什么說這本書是解毒藥?因為維嘉在解釋為什么人工智能可以比人更多、更快地掌握知識(能力)時,把人工智能所掌握的信息定義為“暗知識”,從而可以得出清晰的理論表述。我們首先要弄明白什么是知識,知識就是人獲得的信息。而人利用信息(知識)離不開獲得信息和表達信息兩個基本環節,人獲得信息是用感官感知(即經驗的),表達信息是通過符號(語言)和對符號結構之研究(符號可以是非經驗的)。這樣,他根據“可否感知”和“可否表達”,把人可利用的知識分為如下四種基本類型:

第一,可感知亦可表達的知識。它包括迄今為止所有的科學和人文知識。

第二,不可感知但可表達的知識。任何經驗的東西都是可感知的,不可感知的就是非經驗的。有這樣的知識嗎?當然有。以數學為例,抽象代數的定理是正確的知識,但可以和經驗無關。人之所以為人,就在于可以擁有純符號的知織,它是理性的重要基礎。

第三,可感知但不可表達的知識。它包括人的非陳述性記憶和“默會知識”。

第四,不可感知亦不可表達的知識。這就是當前神經元網絡通過學習掌握的知識。維嘉將這類大大超出了個別人所能記憶和學習的知識稱為“暗知識”。“暗知識”的提出,不僅是一項哲學貢獻,也為當前盛行的科學烏托邦提供了一劑解毒藥。

20世紀社會人文研究最重要的成就,就是發現“默會知識”和市場的關系。人類可共享的知識都是可以用符號表達的知識,但它不可能包含每個人都具有的“默會知識”。經濟學家利用“默會知識”的存在,證明了基于理性和科學知識的計劃經濟不可能代替市場機制。一個充分利用人類知識的社會,一定是立足于個人自主、互相交換自己的能力和知識所形成的契約組織。忽視所有個人具有的“默會知識”,把基于理性和可表達的知識設計出的社會制度付諸實踐,會出現與原來意圖相反的后果。哈耶克稱這種對可表達的明知識的迷信為“理性的自負”。

今天隨著大數據的應用,這種理性的自負再一次出現在人工智能領域。而“暗知識”的提出,擴大了不能用符號表達知識的范圍,進一步證明了哈耶克的正確性。所以,我說這本書是對當前理性自負的有效解毒藥。

另一個有意義的問題是“暗知識”會在何種程度上改變現代社會。這種新型知識大規模的運用,將會導致大量擁有專門知識和技能的人失業、一批又一批的行業消失,甚至連醫生專家都可能被取代。姑且不論這種預測是否準確,有一點是肯定的,即人工智能必定會極大地改變我們賴以生存的社會。那么,它會把人類社會帶到哪里去?這正是人工智能革命帶來的普遍焦慮之一。人工智能對城市管理和對每個人私隱的掌握,是否會導致個人自由和隱私的喪失?由大數據和人工智能高科技管理的社會,還是契約社會嗎?

現代社會和傳統社會的本質不同就在于其高度強調個人的主體性和創造性,任何信息的獲得、表達和應用都離不開個人的主體性和創造性。我認為,人工智能可以具有掌握“暗知識”的能力,但它不可能具有自我意識,當然亦無所謂主體性,它只能被人所擁有。因此,一個能允許知識和技術無限制進步的社會,仍然是建立在個人契約之上的。也就是說,無論科學技術發展到什么程度,現代社會的性質不會因之而改變。

然而,我認為,人工智能或許會使現代社會的科層組織的形式發生改變。現代社會除了由法律和契約提供組織框架以外,還必須向所有人提供不同類型的公共事務服務,如治安、交通設施、教育、醫療等。為此就要設立處理不同類型事務的專門機構來管理社會,如軍隊和政府科層組織?茖咏M織之間功能的實現和協調,要利用符號表達的共享知識,因此,隨著現代社會的復雜化,必定出現技術官僚的膨脹。

科層組織的形成和理性化的關系,是韋伯分析現代社會的最重要貢獻。在未來,隨著人工智能對“暗知識”的掌握和運用向社會管理滲透,甚而替代,將會證明韋伯這一重要論斷不再成立。

價值中國:那么,機器是如何發現暗知識的呢?

王維嘉:雖然機器可以學習明知識和默知識,但它最大的本事是學習暗知識。

暗知識就是那些既無法被人類感受又不能表達出來的知識,也就是說人類本身無法理解和掌握這些知識,但機器卻可以。機器有兩種方法可以掌握這些知識:模仿人腦和模仿演化。

聯結學派。聯結學派的基本思路就是模仿人腦神經元的工作原理:人對所有模式的識別和記憶建立在神經元不同的連接組合方式上;蛘哒f一個模式對應著一種神經元的連接組合。聯結學派就是目前最火爆的神經網絡和深度學習,它在五大學派中占絕對統治地位。目前人工智能的高科技公司中絕大部分是以神經網絡為主。

進化學派。是激進主義經驗派、是徹底的不可知論者。進化學派不僅覺得因果關系是先驗模型,甚至覺得類比,神經元連接也都是先入為主的模型。認為不管選擇什么樣的先驗模型,都是在上帝面前耍人類的小聰明,世界太復雜,沒法找到模型。進化學派的基本思路是模仿自然界的演化:隨機的基因變異被環境選擇,適者生存。做法就是把一種算法表達成像基因一樣的字符串,讓不同的算法基因交配,讓生出來的兒女算法去處理問題,比爸媽好的留下來配種繼續生孫子,比爸媽差的就淘汰。

進化算法的問題是“進化”毫無方向感,完全瞎蒙。垃圾郵件過濾器為例,1000比特的字符串的所有可能性是21000,即使目前世界最快的超級計算機,“進化”到地球爆炸都不可能窮盡所有可能,在有限時間內能探索的空間只是所有可能空間的極少部分。地球可是用了40億年時間才進化出了現在所有的生物。

美國華盛頓大學佩德羅·多明戈斯( Pedro Domingos)教授在他的劃時代的著作《終級算法》中,總結的一張五大流派“八卦圖”。

機器學習中的符號學派、貝葉斯學派、類推學派和聯結學派的共同點是根據一些已經發生的事件或結果,建立一個預測模型,反復調整參數使該模型可以擬合已有數據,然后用此模型預測新的事件。不同的是它們各自背后的先驗世界模型。

1) 符號學派相信事物間都有嚴密的因果關系,可以用邏輯推導出來;

2) 貝葉斯學派認為,因發生,果不一定發生,而是以某個概率發生;

3) 類推學派認為,這個世界也許根本沒有原因,我們只能觀測到結果的相似,如果一只鳥走路像鴨子,叫起來像鴨子,那么它就是只鴨子;

4) 聯結學派認為,相似只是相關性能被人理解的那層表皮,隱藏的相關性深邃到無法用語言和邏輯表達;

5) 進化學派認為,什么因果?什么相關?都不存在,我的世界模型就是沒有模型!從零開始,不斷試錯,問題總能解決!

其中,人工智能是最大的一個圓,圓里面分為兩部分:一部分叫人工學習,也就是我們過去講的的專家系統;另一部分叫機器學習,就是機器自己學習。機器學習里面包含神經網絡,在神經網絡里面還要再分,一個是淺度學習,一個是深度學習。在過去芯片集成度低時,我們只能模仿很少的神經元,F在由于集成度在提高,我們可以模仿很多的神經元,當很多神經元被組成多層的網絡時,我們就叫它深度學習。

{延伸解讀}加來道雄,《心靈的未來》

加來道雄,著名日裔美國科學家,1947年出生于美國加州?茖W暢銷書作者,美國著名高等學府加州大學伯克利分校(UC Berkeley)物理學博士、紐約城市大學研究生中心的理論物理學教授 ,超弦理論的專家 。加來道雄的著作都廣受贊譽, 《構想未來》、 《超越愛因斯坦和超空間》、《平行宇宙》,均被《紐約時報》和《華盛頓郵報》提名為當年的最佳科學讀物之一。

加來道雄也認為對于更多知識的理解,主要的工具也就是哲學與科學哲學與神經科學。

哥白尼原理和人擇原理之間的爭論也在神經科學中有所體現。例如,有人認為人類可以還原為原子、分子和神經元, 因此人類在宇宙中并沒有特殊的地位。

生物學家戴維·伊格爾曼博士寫道:“除非我們大腦中所有元件和零件都處在恰好的位置上,否則所有朋友都熟知和喜愛的那個‘你’不可能存在。如果你不相信這一點,那么請到任何一家醫院的神經科去看一看。大腦哪怕只有一小部分受到損傷,都可能令人吃驚地造成我們特定能力的喪失,比如給動物取名的能力、聽音樂的能力、管理風險行為的能力、分辨顏色的能力、做出簡單決策的能力等。”

如果沒有“元件和零件”,大腦似乎無法工作。他最后說:“我們的現實取決于我們有怎樣的生物機體。”

如果我們的身體可以還原為(生物性的)螺母和螺栓,我們在宇宙中所處的地位就顯得更加微不足道。我們只是一種“濕件”,運行著被稱為心靈的軟件,除此之外別無他義。我們的思想、欲望、期待和抱負都能解釋為在前額葉皮層的某個區域中運行的電脈沖。這就是哥白尼原理視角下的人類心靈.

但人類選擇原理也可以應用到人的心靈上,這樣我們就會得到完全相反的結論。這個結論會說,是宇宙的條件使得意識的出現成為可能,雖然從偶然事件中造就心靈是一件十分困難的事。維多利亞時期偉大的生物學家托馬斯·赫胥黎( Thomas Huxley)說:“刺激性的神經組織如何生成一種讓人驚奇的意識狀態,這與阿拉丁摩擦神燈如何能召喚出燈神一樣無法解釋。”

另外,多數天文學家都相信我們有一天會在其他行星上找到生命,但這種生命很可能是微生物形式,這種生命形式統治了我們地球海洋幾十億年: 我們碰到的可能不是巨大的城市和帝國,而是漂浮著微生物的海洋。

這些數字令人驚嘆。遺傳學表明,在7萬年至10萬年前,地球上只有幾百人到幾千個人,是他們孕育了整個人類。(有一種理論認為,大約7萬年前位于印度尼西亞的多巴火山發生大爆發,使得溫度驟降,多數人隨后死去,只留下少數。)由這一小群人繁衍出那些最后占據整個地球的冒險者、探險者。

在地球的歷史中,智慧生命似乎多次走到盡頭,我們能夠存活實在是一個奇跡。我們可以說,雖然其他行星上可能存在生命,但有意識的生命只可能出現在少數幾個星球上。因此,我們應該珍惜地球上出現的意識,它是宇宙中已知的最復雜的形式,很可能也是最稀有的。

在考慮人類未來的命運時,我有時會想到人類自我滅絕的可能性。雖然火山爆發、地震都可能對人類宣判死刑,但我們最大的恐懼卻來自于人造的災難,如核戰爭或生物工程細菌。如果這真的發生,那么也許銀河系中存在的唯一有意識的生命形式會遭到滅絕。我覺得,這不僅會是我們的悲劇,也是整個字宙的悲劇。我們想當然地認為自己擁有意識,我們并不理解生物事件使意識出現所經歷的漫長的曲折的過程。心理學家史蒂文平克寫道:“我認為,意識在每個時刻上的展現都是寶貴而脆弱的恩賜,沒有比意識到這一點更能給生命以意義的了。”

價值中國:我們討論到今天最前沿的技術,就是深度學習,也就是多層的神經網絡。深度學習能力非常強大,但是有局限性嗎?

王維嘉:當然有。神經網絡的一個局限性是,需要依賴特定領域的先驗知識,也就是需要特定場景下的訓練,說白了就是神經網絡只會教什么,學什么,不會舉一反三——(編注:“舉一反三”其實是一個哲學思維或者抽象(升維)思維的問題)。

神經網絡的這個局限性,是因為神經網絡的學習本質上就是對相關性的記憶,也就是說神經網絡將訓練數據中相關性最高的因素作為判斷標準。打比方說,如果一直用各個品種的白色狗來訓練神經網絡,讓它學會“這是狗”的判斷,神經網絡會發現這些狗最大的相關性就是白色,從而得出結論白色=狗。在這種情況下,讓這個神經網絡看見一只白貓,甚至只白兔子,它仍然會判斷為狗。

機器學習的這種呆板行為,用專業術語描述叫“過度擬合”。如果想讓神經網絡變得更聰明,就必須用(不同維度的——編注)各種顏色、各個品種、是否穿衣服等各種場景下的狗來訓練神經網絡,如此它才有可能發現不同的狗之間更多的相關性,從而識別出更多的狗。

人類則不同,一個兩三歲智力發育正常的孩子,在看過兒只狗之后,就能認出這世上幾乎所有的狗了。無須大量標注數據和特殊場景的訓練,只需要少量的數據,人腦就可以自己想清楚這個過程。在這方面,目前的神經網絡和人腦相比,還有巨大的差距。

神經網絡的另一個局限性是無法解釋結果為什么是這樣,因為人類無法理解暗知識,所以更無法解釋。神經網絡這個“滿是旋鈕的黑盒子”,每個旋鈕為什么旋轉到那個位置,而不是多一點或者少一點,都是無法解釋的。這個不可解釋性在許多涉及安全和公共政策的領域都是很大的問題。例如,醫療涉及人的健康和生命,醫生的診斷需要根據極為嚴謹的醫學邏輯,因此醫療對于人工智能的可解釋性要求遠高于其他行業,極少有醫院或醫生敢把無法解釋的診斷結果用在患者身上。然而由于神經網終身不具備醫學邏輯,其輸出的結果也缺乏醫學上的解釋性,因此目前人工智能在醫學上的應用,無論是影像識別還是輔助診斷,都需要專業醫生的復核,距離取代醫生還有較大的距離。

人工智能之所以有上述兩個局限性,主要是因為目前的神經網絡只有相關性的學習能力,沒有因果推理能力,更無法把一步一步推理的過程表現出來。因此,想要克服這兩個局限性,我們需要有因果推理能力的人工智能。要實現這件事情,人工智能需要做的,不僅是識別場景,還需要將識別出來的場景和它具體的功能以及想做的事情結合起來,從而實現合理的邏輯推理。

讓我們看看人腦是如何理解一個場景的。當人進入一個新的房間時,會很自然地對這個房間的大小,里面各個物品的大小位置等有一個大致的認識。之后,人腦會把識別出的場景和物品,與其功能一一匹配,例如,床是用來躺的,而且是一張雙人床可以躺兩個人,椅子是用來坐的,杯子是用來喝水的,等等。

然而更值得注意的是,上述的幾何重建和功能推理,其精度是和具體任務相結合的。例如,人一開始看到杯子,會匹配它喝水的功能,并看到它放在桌子上,判斷距離自己兩三米遠,這個距離判斷是非常不精確的。然而當人真的需要喝水時,喝水成為一個任務,人在走過去拿杯子的過程中,不斷地、更加精確地判斷自己和杯子的距離,直到非常精確地拿到杯子。這個過程就是一個典型任務驅動的場景識別和功能推理。

此外,人類對于功能的推理,并非會拘泥于具體的物體,而是能抽象出這個物體和功能有關的物理特性,從而匹配其功能。

仍然以喝水為例,如果房間里沒有杯子,但是有一個瓢、一個盤子、一根搟面杖,人會很自然地選擇瓢作為喝水的工具(如果連瓢都沒有則可能選擇盤子),因為瓢可以作為容器的物理特點和這件杯子是一致的。而且,選擇了瓢之后,人拿瓢的動作,喝水的動作,都會和拿杯子不一樣,這同樣是由杯子和瓢不同的物理特性出來的決定的。

由此可見,人對于物體的功能推理,是會根據任務的要求,抽象其物理特性,從而推理它的功能并完成任務,因此人工智能的場景識別和功能匹配,是需要基于場景和物體的物理特性來完成的,而不僅僅是識別和標定具體功能。

這種基于任務驅動的因果推理和當前的神經網絡的對比如下。

 

 
機器神經網絡
人類任務驅動
物體識別
識別物體是什么
如果沒訓練過,就無法識別
識別物體的物理屬性
即使沒訓練過,也可以識別
功能匹配
通過標定和訓練匹配功能
如果沒訓練過,就無法匹配
通過物體特性匹配功能
即使沒訓練過,也能匹配功能
驅動本質
數據標定驅動
任務驅動
數據數量
需要大量數據訓練
只需要少量數據
推理能力

資源來源:朱松純,《正本清源》,2016年11月《視覺求索》

價值中國:今天社會的大致共識是,人類已經進入數字時代(或數據時代、或知識時代、或智能時代),但是普通人對于“數據、信息、知識”這些詞匯的理解和使用是極其混亂的。請做一個厘清。

王維嘉:的確如此。我對于這幾個關鍵詞的定義,有我自己的表述。我認為——

信息:可觀察的事物表征。

數據:已描述出來的信息。

知識:數據間的時空關系。

林永青:今天最通行的知識層次模型,大約就是這個DIKW模型了。

DIKW模型

• Wisdom-智慧:知識的嵌入式應用
• Knowledge-知識:有意義的信息
• Information-信息:結構化的數據—比較、推論、過濾
• Data-數據:可計劃的結果和事實。

我的理解是,無論每一種“解釋”所采用的“定義”有何不同,每一個層級與下一個層級之間,并非只是通過做約束條件做了“減法”,而成為簡單的大集合與小集合的包含關系,而是肯定“加進去了另外的東西”,也就是:“信息”未必就比“數據”更少,“知識”也未必就比“信息”更少。因為這里面有人類思維沒有“看到”的更多維度的連接。

再強調一句,不是沒有,而是沒有看到,之所以如此,是因為我們人類最有把握的知識處理工具,不過就是“二維的圖表”。電腦早就可以處理N維的數組(圖表)了,只不過在電腦存儲器中,也只能用二維的方式來保存,人類也因此無法“實時”形成一個形象化的理解。

我因此延伸出另一個“猜想”,所謂“知識”不過就是降維的“映射”(投影)罷了,借用建筑設計圖的類比,三維的“球體”投影成二級的“圓面”,人腦還可以勉強“還原”出高一維的“知識”,或者是四維、五維、或更高維的“知識”,投影成二維——人類是三維生物,能夠瞬間理解的知識,也只有二維——。所以,我的解釋就是,所謂“暗知識”,極大概率就是面對多維事物,“投影”成二維。想想不規則魔方,給我們帶來的巨大的腦力激蕩,那還只是非常低維的玩具。

多維事物在我們的“物質空間”只以“三維”存在,而在我們的“意識空間”中完全是可以N維存在的。比如,我們描述一件衣服。顏色是一個維度,材料是一個維度,款式是一個維度,尺寸是一個維度......什么是“維度”?用哲學術語來講,“不可通約”的“概念范疇”就是維度。通俗地講,“顏色”和“材料”就不可比較。你可以比較“紅色”或“藍色”,但你不會將“紅色”與“棉布”去做比較。理論上講,維度越多,對事物的描述越準確,只要你繼續開動思“維”,可以無限制地描述下去。

多年以前,劍橋大學出版了一本非常重要的知識論著作,《三種文化:21世紀的自然科學、社會科學、和人文學科》。提出了知識類別的三種文化——從今天的人工智能進展來看,這種分類或許過于簡單,但十分必要,包括社會學、人類學、政治學、經濟學和心理學等專業領域,并分章介紹了三種文化中每一種文化的各個假定、詞匯和貢獻,指出每一個共同體所使用的許多概念的意義對它自己的方法來說都是獨特的,因為證據的來源各不相同。本書最后總結了各門科學和學科對我們理解人類知識本質的貢獻。

該書沒有將“人文”稱為“科學”,是非常準確的。我的看法是,社會科學比自然科學有更多維度(或抽象),而人文學科比社會科學又有了更多的維度。還有一點:表格是“二維”的符號表達,這是人類的“明知識”能夠處理的最高“維度”了。 真是非常的局限。

這張表格,我認為非常重要,從9個重要維度,對三種知識文化進行了對照分析。在很大程度下,清晰定義“知識概念”是困難的,但對照解讀,卻可以很容易地提升我們對特定知識概念的理解。

價值中國:我們討論了“暗知識”的哲學和科學上的成因及相關解釋,我們也都認同“暗知識”是機器人工智能的舞臺。那么,人工智能的大發展需要具備哪些條件?

王維嘉:AI發展了60~70年,為什么到今天能夠突破?

這是由于長期積累的三個條件成熟了第一個條件是計算能力。計算能力和半導體的集成度(在單位半導體材料面積上可以集成的晶體管的數量)直接相關。從第一個集成電路晶體管誕生以來,在過去的50年中,半導體的集成度的增加速度基本遵循“摩爾定律”。即:今天普遍流行的說法“計算機運算速度每18個月提升一倍,價格每18個月下降一半”。1970年一個芯片上的晶體管數量約為1000個,今天一個芯片上的晶體管數量達到100億個,不到50年中提高了1000萬倍。相應地,計算能力也提高了1000萬倍。

目前雖然單個芯片的晶體管數量增加速度放緩,但人們開始把成百上千個芯片封裝在一起以便提高總的計算速度。

計算能力對人工智能的巨大推動還體現在一個標志性事件上—GPU(圖形處理器)被用于訓練AI算法。2009年,斯坦福大學計算機系教授吳恩達和他的博士生拉加特·藍恩納(RatRaina)第一次提出由于神經網絡中大量計算可以并行,用一個GPU可以比雙核CPU快70倍,原來需要幾周完成的計算一天就可以完成。之后紐約大學、多倫多大學及瑞士人工智能實驗室紛紛在GPU上加速其深度神經網絡。贏得2012年 ImageNet竟賽的 Alex Net同樣用的是GPU。此后,GPU在神經網絡的訓練和識別中樹立了公認的王者地位。再后來 AlphaGo發威戰勝人類頂級圍棋手,背后則是谷歌自行研發的專為深度學習使用的TPU發揮了重要支撐,每個TPU可以提供10倍于GPU的計算能力。

第二個條件是數據。如果說算法是火箭發動機,那么數據就是燃料。由于互聯網的發展和各類傳感器(例如在各種環境中的溫度、位置、壓力等物理化學變量的測量,社會中大量攝像頭的存在)成本的大幅下降和廣泛安裝,根據IDC(互聯網數據中心)的監測統計,2011年全球數據總量已經達到1.8ZB(1ZB=1萬億GB),相當于18億個1TB的移動硬盤,而這個數值還在以每兩年翻一番的速度增長,預計到2020年全球將總共擁有35ZB的數據量,增長近20倍.

這比從人類出現到計算機出現前產生的所有數據都多。以目前的傳感器技術發展速度,若干年后回頭看今天的數據量,不僅量小而且數據采集的密度和廣度都遠遠不夠。

第三個條件就是那批甘愿坐“冷板凳”的科學家經過了幾十年的積累,終于從2006年開始在算法上有了重大突破。當時在多倫多大學任教的辛頓教授在美國《科學》雜志和相關的期刊上發表了論文,證明了深度神經網絡的能力和實用性。從此,基于多層神經網絡的深度學習理論成為本輪人工智能發展的重要推動力,相當于過去飛機從達·芬奇設計的扇翅膀的飛行器變成有螺旋槳的發動機,人工智能的概念和應用開始一路攀升,語音識別、機器視覺技術在幾年間便超過了人類的水平。

正是算力、數據、算法這三個要素同步成熟,形成合力,終于帶來了今天AI的爆發。這三個要素中最重要的是計算能力的發展和算法的互相促進。

價值中國:前面討論的是,AI產業大發展的前提條件。請您在產業端,談談基本的評斷。

王維嘉:我們認為AI產業的各部分呈現出金字塔結構——

AI產業生態的金字塔結構

金字塔的下層對上層有依賴性,但反之不成立。也就是說上層是驅動力,是自變量,下層是驅動結果,是因變量。金字塔的寬度大致對應市場規模和公司的數量。所以越上層對整個行業的影響越大但市場規模越小,越下層市場規模越大但影響越小。

產業的皇冠:算法。我們前面說過,AI近年的突破性發展的三個驅動因素之一是神經網絡算法的突破。其實這是三個因素中最重要的因素,因為其他兩個因素(計算能力和數據量)屬于對整個數字經濟發展的“搭便車”行為,暫不討論。目前研究算法主要集中在美國的一流大學和幾家超級互聯網公司(谷歌、 Facebook、亞馬遜、微軟、IBM、百度等)。

大學的算法研究大部分都是學術性和公開的,而大公司的算法研究最核心的只留給自己用。專門研究算法的私人企業屈指可數,一家著名的算法公司就是被谷歌收購的大勝圍棋世界冠軍的 DeepMind。另一家是由硅谷老將,曾經做出世界上第一臺掌上電腦 PalmPilot的杰夫·霍金斯( Jeff Hawkins)創辦的 Numenta(公司名來自拉丁文 mentis,意為“心靈”)。 Numenta是一個由私人資助的研究所,他們過去十幾年專注于發展一種叫作層級時序記憶( HierarchicalTemporal Memory,HTM)的算法。這種算法受大腦新皮質中錐體細胞的啟發,網絡結構遠比各種神經網絡復雜。這種算法的一個特點是可以連續學習。

神經網絡都有一個缺陷,在模型訓練完畢后,如果有新數據可以用,就必須把新數據和原來的老數據合并在一起重新訓練模型。而HTM的連續學習沒有這個缺陷,當新數據來了以后,只要繼續把新數據喂給模型即可。HTM的第二個優勢在于可以將物理世界的基本常識融入模型。 

Numenta并不尋求直接提供商業解決方案,而是僅僅提供算法的許可,讓合作伙伴用自己的算法來解決商業問題。 Numenta還提供了開源的平臺,讓更多的開發者在這個平臺上完善HTM算法。從 Numenta出來創業的威德羅教授的博士生迪利普·喬治( Dileep George)基于HTM創辦了一家做機械手通用軟件的公司 Vicarious。相對于應用企業,算法的公司少得可憐,原因主要是缺乏商業模式。

價值中國:我們都了解人工智能與互聯網密切相關,多數人都可以認可。但二者最重大的區別是什么?在產業運用上又有哪些各自的特征?

王維嘉:這次AI創新浪潮堪比互聯網浪潮,但是AI浪潮和互聯網浪潮有三個重大區別——

第一個區別是AI從一開始就要顛覆傳統行業。互聯網1994年起步時從經濟的邊緣開始,和傳統產業似乎一點關系都沒有,沒有人懂一個網站能干什么;ヂ摼W20多年來逐步從邊緣蠶食中心,直至今日影響每個行業。但即使是今天,互聯網對制造業、農業、建筑業、交通運輸等搬運原子的行業的影響也局限在媒體和營銷方面,還沒有進入制造業的核心。而AI的特點是從第一天起就從傳統產業中心爆炸,自動駕駛對汽車行業的顛覆就是一個典型的例子。

第二個區別是技術驅動。互聯網除了搜索以外基本沒有太多技術,主要是應用和商業模式;ヂ摼W創業者完全可以是不懂技術的人。目前為止AI創業者以技術大拿居多。當然隨著AI技術(和更多中間工具)的普及,許多有商業頭腦的人只要看明白A1在一個行業的價值也可以拉起一家公司,但目前最稀缺的是A的高級技術人才。

第三個區別是可能不會出現平臺性公司或贏家“通吃”的局面。互聯網的一個特點是連接供需雙方,一旦用戶超過一個門限,后來者就很難趕上,所以很容易形成贏家“通吃”的局面。但在AI產業里目前還沒有看到這樣的機會----(編注:通用型AI的可能性,目前看來還十分遙遠),不論是自動駕駛還是人臉識別都是一個一個山頭去攻,無法在短期內形成壟斷。造成融資泡沫的一個重要原因就是有些投資人還以為A和互聯網贏家“通吃”:只要投中第一名,多貴都值。

簡單用一句話說就是互聯網是toC(對用戶)的生意,是toB(對企業)的生意。AI中toC的生意,多數都會被現有互聯巨頭吸納,創業者的機會在于toB。

林永青:就這一問題,我想做一個重要的補充。我認為互聯網上的智能,其實主要或者完全還是“人腦智能”。比如,你進行網上購物。其實是購物者的大腦在進行訂單操作的。和傳統購物的區別只是在于,傳統上訂單是由商家的業務員在處理訂單,而網購是由用戶在自行處理訂單。但智能的來源,都是人腦。

而人工智能完全不同,AI幾乎就是機器智能。除于在訓練機器的階段,有人工參與、人腦參與,之后就都是機器在自我學習、自我理解、和自我決策。

這里可以衍生出一個重要的相關問題。就是“知識”和“智能”的關系問題。“現代管理學之父”彼得-德魯克,也是“知識工作者”、“知識社會”等重要“知識概念”的提出者。他有一名名言:“你無法想像知識,知識只存在于兩個耳朵之間”。他想表達的是,知識是極端個人化的產物,知識的傳播、理解、存儲的巨大困難,圖書館里大量藏書,如果你沒有去閱讀及理解,并不能認為你掌握了“知識”。

而“智能”主要是機器的舞臺。而且,機器智能是從數字化了的數據、信息、知識中間產生出來的。因此,機器智能的傳播是非常便捷、高效的——幾乎是以光速在機器間傳播。

有一件非常有趣味的軼事。NOVA SPIVACK是德魯克先生的長孫。德魯克在研究“知識”,而NOVA在研究“智能”。NOVA在2007年提出了一個網絡1.0~網絡4.0的互聯網發展代際路線圖,成為業界公認的一個指標。

NOVA也在多年前開始了所謂“全球腦”的研究,他認為,未來所有的人腦和機器腦,都可以無限制地連接成一個“全球腦”,而且,因為智能網絡效應,“全球腦”將以不可估量的方式,超越不連接的全部單體人腦。

他認為,知識(knowledge)與智能(intelligence)是兩種不同的事物。知識是數據,智能是程序。 過去我們傳播的只是知識,比如書本; 而智能只存在人的頭腦中。下一步就是智能的傳播。語義網絡中智能應用的出現,通過外化軟件或人類大腦以實現智能的傳播。我們已經創造了專家系統、智能協作軟件,軟件可以學習、理解、發展,可以隨時移動,可以被復制。  下一步我們關于智能要做的事,正如過去對知識做的事情一樣。如果這個得以實現,智能將存在于網絡,獨立于人類。

我們從中看到,經歷了祖孫三代人的時間,人類“從知識走向了智能”。前者的行為主體是“人”,而后者的行為主體卻是“機器”。

我完全贊同NOVA的預測,如果說,在以往,人類賴于生存最重要的社會行為來自于發現、創造、及運用知識,那么,在未來,人類最重要的價值性工作就是學會如何運用“機器智能”,以及學會如何與機器相處。

{延伸解讀}【結語】《生命3.0:人類在智能后時代的劫后余生》

《生命3.0》的作者、MIT物理學終身教授MAX TEGMARK認為,

關于智能爆炸。“如果有一天我們造出了人類水平的通用人工智能,就可能會觸發一場智能爆炸,將人類遠遠甩在后面。需要引起警戒的是,如果這場智能爆炸是由一些人類控制的,那他們可能會在幾年時間內控制整個世界。如果人美沒能掌控這場智能爆炸那么,人工智能可能會以更快的速度控制世界。

關于權力結構。“快速的智能爆炸可能會導致單極化的超級力量的出現:一個延續幾年或者幾十年的慢智能爆炸更有可能促成多極化的情形,許多相當獨立的實體在其中達成一種力量的平衡。

生命的歷史說明,它總會自我組織成更復雜的層級結構,這種層級結構是由合作競爭和控制共同塑造的,超級智能或許會促成更大宇宙尺度上的合作,但是它終會導致極權主義和由上自下的控制,還是會賦子個體更多權力,目前尚不清楚。”

關于人機融合。“賽博格(cyberg-人機一體的新物種-編注)和上傳者是可能的,但或許并不是實現機器智能的最快途徑。目前人工智能研究競賽的高潮要么是人類歷史上最好的事情,要么是最壞的事情.可能的后果形形色色,多種多樣,我們今天還無法預料。我們需要努力思考,我們希望看到什么樣的結果,以及如何才能達成這個目標,因為如果我們不去思考自己想要什么,很可能無法得償所愿。

 

「圖書介紹」《暗知識:機器認知將如何顛覆商業和社會》

自序

一直以來人類的知識可以分為兩類 :“明知識”和“默知識” (Tacit Knowldge,又稱默會知識)。明知識就是那些可以用文字或公式清晰描述和表達出來的知識。默會知識則是個人在感覺上能把握但無法清晰描述和表達的知識,也即我們常說的“只可意會,不可言傳”的那類知識。人類發明文字以來,積累的知識主要是明知識, 因為只有明知識才可以記錄和傳播。直到大約 70 年前,人類才意識到默知識的存在。今天,人工智能,特別是其中的一個重要流派—— 神經網絡,突然發現了海量的、人類既無法感受又無法描述和表達的“暗知識”——隱藏在海量數據中的相關性,或者萬事萬物間的隱蔽關系。這些暗知識可以讓我們突然掌握不可思議的“魔力”,能夠做很多過去無法想象的事情。本書就是要清楚闡述機器學習發掘出了什么樣的暗知識,為什么機器能夠發現這些暗知識,以及這些暗知識對我們每個人會有什么影響。

本書分為三個部分。

第一部分(第一、二、三章)。第一章里我們發現AlphaGo(阿爾法圍棋)給我們帶來的最大震撼是人類完全無法理解機器關于下棋的知識。這個發現迫使我們重新審視人類對于“知識”的所有觀念。這一章回顧了 2500 年來人類所熟悉的明知識和直至大約 70年前才注意到的默知識。近幾十年的腦神經科學的研究成果讓我們對知識的本質有了更清楚的認識。也回答了為什么人類既無法感受, 也無法理解機器發現的那些暗知識。這一章還分析了明知識、默知識和暗知識之間的區別,討論了為什么暗知識的總量將遠遠超過人類能掌握的所有知識。

第二章介紹了機器是怎樣學習的,能學習哪些知識。同時介紹了機器學習的五大流派以及各流派從數據中挖掘知識的方法。

第三章則重點介紹了目前機器學習中最火的神經網絡,包括神經網絡的基本工作原理和目前在商業上應用最廣的幾種形態,以及各自適用的領域。有了這些基礎就可以判斷AI(人工智能)在各個行業的商業機會和風險。也只有理解了這些原理,才能真正理解暗知識的特點。為易于閱讀和照顧不同讀者的需求,在這一章中我們盡量用通俗的語言解釋這些工作原理,而把精確的技術原理介紹放在附錄里。

第二部分(第四、五章)討論了 AI 對商業的影響。我們將看到機器發掘出來的暗知識對我們生活的直接影響。對于想把握 AI 商業趨勢的讀者來說,這部分的內容至關重要。其中,第四章描述了當前的 AI 產業生態,第五章詳盡探討了哪些行業將面臨 AI 的顛覆, 以及在不同行業的投資機會和陷阱。

第三部分(第六、七章)的內容是AI對未來和社會的影響。第六章重點討論目前還沒有商業化的,但可能更深刻影響我們的一些神奇的AI 應用。第七章討論了機器和人的關系 : 機器能在多大程度上取代人的工作,會造成哪些社會問題(例如大面積失業)。這兩章的主要目的是開腦洞,探討那些我們今天可能還看不到的更深遠的影響。也試圖回答人類的終極恐懼:機器人最終會控制人類嗎?

本書的各個章節前后連貫,但也可以跳著讀,對于那些只對商業感興趣的讀者,可以跳過第二、三章直接讀第四、五章。

筆者在美國斯坦福大學讀博士期間做過人工智能研究,后來在硅谷和中國創辦高科技公司,目前在硅谷專注于投資人工智能。每年訪問調研上千家硅谷和中國的科技公司,接觸頂級大學最前沿的研究,這些都有助于筆者從大量的實踐中提煉出自己對行業的原創的分析和洞見,而不是人云亦云。

筆者長期對人類如何獲得知識感興趣。在投資、研究和寫作 AI 的過程中,發現了暗知識這樣一個人類以往未曾發現的領域。這個概念的提出一定會引起爭議,筆者歡迎讀者的批評并期待在批評和討論中進一步深化在這方面的認識。

本書的目標讀者是企業和政府工作人員及其他知識階層,包括學生。暗知識對人類的影響剛剛開始。從暗知識這個新視角出發, 可以更深刻地理解這次 AI 巨浪。這波巨浪可能超過互聯網,許多行業都會深受影響。本書希望能回答“AI 對我的行業和職業會有什么影響”。只有把 AI 的技術、趨勢和應用深入淺出地講清楚,讀者才可能舉一反三,理解 AI 對自己的影響。本書從筆者自己的投資實踐出發,希望能為在 AI 時代進行投資提供一些參考。在 AI 颶風里泥沙俱下,魚龍混雜,會有大量的炒作,讀完本書可以幫助讀者辨別真偽,不會被輕易忽悠。在今后 5~10 年,不論是風險投資 / 私募股權投資還是在公開股票市場投資都需要有這樣的辨別能力。本書最后在討論人工智能對整個社會的影響時也提出了一些未經檢驗的建議。

每當讀到市面上科技類的書籍時,常被那些含混不清的描述所困擾。當年在斯坦福大學上課時留下的最深印象就是那些學科的開山鼻祖對自己學科理解之深入。他們能用最簡單的方式把最深奧的道理講明白。讓聽課的學生一下子就能理解一門學科的核心概念, 而且一輩子不會忘記。從那以后,筆者就堅信如果學生沒聽懂, 一定是老師沒講明白。這本書希望用最通俗易懂的語言介紹暗知識和 AI。任何具有高中以上學歷的讀者如果有沒讀懂的地方,一定是因為筆者沒有寫明白。

今天每個人都要面對海量的信息和知識。如何讓讀者花最少的時間獲取最大量的信息和知識成為一個挑戰。筆者最欣賞的文章和書籍是那些沒有一句多余的話的。這也是筆者寫作本書的目標之一。 本書希望能夠做到讀者在機場書店買了這本書后能在下飛機前讀完, 而且讀完之后可以清晰地判斷這場技術大浪對自己的影響。

王維嘉 2019 年 1 月 13 日于硅谷

王維嘉
簡介

中國科技大學學士和碩士,美國斯坦福大學博士。曾在斯坦福大學師從人工智能鼻祖之一、美國國家工程院院士伯納德·威德羅教授。在硅谷學習、工作、創業、投資超過30年,擁有十幾項美國基礎專利,開發了世界上第一臺手持互聯網終端,是全球移動互聯網的布道者和踐行者。目前在硅谷專注投資人工智能,每年調研全球上千家高科技創業公司,訪問世界頂級大學和研究所。曾受邀在中央電視臺、鳳凰衛視、中國證監會、深圳市政府等就人工智能進行演講,反響強烈 。

他是硅谷風險投資公司 CEG Ventures 的創始合伙人,也是中國企業家論壇(亞布力)創始終身理事、中國企業研究所創始理事長、歐美同學會2005委員會共同創始人和第三屆理事長、中國企業家環保協會(阿拉善)創始終身會員,以及數字中國共同創始人常務理事。
京ICP證041343號 京ICP備12005815號-2 京公網安備11010502030378號
Copyright 2004-2019 版權所有 價值中國網
澳洲快乐十分开奖记录