非科幻思考(第2/17頁)

什麽?這是什麽算法,有這樣的魔力?

“阿爾法狗”究竟是如何做到自我學習的呢?

實際上機器學習並不是非常新的概念,從幾十年前,人類就試圖讓機器自己學習事情,但受限於算法和當時的計算速度,機器學習的步子一直都不快。

“阿爾法狗”的算法叫“深度學習”,它的前身是“神經網絡學習”,也是幾十年前就誕生的算法,當時流行過一段時間,後來被一篇著名的論文打消了熱度,再加之學習效果不算好,於是遭受冷遇幾十年。在與“阿爾法狗”的創始人相遇之前,“神經網絡”並不是眾望所歸。

“神經網絡”是什麽算法?“深度學習”又是怎樣將其點石成金的?

“神經網絡”是一種“民主投票”算法,效仿大腦的神經網絡建成。大腦的神經網絡是這樣工作的:一個神經細胞接收很多個神經細胞的信號輸入,一個刺激信號相當於贊成票,一個抑制信號相當於反對票,如果某個細胞收到的贊成票和反對票合起來大於某一個門檻,就算是通過了,會有一個信號發出去到下一個神經細胞。一路贊成的刺激信號就這樣一程程傳遞下去。神經網絡算法是數字版腦神經網,用數字連接形成網,而其中的投票機制和大腦相似。它可以讓信號在整個學習網絡裏傳播,比單路信號分析復雜很多,也智能很多。

“深度學習”是什麽呢?“深度學習”是“深度多層神經網絡學習”的簡稱。深度是指層次多,一層套一層的神經網絡,構成整個算法的深度。層與層之間的關系,大致是這樣:每層神經網絡分析的精細程度不同,底層分析細節,上層做出判斷。將一個整體任務分解成無數細節,給一個輸入,底層神經網絡會分析基礎細節,然後將分析結果傳給上一層網絡,上一層網絡綜合之後再將結果傳給更上一層的網絡,而頂層網絡綜合層層傳來的結果,做出判斷。例如,想讀出一個字,底層網絡會判斷字裏有沒有橫豎撇捺,上一層網絡會判斷字裏有沒有直角,再上一層網絡判斷是不是由左右兩部分拼成一個字,諸如此類,最上層的網絡根據層層結果認出這個字。這種多層判別本身是效仿真實人類的大腦,人類大腦就是由一層層神經網絡組成,每一層網絡識別信號,再將處理結果傳遞到上一層。人類皮層大腦的神經網絡層次大約有六層。“深度學習”網絡可以有上百層。

換句話說,“深度學習”就是把從前的“神經網絡”重疊了多層。

就是這樣嗎?僅僅把“神經網絡”疊了多層,就從受人冷遇的小人物變成了江湖明星?故事有這麽雞湯嗎?

當然不是這麽簡單。“深度學習”這次能煥發生機,也是生逢其時,有兩陣不可忽略的東風送其上青雲。

一陣東風是算力增強。計算機芯片的速度呈指數級增長,價格一路下跌,由遊戲應用發展壯大的GPU(圖形處理器)大大補充了從前CPU(中央處理器)引擎的計算能力,讓人工智能計算更強大。“阿爾法狗”戰勝李世石的時候啟用了1920個CPU和280個GPU陣列運算,一秒就能自我對弈數百盤。

另一陣東風是大數據。事實上,這可能是這一輪人工智能熱潮最重要的推動因素。人們赫然發現,原來不是算法的問題,而是以前用來訓練的數據還遠遠不夠多。這就好比讓徒弟自學武功,卻不給他足夠多的對戰機會。有了大數據,算法呈現的結果出現了驚人的進步,讓人目瞪口呆。

於是,在算力和大數據的輔佐之下,升了級的“深度學習”算法如虎添翼,能夠從海量數據中找到高超的戰術規律,以人類無法看懂的方式戰勝人類。

就是大數據輔助的“深度學習”,成為這一輪人工智能熱的關鍵。

人們把很多很多大數據扔給機器,用多層神經網絡進行“深度學習”,結果發現,機器在很多領域能力有了突飛猛進的提高。圖像識別的正確率趕上了正常人,語音識別也過關了,把科學文獻作為數據,短時間就能學習幾十萬份最新文獻。金融、電力、能源、零售、法律,“深度學習”都能從大數據中學到優化的行為做法。人工智能的應用,能讓這些領域變得高效、便捷、自動化。除了“深度學習”,也還有其他算法,包括後面要提到的決策樹、貝葉斯等算法,各種算法的綜合使用效果是最佳的。各種算法共同構成機器學習大家庭。

除了深度學習,“阿爾法狗”另一重武器叫作“強化學習”。“強化學習”是什麽呢?簡單點說,就是“無序嘗試,定向鼓勵”,就好比小朋友在屋裏隨機行動,走到數學教具旁邊父母就說“好棒好棒”,後來小朋友就特別喜歡走到數學教具旁邊(當然,這純屬假想的場景)。這種思維一點都不奇怪,在心理學中很早就已經應用到教學中,對大多數教學場景都有效果,尤其對一些發展遲緩的孩子做教學幹預(但也有心理問題)。