人工智能時代應如何學習(第4/9頁)

到目前為止,計算機“深度學習”仍然需要海量數據,人工智能對每一件事的學習都要有足夠多的數據支持。因而很多人說“未來最寶貴的資源將是數據”,如果得不到足夠的數據,人工智能就很難發展。對於一些有海量現存數據的領域,這是自然而然的事情,例如金融、醫療,但是人類社會生活還是有諸多領域缺乏足夠多的數據記錄,人工智能一時就很難習得。對人情世故的理解也往往受限於數據。人類擁有“從經歷中學習”的能力。當一件事發生,作為單一的事件數據,人類就能學習到很多規律。在事件學習方面,人類不僅不需要很大的樣本數據,就可以“吃一塹長一智”,甚至是可以超額學習,也就是“舉一反三”。

每個孩子都是“一葉知秋”學習者,小時候,我們都能觀察到他們胡亂總結生活規律。一兩歲的小孩就可以總結“這樣扔東西奶奶會笑”的規律。這樣的壞處當然是“以偏概全”,但實際上,我們需要珍惜他們的這種特性。因為這正是他們在用強大的“模式提取”思考方式進行小數據學習,試圖從生活小數據中提取寶貴的知識。

我們應該鼓勵孩子們的思索,“以偏概全”也可以轉化為優點。若想避免“以偏概全”,可以讓他們看到更多、經歷更多、體驗更多,但是思考和總結的能力是千金不換的。

聯想學習vs.邏輯學習

孩子的思考總是充滿聯想跳躍。我們通常認為走神是缺點,但其實也是優點。人工智能學習一個領域的知識,會局限在這個領域內,按照這個領域內的數據,尋找相關聯系,尋找因素之間的相互影響。如果存在邏輯規則,人工智能學習毫無難處。人工智能在一個領域內得到的知識很難聯想或類比到其他領域,因為它們並不具備多個領域的知識記憶。

人類的語言裏充滿類比和聯想。當我們說起時代變化,我們說“風起雲湧”的時代,表明時代的劇烈變化;當我們說起事態嚴重,我們說“山雨欲來”,暗示即將有大變化。天氣和我們討論的政治經濟趨勢毫無關系,但是所有的這些比喻之所以能成立,是因為人能注意到事物背後相似的部分,這些相似性也很抽象,如風雲的變幻感和趨勢感,這種相似性人工智能難以想到或理解。

類比並不僅僅是文學修辭,它是我們的思維方式,在知識領域同樣有用。我們從前經常批判“廉價的類比”,感覺類比並不是真知,只是人們大腦胡亂的關聯。但實際上,我們的知識發展很大程度上是靠類比和聯想。邏輯演繹能保證我們在一個領域內推導出真知,但是根據哥德爾不完備定理,一個領域內總有一些基礎公理是不能自我推導的。這就是說,每個領域至少有一些基本假設,要“無中生有”,而“無中生有”的來源,往往是從原有的領域類比而來。

有價值的類比實際上是發覺深層的結構,外在的信息無關,不意味著深層的機理無關。愛因斯坦的廣義相對論,由自由落地的電梯類比而來,把整個地球類比於電梯,得到了令人瞠目結舌的對宇宙的新知。電梯和宇宙結構之間的關系,就是用跨領域聯想找到深層原理。愛因斯坦有著非同尋常的視覺敏感度,聯想能力與此密切相關。

我們跟小孩對話的時候,幾乎很難將話題保持在同一脈絡上。小孩子總是說到一半,就想起其他相關事物,然後話題就漫無邊際地拓展下去。在孩子小的時候,我們會發現他們很難集中注意力在同一件事情上,思維常常飛跑,這讓我們試圖給他們傳授單一知識的時候感覺非常困難。但實際上,孩子的這種天馬行空的自由聯想是極為寶貴的思想資源。發散的思維不受限制,注意到事物與事物之間的關聯。3—7歲是大腦突觸連接最快速增加的時段,到了小學之後,大腦突觸連接數量逐漸減少,聯想和跳躍的思維也減少,可以更有邏輯地思考,集中精力,但是終其一生,在邏輯思考和跳躍思考之間找到平衡,往往是最有成果的。

習慣化學習vs.重復學習

小孩子總是三分鐘熱度,一件事情喜歡上兩天就不喜歡了。要是人工智能,我們可以讓它念唐詩念上一年也不厭倦,但小孩子能堅持三五天就很了不起了。

我們都知道這是人工智能的優勢,那我們又為什麽說“厭倦”是孩子的優勢呢?

實際上,厭倦來自一種心理學特征:習慣化。習慣化是指:大腦對於新奇的刺激有本能的興奮,人的注意力喜歡追隨新奇刺激,一旦一個新鮮信息變得習慣了,大腦就感到厭倦,不再加以注意。嬰兒身上就展現出這種特征,心理學家給三四個月大的嬰兒看屏幕上的畫,如果是他覺得奇特的,他就目不轉睛盯著看,如果是已經看得習慣的畫,他就不怎麽看了。科學家就是用這種方式測定嬰兒的本能知識。