非科幻思考(第5/17頁)

這種綜合能力讓我們能跨領域認知。我們可以把喝酒、下圍棋、鉆井和看病的信息放在頭腦中的同一個世界,但是對於AI來說,這些專業知識就是四個不相關的領域,要四個AI來分別處理。人的綜合認知能力,使知識連成一體,但人工智能目前只能是專業化人工智能,一旦下圍棋的人工智能學習了金融知識,就把圍棋知識完全忘記了,等它再學習鉆井知識,又把金融知識忘記了,這被稱為“遺忘災難”。專業人工智能的知識至少在目前,還無法相互連接構成“世界模型”。於是人類仍然有它們不具備的視野和大局觀。

我們的人腦如何具有這樣的綜合能力和對世界的建構,仍然是一個謎。

第二個難點,理解他人的能力。

即便人工智能未來能夠把各個學科的相關知識都學習到,建構起“世界知識體系”,但在理解情境相關的問題時,仍面臨如何調用正確信息的問題。當一個人對另一個人生氣,應該從他們環境和背景的海量信息中調用哪些知識,來理解他生氣的理由?

對人而言,這不成問題,我們能非常容易猜測到,對生氣的兩個人而言,什麽是重要的因素,什麽是有可能導致他們憤怒的導火索。這主要是源於我們對人的理解,對我們自己和周圍人的理解,我們知道什麽樣的信息會引人興奮,什麽樣的信息會讓人沮喪。讀心的能力讓我們輕易做出推斷。

至少目前人工智能還不具備這樣的能力。且不說理解復雜的場景,僅僅就“樹上蹲著五只鳥,開槍打下來一只,還剩幾只”這樣的問題,它們也還回答不上來。它們無法推斷,鳥兒因為害怕,就會逃走。

正如著名心理學家、語言學家史蒂芬·平克所說:“如果不是建立在一個龐大的關於外部世界以及他人意圖的內隱知識結構的基礎之上,語言本身並不起作用。”缺乏對於他人心理的常識系統,使得人工智能仍然難以“理解”人類日常的語言。

未來人工智能有可能學會讀懂人類的情感和意圖嗎?

很多人都提到,目前人工智能已經可以精細識別人類的表情,能夠讀懂人的情緒。是的,人類的情緒屬於一種外顯圖像,是比較容易識別的,這和識別東北虎、識別癌細胞類似,是圖像識別的一個範疇。但這和理解人的情感完全是兩回事。即便它們未來能從圖像上識別出一個人此時的情緒,想要“解釋”此人的情緒,也需要遠為復雜的對人心的理解。

也有很多人提到,人工智能可以通過與人對話理解人的情感。但這實際上也離得很遠。目前它們能做的只是智能對應,當聽到人類說出句子A,在語料庫中尋求識別匹配最合適的行為或回應。當你說“我不開心”,它們可以匹配說“多喝點熱水”,但不理解什麽是開心。如果想讓它們分析不開心的理由,推測不開心之後的做法,就遠遠不夠了。其中的差別可以形容為:人工智能使用語言,是匹配句子和句子。而人類使用語言,是匹配句子和真實內心的感覺。

那如何讓人工智能學會讀懂人類的情感和意圖呢?

一種可能的路徑是讓它學習足夠大的數據庫,記錄下人的足夠多情感和行為的數據庫。“深度學習”的一個特點在於必須要足夠大的數據庫,擁有一億數據的“深度學習”比只有一百萬數據的學習效果好得多。任何一個領域想要有所突破,首先都需要足夠大的數據庫。因此有人認為,21世紀最寶貴的資源不是石油,而是數據。

那我們有可能建立如此大的人類情感和行為數據庫嗎?理論上當然是有可能的,靠各種攝像頭視頻和人類自己拍攝上傳的視頻。但這裏面最大的問題,或者說我個人的疑問在於,人工智能對於人類的情感和行為,能否進行“非監督學習”。

所謂監督學習,就是每一個數據由程序員做一個標注:“這個數據是好的。”“這個數據是貓。”“這個數據是男人因為嫉妒而毆打老婆。”不管數據本身是數字、棋譜、語言、圖像還是視頻,都需要程序員先給數據做標注,才能讓人工智能學會這些標注。但是對於人類的情感與行為的超級數據庫一一識別和標注,實在是太過於煩瑣困難的工作。而非監督學習就是完全沒有人進行標注,只把原始數據丟給人工智能,看看它能學到什麽規律。我相信非監督數據在很多工程領域可以自動進行,因為步驟和成敗的結果是自然可觀測的。但是在人類情感與行為領域,如果不以人的解釋做標注,如果沒有人來詮釋情境中發生了什麽故事,機器能夠學習和領會嗎?我覺得很難。

另一種可能性,就是每個人和自己的人工智能助理之間的數據學習。由一個人不斷告知人工智能所有情感和行為的前因後果:他碰到我,所以我不高興;他沒有記得給我買東西,所以我不高興;餐廳的燈光太昏暗,所以我不高興。若所有人都將前因後果事無巨細地解釋給人工智能聽,就像父母將這個世界的機理解釋給孩子,那麽它肯定可以全都記住。如果足夠詳細,那它至少能學會這一個人的情感行為特征和心理因果特征。這相當於是每個人自己給行為數據做標記。這種路徑在未來有可能成功,但取決於每個人是否願意詳細教它。