第17章 人工智能(第5/8頁)

Hal絕不是一個譯者,但我完全相信它有翻譯的能力。手機上的谷歌翻譯可以或多或少地完成信息分析的工作。我對著手機說:“最近的超市在哪兒?”手機屏幕上準確地出現了這句話,或者手機會大聲復述我的問題。這一切都讓我清楚地知道,我會得到我想要的答案。也許這句話並不算日常用語,可是手機知道我想問什麽。對話肯定更加復雜,在對話的背景下,谷歌翻譯就不那麽可信了。在聯合國大會上,現在還不能只靠機器翻譯推進多方會談。

包括加拿大發明家亞歷山大·格雷厄姆·貝爾在內的很多人都嘗試過用機械的方法分解語音(當然,羅傑·培根的銅人頭像之類的東西應該不僅能分解語音,還能理解語義),計算機的出現讓這一切成為現實。1952年,貝爾實驗室制造出第一台語音識別器。好消息是,這台識別器的準確率可以達到97%;壞消息是,這台機器只能識別數字。這個問題在日常生活中的電話自動答復系統中也頗為常見,並廣受詬病。

20世紀90年代末期,語音識別專家雷·庫茲韋爾論述了Hal的能力,並稱有望在2001年前在個人電腦上實現語音操作功能。但是,這樣的語音操作系統並沒有得到普及。庫茲韋爾的計劃比他預想的慢得多,甚至可能永遠不會實現。雖然蘋果台式機上自帶的語音操作系統很好用,但我卻不經常使用。很多用蘋果電腦的人甚至不知道自己的電腦裏有語音操作系統。

這是因為語音識別的先驅者過於關注分解語音,而忽略了這項技術也要有些實際的用途。我們當然可以問電腦,“我明天的時間安排是什麽”,但如果你的身體沒有不便,打字肯定比對著電腦說話更簡單。對於我們中的大多數人來說,電腦的語音操作功能不是一個自然的過程,因為電腦不像人類的秘書那樣靈活機動、隨機應變,我們也不會自然地說出完整、縝密的可行性命令。

如果軟件不僅可以把聲音轉換成文字,還可以有效理解文意,情況就不一樣了。理解文意從技術上來說非常難。Hal聽到聲音後,可以解析其中的含義,並做出相應的回復或者執行指令。現在常見的車載語音系統則常常會錯意,因此成為喜劇裏常見的笑料。在沒有幹擾的情況下對著電話的麥克風清楚地提出問題是一回事,邊開車邊在嘈雜的環境中對著車載語音系統說出指令又是另外一回事。在通常的對話環境中,中途打斷最簡單的語句也可能會造成誤解。

一個能真正理解語句的計算機必定有很多用處。在20世紀80年代,由百事公司前總裁約翰·斯卡利領導的蘋果公司常被批評,直到史蒂夫·喬布斯回歸掌舵,蘋果公司才重拾創造力。但是,在斯卡利仍在位的1987年,蘋果公司在某段視頻短片中提出了“知識領航員”的模糊概念。“知識領航員”是一個個人電子助理,但是和Siri不同,“知識領航員”可以理解復雜的命令,比如“讓我看看上學期的筆記”,或者搜索某篇論文,甚至是某個朋友剛發表的一篇相關文章。短片中展現的一些其他功能,比如復述行程安排,確實有些過時了,但是“知識領航員”展示出了解析語義並據此行動的能力。

Hal比“知識領航員”的行動力更強。Hal在日常交談中和真正的人類無異。在日常交談中,語境遠比遣詞造句重要。在過去的幾十年中,讓計算機語音系統十分困惑的句子是“Fruit flies like an apple”。對這句話進行語音識別並不難,我是用蘋果電腦自帶的語音系統錄入這句話的。但這句話到底是什麽意思呢?不考慮語境將很難說清楚。你可以理解為“果蠅喜歡蘋果”,也可以理解為“水果能像蘋果一樣飛”。

這種特殊的句子不會經常出現在對話中,然而毋庸置疑,讓計算機僅通過對話去理解人們想表達的意思有一定困難。計算機科學家艾倫·圖靈提出了判斷機器是否具有智能的測試方法。機器和測試者分處兩個房間,測試者通過提出問題來判斷位於另一個房間裏的是人還是機器。(圖靈最早提出的測試方法更加復雜,以上是簡化的做法。)在之後的幾十年裏,計算機科學家嘗試挑戰所謂的“圖靈測試”,計算機通過圖靈測試的報道屢見不鮮。事實上,計算機從未通過圖靈測試,這可能還需要10—20年的時間才能實現。

雖然電影中的Hal肯定可以通過圖靈測試(但電影中少言寡語的宇航員戴夫是否可以通過圖靈測試就不好說了),但是現有的圖靈測試的結構決定了它的可信度並不高。現有的圖靈測試並不能檢測圖靈當年提出的計算機類似人類的交流能力。圖靈測試的常用流程是,機器和測試者完成一段5分鐘的談話,如果機器在超過30%的時間裏被錯認為人類,就意味著機器“通過”了圖靈測試。因此,許多軟件並不是為了實現和人類的交流而設計的,它們只是為了通過測試。