第17章 人工智能(第4/8頁)

修士培根了解了英國被侵略數次的歷史後,開始思考如何能保衛英國在未來不受侵略,並讓自己因此永垂青史。在搜集和閱讀了大量資料後,他認為保家衛國的最好辦法就是制造會說話的銅人頭像,保護英格蘭的城墻。

在真實世界中實現類似的想法需要一些時間。想起來容易,但是做起來就難多了。有歷史記載的最早的會說話的機器出現於1779年。一個名叫克拉施泰因的人制造了一台復雜的機器,向這台機器中吹入空氣,經過類似於人類喉嚨的機械結構,它就會發出類似元音的聲音。12年後,設計制造土耳其行棋傀儡的沃爾夫岡·馮·肯佩倫設計出會說話的樂器。這個樂器也是利用了共振結構,可以通過手動操作讓其發出元音或者輔音。這和網絡視頻中主人用手扒著“會說話”的狗的下巴,讓狗發出“sausages”(香腸)的聲音沒有太大差異,肯佩倫的機器也能清晰地“說”出單詞。

在整個19世紀和20世紀初期,改進版本的聲音生成器不斷推陳出新。最成功的例子是貝爾實驗室於20世紀20年代推出的聲碼器。聲碼器可以用來給信息加密,或者把普通的語音壓縮為特定頻寬的格式。但是聲碼器的設計過於復雜,並沒有得到實際的應用。

計算機除了發出聲音以外還有其他潛力。在信息技術的歷史上,讓計算機發出聲音是非常原始的想法。計算機科學家艾倫·圖靈在曼徹斯特大學的計算機上首次用程序生成音樂。那台計算機連接著一個擴音器,當計算機出錯的時候,一聲警報會隨之響起。圖靈意識到,他可以對這個功能進行編程,讓它產生微弱的嘀嘀聲。如果一秒鐘內的播放頻率可以達到1 000次,嘀嘀聲的不同頻率就會產生不同的音調。雖然這項技術常被誤認為是貝爾實驗室於1957年發明的,但是第一段由計算機生成的音樂的確是出現於1950年曼徹斯特大學的“自動計算機”(ACE)上,由圖靈手動編程實現的(圖靈只是想用不同的音調表達不同的反饋信息)。

雖然在拍攝《2001太空漫遊》電影的時候,已經有很多關於語音系統的理論,但卻沒有太多關於如何生成合成語音的研究。20世紀70年代以後,計算機越來越便宜,計算機語音系統的商業潛力也隨之越來越大。從20世紀70年代英國物理學家斯蒂芬·霍金使用的聲音生成系統到當代更加先進的語音系統,電子發聲技術與時俱進。但要想讓計算機像Hal一樣與人交談(電影中的Hal畢竟是由真人配音),我們還有很長的路要走。

語音合成技術固然重要,但讓計算機按照聲音指令做出反應在技術上更困難。我們已經實現了一些技術突破。畢竟,手機上安裝的導航系統清晰易懂,語音助手Siri也能按照我們的語音命令做事。但是,手機並沒有Hal那麽復雜的結構,也沒有Hal儲存和處理大數據的能力。

仔細想想,Siri的交流能力其實非常有限,雖然Siri的設計者設計了一些有趣的問答。當我對著手機說“把艙門打開,Hal”(電影中,說這句話的宇航員戴夫·鮑曼直面Hal,穿著太空服但是沒戴頭盔)時,Siri的回答呼應了電影的場景:“沒戴頭盔的話,我開門你會……喘不上氣的。”當我讓Siri像影片結尾的Hal那樣唱“黛西,黛西”時,Siri說:“你不會喜歡的。”

制定時間表、在網上查信息、導航、放音樂,諸如此類的功能讓Siri更像一個電子秘書。Siri並不能真正和人對話,它不理解詞語背後的真正含義,也不理解音調不同會產生不同的意思。雖然Siri的語音識別能力很強,但有時候它也會遇到困難。Siri不能很好地識別不標準的口音,現在的語音識別系統都不太能有效地識別英國格拉斯哥或者美國緬因等地區的口音。語音識別系統還必須有能力處理我們在平常說話時下意識使用的俚語和連音。

這並不是說,機器不可能理解人類的語言。下面這句話是我利用蘋果電腦的內置語音系統錄入的:“the factors as you can see it can slip up(就像你看到的這些因素,語音識別系統並不總是有效)。”但我實際上說的是:“But the fact is, as you can see, it can slip up(事實上,就像你看到的,語音識別系統並不總是有效)。”類似於“但是”一類的轉折詞會把一句話一分為二,然而,“fact is”(事實上)和“factors”(因素)在英式英語中的發音非常相似。現今的計算機語音識別系統可以達到99%的準確率,盡管如此,相較於人類,計算機在語音識別方面還是很容易出錯。優化語音識別的方式之一是,讓軟件識別某個人的發音技巧。

計算機面對的一個問題是,無法理解上下文。我們在聽某個人說話的時候,會習慣性地把某個詞語放在整個對話的背景中去思考它的意思。有些同音字必須得借助上下文才能準確理解意思。這一點在跨語言互譯方面尤其重要。如果我對著計算機閱讀文字,那麽我一眼看過去就能發現同音字錯誤;但如果我只是在聽自動翻譯機器的翻譯,那麽我不可能知道哪兒出錯了。科幻作品中常常出現這樣的翻譯機器,比如《神秘博士》中由塔迪斯發明的宇宙通用的心電轉換器。翻譯必將成為計算機語言能力的重要方面。