262 比谷歌酷多了

“你可以想象一下,每一個軟件,其實就可以被看成是一整段語言,所有的語句,最後翻譯成01的時候,其實對電腦來說,就是一個特別長的單詞。”

喬伊雙手盡力拉伸:“在語言學上,語言的基本組成部分其實不是字,字是語言的硬件基礎,每一種語言的字,其實都是使用者為了方便而設定的。”

“英文的字母,其實就是簡單的約定符號,中國的漢字,最早是從模擬某種特定的事物而來,以象形為基礎。語言的基礎是詞——詞代表了一個確切的含義。”

“比如中文裏的春天,和英文的spring——在春天這個概念上,它們可以被認為是大概相等的,但兩者並不能完全取代。因為春天只是兩者在語言學上的交集,除了交集含義之外,兩個詞都還分別各自有其他的意思。

“在英文裏,spring還代表著泉水,以及彈簧,這兩個概念都是在中文裏沒有的。同樣,中文的春天,還可以指代某種好的情境,單獨來說,某人的春天到了,還有性暗示的味道——但這種用法在英文裏也是不存在的。”

“這種一個詞代表著多重含義的現象,我們這裏被稱之為語言學上的復雜程度。沒有具體的指標,是一個感性的標尺。”

“這樣說吧,還是spring,在英文裏,他的復雜程度就比中文稍微高一些,但大致都是差不多。”

“兩者都是常用詞匯,復雜程度本身,代表著語言使用過程中的演繹和文明本身的復雜程度——如果回到石器時代,也許古代的字母文字中,可能存在類似spring的詞,也許字的符號完全不一樣,但它表示的意思,肯定跟中文的春天,英文的spring是大概相等的。”

“但,即使存在這樣一個詞,我們也完全可以斷定這個詞的復雜程度不會高於現在的spring和春天,為什麽,因為詞的更多含義,並不是語言創立之初被賦予的,而是在漫長的使用過程中自己演化出來的。”

“一個連鐵器都不存在的文明,肯定不會有彈簧的概念——自然也就不需要相應的詞。同樣,在一個性道德還沒有出現的社會裏,性暗示這種高級幽默也不可能有存在的基礎。”

這個叫喬伊的人說話,就跟他抽煙一樣,完全就是一口氣說下來,中間幾乎不存在多少停頓。雖然他的中文不算正宗,中間說著說著還會夾帶出幾個單詞,但大概的意思是明確的。看得出來他的心情有些激動——不知道是熬了一個通宵之後的慣性,還是被話題本身所激發出來的熱情。

這段話的信息量很大,但對陳舍來說其實並不難接受。

因為項目對語言學的關注很早就開始了,其中的一些觀點,做功課的時候,陳舍已經有所涉獵。雖然沒有去做專門的深入了解,但是聽懂這些話本身確實問題不大。喬伊說的這些,只是在前面的基礎上更加深入——倒不是說他們公司在學術上搞出了什麽更深的成果,只是在應用上,用到了更為專業的語言學知識而已。

“更高復雜程度的語言通常也體現在文學上,從某種程度上來說,文學家對語言的開創性應用本身,就是賦予了同一個詞匯更多的含義,或者在詞匯之間產生更多的映射,甚至根據自己的表達需要,創造出全新的詞匯。”

“比如說超人的英文superman吧,這個概念最早是哲學家尼采提出來的,在德語中是指代未來的某種理想型卓越人士。在由蕭伯納翻譯成英文之後,創造出了一個新單詞superman。”

“superman一個簡單的詞,就可以用來指代尼采原著中,那種復雜的描述,這種創造性本身,可以看做是對信息的提煉和加工。在漢語中,這樣的現象更加多見,漢語中的成語,可以說是創造性詞匯中,最有代表的一個系列,簡單的四個字,往往代表著很復雜的一大段概念的集合。

“但是機器語言……不,我應該換一種說法,程序語言。如果我用這種對語言的復雜度標準,應用在大多數程序語言上的話,那這些程序語言的得分,將會是一個無限接近於0的值。”

“之前我已經說過了,程序是一種最精確的語言——你可以想象一個,一個俄羅斯方塊的遊戲語言,整個程序就好像是一個單詞,這個單詞肯定是有意義的,假如我們把組合成這段程序的01展示給外星人看,把程序附帶的運行環境也給他們看,如果程序能被運行——那外星人肯定就能看到一個確切的含義。”

“在這個具體的含義中,是一個不斷出現不同形狀的幾何圖形出現,又消滅的意向——但組合成這個程序的那些單獨程序語句本身是沒有意義的,因為就像我們在討論刻舟求劍時,不會去討論船的速度,劍的重量這些因素一樣……”