【中文輸入法漫談】何謂智慧型輸入法?
2007/12/14 5:30 pm 鄭安巽

解釋智慧型輸入法以前,要先從人工智慧談起。人工智慧,既然是人工,當然不是真的。智慧,則是對事情的理解、分析、推理、決策等過程。

首先說理解,當我們聽到一句話時,聽得懂與聽不懂的差別在哪裡?「聽」指的是對聲音的反應。你可以跟別人交談,是因為你聽懂對方的話。聽懂,包含「音」與「字」,然後是「意」,最後是邏輯。

一段聲音被解析為「字」的過程很重要,否則你無法進行下一階段「意」的解析。假如你不懂英語,不可能把一段英語的聲音解析為字。即使懂中文,也可能無法正確解析。

例如,一句話聽起來是這樣:ㄊㄨˊ ㄕㄨ ㄍㄨㄢˇ ㄌ一ˇ

那你會認為是「圖書館裡」還是「圖書管理」?

電腦人工智慧的「交談」,至少包含:語音辨識、語意分析、邏輯分析、資料庫查詢、語句合成、語音形成等部分。資料庫查詢,現在有 google ,很多人都知道查詢(或搜尋)的意思,但很少人知道,人工智慧一直應用在查詢當中,而且因為電腦速度變快、效率也持續提升當中。

當你輸入一個辭彙時,搜尋引擎可能找到幾千萬、或幾萬個網站包含你的辭彙,如果全部送給你,就變成垃圾。你有沒有覺得, google 找到的資料真的是你要的?

人工智慧最簡單的方法就是「統計」,根據統計結果的優勢排列順序。 google 可以根據網站互連的情況、文章內文的辭頻、操作者的反應等方法,累積某個辭在某個網站內的重要性,根據相關資訊,推測哪個網站才是用戶想要到的。

語音辨識,就是把聲波變成音標(拼音或注音)的過程。雖然已經把聲波變成音標,後續要把音標變成文字,又是一大關鍵。例如,何時該把「ㄔㄥˊ ㄕˋ」變成「程式」?或變成「城市」?有些開發語音辨識的廠商,宣稱辨識率可以達到多少百分比,如果拿四書五經來唸給它辨識會如何?也就是說,語音辨識的正確率,不只是把聲波變成正確的音標而已,還要變成正確的字辭才有意義。

一般的語音辨識,都是以「同音辭」作為音字轉換的查詢辭庫。只要有個一般性的辭庫,對於普通的音辭轉換就足夠。所以看到別人在展示語音辨識時,會覺得正確率很高,但自己用時則不然。因為每個人都有自己的用辭習慣。

注音輸入法(或拼音),因為簡單、易學、易用,因此使用人數眾多。但也因為同音字,造成輸入的時候必須選字。一般來說,注音輸入平均每字 3.1 個按鍵再加選字一鍵。拼音輸入法平均 4.1 鍵外加選字一鍵。使用同音辭自動選字,可以每字減少一個按鍵,大約可以提升 30% 的效率。但同音辭自動選錯字時,可能會讓人抓狂,因此很多人不喜歡。

智慧型輸入法,指的就是同音辭的自動判斷。在網路上收集辭庫很容易,但根據辭頻,並無法真正推測操作者的需要。因為辭頻是眾人的累計,個人完全不是那麼一回事。個人除了有用辭習慣、還有專業領域、輸入時期等因素會影響到同音辭的判斷。因此,一個拼音注音型的輸入法,不可能單憑一個很大的辭庫就搞定一切。為了提高同音辭的正確率,互動學習是智慧型輸入法的關鍵。

雖然有些人不喜歡智慧型輸入法,但智慧型輸入法卻是最符合人類需要的輸入法,只是因為困難度太高,沒有達到操作者的預期而已。因為人類思考模式,都是以母語的音來思考。因此,在輸入的時候,每個字都要選一次,其實打斷思考,這對於創作文章的人來說,是很不利的。

如果要比較輸入的效率,編碼型輸入法 (如倉頡...) 才能達到更高的效率。但這完全不合乎人類大腦的運作邏輯。使用編碼型輸入的人,會耗掉更大的大腦能量。有些人覺得大腦越用越聰明,因此不會在意。但大腦的活動區塊本來就有分工的能力,當同時活動的區塊越多,耗氧量越大。大腦的活動基本分為輸入與輸出兩個關鍵。輸入是指學習,輸出是指應用。輸入的學習越多,人越聰明;輸出又分為思考與反射動作兩項,思考也可以提升學習能力,因此創作有利人類學習;但反射動作越多,只是負擔越大而已,不會越聰明。尤其是沒有思考的反射動作,徒增耗氧量,造成疲勞。

醫學研究指出,人腦雖然只有拳頭大小,卻消耗掉百分之二十以上的能量。因此,使用輸入法的習慣,跟年齡也有很大的關係。年輕人喜歡編碼型的輸入法,年紀越大越喜歡注音及拼音。因為年輕人代謝率高,不怕疲勞。

很少人真正看到人工智慧的產品。智慧型輸入法,也只是類似應用的一個產品,距離人工智慧還很遠。我個人對於人工智慧很有興趣,很喜歡觀察辭庫的變化。自己在輸入時,有時候會看到令人意外的錯誤、有時候看到令人莞爾的辭句,很像小孩學說話。在開發與使用過程,可以觸發很多思考,尤其是關於人類的「理解」方法,頗令人著迷。






本系列【中文輸入法漫談】取材自「奇易輸入法」發明人鄭安巽先生的「Smart Inside」網站。有興趣的朋友可以經過搜尋的方式,找到全部相關文章。