您的目前位置:中文輸入法世界手寫及語音

中文語音識別系統--你說話電腦聽

李 祥

夢寐以求的我們說話電腦聽,如今由中文語音識別系統開始實現。在八月初的台北98電腦應用展,筆者見到“資策會”的一位主管收集購買了一堆新產品,最齊全的是各式「語音識別系統」:IBM「ViaVoice」、蒙恬「聽寫王」、聲碩「說亦通」(他自家產品「超級耳朵」當然沒有買)。目前的香港流行的語音識別系統是蒙恬「聽寫王」普通話(國語)版本,見【圖一】,適合會講較為標準普通話的朋友!


按此放大

▽與眾不同的「聽寫王」
蒙恬「聽寫王」率先結合中文語音辨識和手寫輸入,融合語音巨集及語音聲控命令等功能,成了可聽可寫的中文輸入法。其安裝很容易,如【圖二】,只是耳機麥克風及手寫筆必須一同安裝,令用戶沒有更多的選擇,不過說寫並用不因為單一操作而產生疲勞。打破傳統非連續語音輸入的技術障礙,可以最自然的說話方式連續語音輸,詞與詞之間不必刻意停頓,每分鐘可輸入100個字左右。突破詞彙語音輸入的瓶頸,不再侷限以詞彙為單位的辨認,可一次辨認整句或整段文章。系統內建詞彙已收錄常用詞彙四萬詞,可正確判斷辨識一般性文件聽寫輸入,筆者感覺讀出“香港大公報”較讀出“大公”,電腦更容易正確辨識出來。


按此放大

▽提昇「聽寫王」辨識效果
雖然,各個語音識別系統宣稱:不需費時進行個別的口音訓練,任何使用者均可立即上手並享有極高的語音辨識率。請你不必過於自信,鐵面無私的語音識別系統是不懂“給面”的,
初次使用一般給你五、六成的辨識率,就應該心滿意足了!個人化口音調適是十分必要的,透過聽寫王學習你個人的口音和腔調,才能提昇聽寫辨識效果。「口音適應」分三個階段:基本訓練--50條;中級訓練--204條;完整訓練--254條。經過一個多小時的“魔唸”254條,如【圖三】,終於唸成屬於自己的聽寫王。


按此放大

更為實用的是,「聽寫王」允許使用者個人自建詞彙,隨時擴增新詞彙立即有效,最多至65000個詞。請注意在不斷使用聽寫王的過程中,聽寫王會不斷地分析使用者的語音,並且更新個人的語言模型資料庫,能使聽寫辨識率越來越高,如【圖四】。


按此放大

▽「聽寫王」系統需求
蒙恬開出的系統需求是最低需求:Pentium 133或以上32MB以上記憶體,75MB以上磁碟空間,另加60MB用於口音適應,16位元音效卡,Windows95/98中文版。筆者建議使用Pentium200以上更高階的個人電腦,記憶體用64MB以上更好!不過,在Pentium90,32MB記憶體的筆者私家寫稿電腦上試過竟然同樣OK,僅僅在於句子讀出後,文字在螢光幕上顯示出來的速度慢一些,但並不影響聽寫辨識率!對「聽寫王」有興趣的朋友,可瀏覽香港代理商『電子恆昌』的
網站:http://www.longrand.com.hk

每當筆者寫完一個專題,心中就會充實一些,是次感受更深,因為收集資料、進行專訪、試用軟件……引發了製作「中文輸入法世界」專案網站的衝動。“不解決中文輸入用中文電腦就是一句空話”,不久的將來,本港成千的教師上萬的學生都會面對這一問題,中國人用電腦竟然敲不出中國字會是大笑話啊!

此文原載香港『大公報』電腦資訊版之「中文電腦」專欄(1998.9),特此感謝香港『大公報』!『大公報』電腦資訊版逢星期五刊出。


返回上頁