電腦音譯的那天離我們更近了
剛剛看到《經濟學人》的一篇報導,Conquering Babel,有關於電腦音譯(直接將口語轉譯成另一種語言並”講”出來)的現況。隨著科技的日新月異,電腦音譯的時代已經離我們不遠了,不再是科幻電影裡面的噱頭。
記得當時在研究這類辨識的時候,錄製下來的語音,要先經過裁剪(Crop)、正規化(Normalize)、特徵值擷取(Eigenvalue)、數位化(Digitize)等步驟以後,才變成電腦能夠分析的資料。往往一個步驟,就得耗費很多計算時間,根本不可能做到即時翻譯。隨著DSP硬體的進步,我想這些處理,以現在的硬體來說,可以在很短的時間做完。再加上演算法的進步(文中提到微軟的Deep-Neural-Network),簡直不可同日而語。 Read More