【2015年5月25日】隨著智能手機的快速普及,語音識別輸入作為一種便捷易行的文字輸入方式,一直是學術界和產(chǎn)業(yè)界關注的熱點。作為擁有三十余年研發(fā)經(jīng)驗的行業(yè)先行者,東芝公司在語音識別領域一直進行著卓有成效的理論研究和產(chǎn)品開發(fā),對中文語音識別系統(tǒng)的創(chuàng)新不斷取得實質性突破。近期,東芝公司設在中國的研究開發(fā)中心傳來最新消息:通過利用深度學習算法對模型進行最優(yōu)化,東芝將為中文連續(xù)語音識別帶來更具應用價值的解決方案。
東芝語音識別技術支持不同層次的系統(tǒng)要求,高魯棒性嵌入式語音識別引擎和針對不同口音的技術優(yōu)化使其可用于各類電子設備。在現(xiàn)有高效語音識別系統(tǒng)的基礎上,為進一步提升中文連續(xù)語音識別準確率,東芝語音研發(fā)團隊利用鑒別性基頻特征和帶調聲學建模,圓滿解決了中文所特有的同音異調詞語辨別的技術難題。同時,新系統(tǒng)增加了對英文縮略語的識別功能,在中英文互譯應用中更加得心應手。
面對中文語音識別實用化的兩大難點——新詞識別和口語識別,技術人員引入全新的詞捕捉算法和深度學習算法,大幅提升了識別準確率。據(jù)東芝語音研發(fā)團隊負責人丁沛博士透露,新系統(tǒng)可將中文新詞的識別率提高至98%以上,而對朗讀語音和會議口語的識別率分別超過了95%和92%,在各類場景下都能實現(xiàn)高精度識別,為高質量的人機交互打下基礎。
始于上世紀70年代的東芝語音識別技術現(xiàn)已形成以東京-劍橋-北京為中心的全球研發(fā)體系,開發(fā)出包括中、日、英、法、德等十四種以上的語言識別系統(tǒng)。目前,東芝在中文語音的識別、合成和自然語言處理技術的研發(fā)上成果卓著,廣泛應用于PC、車載、移動通信、互聯(lián)網(wǎng)等領域,并在多項國際評比中展現(xiàn)出行業(yè)領導力。東芝(中國)研究開發(fā)中心作為東芝全球四大研發(fā)基地之一,近年來在人機交互、軟件開發(fā)和高校合作方面都取得了積極進展,不斷將全球最尖端的技術方案引入中國,強化東芝各業(yè)務領域的市場競爭力。
此次對于中文語音識別系統(tǒng)的技術升級,顯示了東芝(中國)研究開發(fā)中心在該領域的持續(xù)專注和領先實力,是對中文語音識別應用的又一次技術突破。據(jù)悉,此次創(chuàng)新將加速東芝語音技術在中國的產(chǎn)品化和市場推廣,將更具實用價值的語音系統(tǒng)帶給中國用戶。