4月23日消息,Google人工智能研究團隊的高級產品經理Sagar Savla向包括環球科技在內的媒體介紹了一款基于Android系統的應用程序—— Live Transcribe,即通過將自動字幕技術融入日常會話,從而減少現實世界中的對話障礙。
據Sagar Salva介紹稱,Live Transcribe是其團隊的最新工作成果,它是一款運用自動語音識別技術將現實世界中的實時對話轉錄為手機屏幕上可閱讀的文本的安卓應用程序。Live Transcribe能實現實時的連續轉錄,支持70多種語言,還可以進行快速切換的雙語模式。
據世界衛生組織統計,目前全球有4.66億人患耳聾或聽力障礙,到2050年,這個數字預計將增加到9億人。
值得一提的是,以往耳聾和聽障人士多依賴于人工轉錄服務,這些服務的費用十分昂貴,并且需要提前很久預約,因此難以在日常對話中頻繁使用。Live Transcribe能夠讓人們只需使用手機的麥克風便可隨時隨地進行語音轉錄。
Sagar對記者表示:“該應用的自動語音識別系統分為三個部分。第一個部分是聲學模型,主要辨別單詞中的不同音節;第二個部分是發音模型,將辨別出來的不同音節組成實際的單詞;第三部分是語言模型,會根據識別出來的單詞增加適當的標點符號停頓。”
據了解,為了使Live Transcribe盡可能直觀,在模式上有幾種可考慮的模式:計算機、平板電腦、智能手機乃至小型投影儀,最后決定專注于智能手機模式。
對此,Sagar解釋道,“我們也曾考慮可穿戴設備,但這種設備造價相對較高,普及率也遠不及手機。因此,我們最終還是選擇了手機為主要平臺,旨在幫助更多聽覺有障礙的人群。”【環球網科技 記者 林迪】
關鍵詞: