10 月 21 日,阿里完成全球首個多語言實時翻譯的電商直播,通過 AI 實現環境降噪,解決口音不標準及口語化語言風格等問題,可實時將中文直播內容精準翻譯成英語、俄語、西班牙語等語言,該技術將大規模應用于 2020 年 雙 11 活動。
IT之家了解到,為解決機器聽不清、聽不懂的問題,阿里在業界通用方案的基礎上自研了更智能的語音模型,可在嘈雜的環境中 “聽清”直播內容;同時,在 AI 翻譯任務過程中創新性集成了視覺信息的識別結果,可將口語化句子改寫成正式表達句子;此外,達摩院將多領域的知識融入翻譯模型,能舉一反三,無需重新訓練便能快速學習不同場景里不斷更迭的專業名詞。
阿里表示,阿里 AI 翻譯技術歷經多次迭代升級,目前可提供 214 種語言的高質量翻譯,一天可翻譯 3000 億個詞語。同時,該技術也逐步應用于阿里巴巴內部及外部企業客戶,日均調用量超過 13 億次。
關鍵詞: