每天都在汆肉中醒来青梅,好男人www在线观看,少妇无码自慰毛片久久久久久,国产欧美另类久久久精品丝瓜

登錄注冊
新聞 資訊 金融 知識 財經 理財 科技 金融 經濟 產品 系統 連接 科技 聚焦
首頁 > 新聞 > 通信/傳統IT > > 正文

微軟語音發布升級版HiFiNet聲碼器:韻律更自然、高保真效果更完美

2021-06-25 14:58:15來源:IT之家

6 月 24 日消息微軟日前發布新一代深度神經網絡 HiFiNet 聲碼器,與微軟上一代語音技術相比,由 HiFiNet 聲碼器合成的神經網絡版聲音質量再創新高,主要體現在發音更準確、韻律更自然、高保真效果更完美,更受客戶青睞。自推出以來,被廣泛應用到有聲讀物、在線教育、車載語音助手等領域。

IT之家獲悉,HiFiNet 是微軟神經網絡版語音合成技術中最新的聲音編碼器,是決定音頻質量的關鍵因素。根據專業評估語音自然度的 MOS 測試結果顯示,由 HiFiNet 聲碼器合成的語音音質可與用于訓練的真人錄音樣本相媲美,并同時改善毛刺、噪音等音頻質量問題,輸出的音質具備更高保真度,更大程度還原真人錄音。

語音質量的優劣會直接影響收聽者的感受,為提升用戶收聽的舒適度,在 Azure 語音合成系統中,神經網絡聲學模型基于深度學習網絡,使用真人錄音作為原始數據進行迭代訓練。首先,提取真人錄音的聲學特征。然后,利用真人錄音的聲學特征自動生成兩組音頻:一組真實聲波(原始錄音)和一組偽波(合成聲波)。最后,由鑒別器區分真實聲波和偽波。隨著訓練次數的增多,聲波生成器也會愈發“聰明”,直至生成鑒別器也無法區分的偽波,這意味著機器合成的聲音已經和原始錄音相差無幾,從而給用戶帶來更貼近自然的體驗。

由微軟 HiFiNet 聲碼器合成的音頻質量更接近真人原始錄音。

采樣率越高,聲音還原越真實。Azure 神經網絡版語音合成聲學模型默認每秒鐘采樣 24,000 次 (24 千赫茲),為還原特殊場景中更為復雜、細微的聲音內容,HiFiNet 聲碼器每秒鐘采樣 48,000 次(48 千赫茲),滿足用戶對語音質量的嚴格要求,讓用戶盡享高清語音體驗。

除語音質量外,HiFiNet 合成速度較之其他模型也有顯著的提升,進一步提升了語音合成的實時率。據 RTF(Real Time Factor,實時率,用來測量語音合成速度的工具)測試結果顯示,HiFiNet 在 GPU 設備上運行的速度是第一代高性能聲碼器的 3 倍,在 CPU 設備上運行的速度是第一代高性能聲碼器的 2 倍。

目前,內置 HiFiNet 聲碼器的 Azure 認知服務神經網絡版語音合成服務已支持超過 70 多個國家和地區的語言,提供超過 170 個自然逼真的音色供開發者選擇。

關鍵詞: 微軟 語音

熱點
39熱文一周熱點
主站蜘蛛池模板: 黄梅县| 西充县| 嫩江县| 平利县| 延安市| 湖北省| 新兴县| 七台河市| 得荣县| 普陀区| 茂名市| 莱西市| 柳林县| 保康县| 横山县| 诸暨市| 正镶白旗| 安新县| 连云港市| 望城县| 社旗县| 福贡县| 曲松县| 凤冈县| 思南县| 宜城市| 开化县| 任丘市| 巴里| 丹巴县| 南充市| 商河县| 左权县| 外汇| 台北县| 南江县| 莱西市| 红桥区| 米易县| 丽水市| 板桥市|