设为首页加入收藏
全站搜索
新闻详情
 
当前位置
頂級語音識別專家Daniel Povey:新一代Kaldi可大幅降低收聽語音
作者:admin    发布于:2024-06-15 06:05    浏览次数:
  

  中路梆子重升音重降音中芒筒尊龙凯时人生就是搏平台中软诗言志重升记号钟琴仲鲁中國網科技8月31日訊 小米集團語音首席科學家、“Kaldi之父”Daniel Povey(丹尼爾波維)今日接受媒體採訪時稱,新一代Kaldi目標不僅僅是趕上或者稍微領先這些語音識別庫,而是要根本地改變語音識別的實現方式。

  Daniel Povey對中國網科技透露,目前小米AIoT産品中還用的是第一代Kaldi,接下來小米將逐步把新一代Kaldi能力融入到小米産品中,預計在今年年底或明年初,開始將新一代Kaldi能力應用於小米産品,但現在仍在測試之中。

  談及為何選擇在小米開發新一代Kaldi,Daniel Povey對記者直言:“事實上有很多大型網際網路公司都想把我招致麾下,但小米是一家公司戰略規劃相對穩定的公司,加上表現出對開源項目的承諾與重視,因此在我需要做開源項目這一硬性標準看來,小米是最佳去處。”

  據悉,現有端到端語音識別模型的流行和準確率的逐步提升,以及PyTorch、TensorFlow等深度學習工具包的普及,是開發新一代Kaldi主要動力。相較初代而言,新一代Kaldi是一個全新代碼庫,需要完全重新打造,由C++以及CUDA完成,並可以在Python調用。新一代Kaldi由3個獨立的項目組成,分別稱為 k2、Lhotse和Icefall。

  其中,最新演算法Icefall是這次新一代Kaldi重要部分,基於實現“雙向建模”和多層模型的優勢,擁有新一代Kaldi能力的AIoT産品可以大大提高語音識別能力尊龙凯时人生就是搏平台,從而降低收到語音指令的詞錯誤率。小米集團方面稱,目前已經在LibriSpeech數據集上取得了2.57%的詞錯誤率,而且還在持續的進一步優化。

  Daniel Povey表示:“新一代Kaldi與PyTorch相容,並且代碼更容易修改,比初代Kaldi代碼庫更靈活得多,允許用戶更輕鬆地嘗試新想法。並且止于目前,依託于Kaldi而發展起來的很多中小型企業有很多尊龙凯时人生就是搏平台,Kaldi將一直堅持做項目開源。”

  公開資訊顯示,Daniel Povey是語音識別開源工具Kaldi的主要開發者和維護者,因此被稱為“Kaldi之父”。而Kaldi工具簡而言之的講,目前國內三大語音助手小愛同學、小度、天貓精靈使用的底層框架都是Kaldi,Kaldi等於是能讓智慧物聯通過語音交互方式呈現的基礎,是目前被業界公認的語音識別框架基石。

  1.凡本網站註明“來源:中國網科技”的所有作品,均為本網合法擁有版權或有權使用的作品。

  2.未經本網授權不得轉載、摘編或利用其他方式使用上述作品。已經本網授權使用作品的,應在授權範圍內使用,並註明“來源及作者”。違反上述聲明者,本網將追究其相關法律責任尊龙凯时人生就是搏平台。

  中國網是國務院新聞辦公室領導,中國外文出版發行事業局管理的國家重點新聞網站。本網通過10個語種11個文版,24小時對外發佈資訊,是中國進行國際傳播、資訊交流的重要窗口。

  凡本網站註明“來源:中國網科技”的所有作品,均為本網合法擁有版權或有權使用的作品,未經本網授權不得轉載、摘編或利用其他方式使用上述作品。

  版權所有 中國網際網路新聞中心 電話: 86-10-88828000網際網路新聞資訊服務許可證號

  關於我們 法律顧問:北京岳成律師事務所外宣服務與廣告服務 違法和不良資訊舉報電話舉報流程

脚注信息
Copyright 2017 尊龙人生就是拼搏 All Rights Reserved