您當前位置>首頁 > 數(shù)字人大 > 數(shù)字會議工作
您當前位置>首頁 > 數(shù)字人大 > 數(shù)字會議工作
智慧會議語音轉寫系統(tǒng),將發(fā)言語音內容實時轉換成文字。會議語音轉寫系統(tǒng)可實現(xiàn)語音轉寫的智能語音產品,其核心功能包括:實時會議轉寫和音頻轉寫。
產品界面簡單易用,用戶通過本款產品可以快速完成會議的實時記錄與整理,也可以對已經(jīng)錄制好的音頻進行整理,提升紀要整理的效率及效果。
智慧語音系統(tǒng)內置的聲學模型以漢語拼音聲韻母為基本識別單元進行聲學建模,兼顧了模型的顆粒度及可擴展性。
為了提高模型訓練的魯棒性,采用數(shù)萬小時:全面用語音數(shù)據(jù),并進行了dataauament,主要包括speed,/volumn/,RIR/pitch,/noise perturbation 等手段,把訓練數(shù)報量又擴大了20倍。
支持語言模型和聲學模型定制化。語言模型可針對客戶的行業(yè)領域的專有詞匯、行業(yè)術語等做優(yōu)化,如業(yè)務流程中的熱詞資源可以通過語言模型實時訓練后,達到理想的識別效果;聲學模型則針對客戶所屬地區(qū)的口音做針對性優(yōu)化。
針對業(yè)務中出現(xiàn)的新興詞匯,可通過自定義發(fā)音的熱詞機制做到即時支持,無需做額外的模型訓練工作。熱詞數(shù)量支持萬條以上,并可在運行時靈活切換。