音頻文件轉(zhuǎn)寫
音頻文件轉(zhuǎn)寫,可將上傳的音頻文件(支持pcm/wav/amr/m4a文件)識別為文字,12小時內(nèi)返回識別結(jié)果。具體功能、優(yōu)勢如下:
一、 功能
1,技術(shù)領(lǐng)先識別準(zhǔn)確
基于天氣在線獨(dú)有技術(shù)建模,聲學(xué)建模多采樣率多場景,中文普通話近場識別準(zhǔn)確率達(dá)99%。
2,批量音頻快速識別
可批量上傳大量錄音,語音識別引擎可精準(zhǔn)、快速的轉(zhuǎn)為文字,并在12小時內(nèi)識別返回結(jié)果。
3,文字識別結(jié)果支持時間戳
識別返回的文字結(jié)果帶有時間戳,展示VAD切分句子開始和結(jié)束時間,方便進(jìn)行功能開發(fā)
4,多語種識別
支持中文普通話和英文識別以及捎帶口音的中文識別。
二、 優(yōu)勢
1、高效穩(wěn)定
提供高效靈活的企業(yè)級專有集群承載大流量高并發(fā)服務(wù)保障,通過新的并發(fā)切分調(diào)度技術(shù),識別結(jié)果返回快速。
2、智能語言處理
語言模型使用大規(guī)模數(shù)據(jù)集訓(xùn)練,智能糾錯識別中間結(jié)果,并根據(jù)語音的內(nèi)容理解和停頓智能匹配合適的標(biāo)點(diǎn)符號,。。
3、模型自助優(yōu)化
在語音自訓(xùn)練平臺上中文普通話模型可零代碼自助訓(xùn)練,上傳文本語料即可有效提升業(yè)務(wù)詞匯的識別準(zhǔn)確率5-25%。