<code id="cmc8m"><tr id="cmc8m"></tr></code>

首頁 > 資訊 > 快訊

數據堂開源1505小時中文普通話語音數據集

時間：2019-05-30 20:33 作者：金熙明

5月20日，數據堂推出AI數據開源計劃，面向高校和學術機構等非商業組織群體，首次開源的數據集為：1505小時中文普通話語音數據集。

該數據集的錄音內容，由6408名來自中國不同地區的錄音人參與錄制，有超過30萬條口語化句子。句準確率達98%以上。

從評測效果來看，通過運行GMM-HMM混合模型和DNN-HMM混合模型，基于數據堂開源數據集【1505小時中文普通話語音數據集】的語音識別基準實驗完成，其識別準確率如下所示：

aidatatang_1505zh（完整的1505小時中文普通話語音數據集）

Aidatatang_200zh（基于完整數據集精選的200小時中文普通話語音數據集）

注：

CER（Character Error Rate）指字識別錯誤率。

SER（Sentence Error Rate）指句識別錯誤率。

GMM-HMM指混合高斯模型-隱馬爾科夫模型。

TDNN（Time-delay Neural Networks）指時延神經網絡模型。

CHAIN（Chain model）是指鏈式模型。

基于1505小時中文普通話語音數據集，數據堂精選了200小時中文普通話語音數據在OpenSLR發布，并在Kaldi平臺提供了訓練代碼，對應的訓練方法也在github平臺發布。

據了解，數據堂將持續提供面向學術研究領域開源不同領域、不同應用場景的AI數據集。

開源數據獲取方式：數據獲取請登錄數據堂官方網站

相關話題

金熙明

關注

免責聲明：本文章由會員“金熙明”發布，如果文章侵權，請聯系我們處理，本站僅提供信息存儲空間服務如因作品內容、版權和其他問題請于本站聯系

關注排行榜

編輯精選

国产大片91精品免费看3| 精品久久久久久久久免费影院| 午夜精品在线免费观看| 亚洲处破女AV日韩精品| 一本一本久久a久久精品综合麻豆一本色道久久88综合日韩精品 | 国产色无码精品视频免费| 精品亚洲国产成人av| 久久精品丝袜高跟鞋| re99热久久这里只有精品| 国产精品亚洲专区在线观看| 国产在线精品一区二区不卡| 国产在线观看91精品不卡| 亚洲国产综合精品中文第一| 精品乱人伦一区二区三区| 青青草97国产精品免费观看| 日本精品人妻无码免费大全| 99视频有精品视频免费观看| 亚洲一区爱区精品无码 | 久久精品国产福利国产琪琪| 韩国精品一区二区三区无码视频 | 国产精品第20页| 亚洲精品国产电影午夜| 国产精品露脸国语对白| 成人伊人精品色XXXX视频| 国产成人精品午夜视频'| 99re视频热这里只有精品7 | 久久国产精品成人免费| 国产高清精品一区| 最新国产午夜精品视频成人| 精品国产成人亚洲午夜福利| 乱色精品无码一区二区国产盗| 999精品视频这里只有精品| 四虎影院国产精品| 国产精品久久免费视频| 国产精品美女午夜爽爽爽免费 | 国产成人精品第一区二区| 久久精品中文无码资源站| 亚洲AV日韩精品久久久久久久| 田中瞳中文字幕久久精品| 久久精品国产亚洲Aⅴ蜜臀色欲 | 亚洲欧洲精品无码AV|

<button id="kgcmm"><tbody id="kgcmm"></tbody></button>

<table id="kgcmm"></table>

<table id="kgcmm"><wbr id="kgcmm"></wbr></table>

<tfoot id="kgcmm"><tr id="kgcmm"></tr></tfoot>

<bdo id="kgcmm"></bdo>

<code id="kgcmm"><tr id="kgcmm"></tr></code>

<strike id="kgcmm"></strike>

<table id="kgcmm"><dl id="kgcmm"></dl></table>