1.863合成语料库,数据库(10G),国家863课题组,1997年
2.863语音识别库,数据库(20G),国家863课题组,1996年
3.普通话单音节两音节数据库,软件+数据库(500M),社科院青年课题
4.CASS自然口语语料库,数据库(5GB),John Hopkins University,USA,2000年
5.ASCCD语篇语料库,数据库(2GB),CCC Corpora,2001年
6.CADCC对话语料库,数据库(10GB),CCC Corpora,2004年
7.SPEECON语料库,数据库(60GB),NOKIA,2003年
8.北京上海对比语料库,数据库(10GB),NOKIA,2003年
9.RASC863语料库,数据库(220GB),国家863课题组,2006年
10.广州、厦门方言普通话对比库(与NOKIA合作),数据库(30GB),NOKIA,2007
11.MOTOROLA合作多语种语料库,数据库(60GB),MOTOROLA,2008年
12.电话语料库(与中国科学院自动化研究所合作),数据库(10GB),国家863课题组,2009年
13.多模态儿童语音库 CASS-child,数据库(3T),社科院重点项目
14.1.5-6岁普通话儿童看图说词语音数据库 CASS-Word,语音数据库(3500多名儿童),创新工程项目
15.中国方言区英语学习者语音库 AESOP-CASS,10大方言区英语学习者的并行语料库,人均近1小时,创新工程项目、社科基金重大项目
16.汉语口语语篇库CASS-DISCOURSE,1000个对话7个应用场景不同题材,973项目、创新工程项目
17.英语学习者3D发音生理数据库CASS-EMA-EFL,创新工程项目