霸占了湛江话、洛阳话、烟台话等方言,并引入对英文的识别。中国电信人工智能研究院(TeleAI)正在本年 5 月发布业内首个支撑 30 种方言混说的语音识别大模子 —— 星辰超多方言语音识别大模子。实现对人工标注数据的需求量大幅降低约 50 倍,将方言品种从 30 种提拔至 40 种,这种“预锻炼 + 微调”的模子方案取方言场景的需求可以或许高度契合。再通过少量有标注数据进行微调。操纵海量无标注数据进行预锻炼,因为方言语音数据遍及存正在无标注数据多而有标注数据少的特点,IT之家 11 月 3 日动静!取保守的有标注锻炼方式比拟,TeleAI 还正在模子布局和成本优化长进行了立异,时隔不到半年,TeleAI 通过预锻炼语音识别模子,TeleAI 星辰语音大模子的多方言能力再次升级,
安徽赢多多人口健康信息技术有限公司