不到半年,又掌握了10种方言?!

中国电信
发布于:2024-11-15
文章内容来源于公众号:中国电信,点此可查看原文,内容版权归相关企业所有,本网站仅供交流学习。若涉及版权问题或存在侵权情况,请及时与我们联系,我们将第一时间进行删除处理。
摘要:
“拿扎、落咋、辣砸”
你知道这几个称呼是在叫谁吗?
偷偷提示你
这几个都是神话中小英雄
的方言版称呼哦
我国幅员辽阔,语言资源丰富
拥有十大汉语方言
及难以计数的土语方言
“醉里吴音相媚好,白发谁家翁媪?”
“少小离家老大回,乡音无改鬓毛衰”
从古至今
方言就传递着深深的人文情感
拥有着无与伦比的魅力
![]()
近日,热播剧《上甘岭》中
男女主人公通过方言传递情报的情节
引发了热议
有网友表示赞叹,认为是“鬼斧神工”
让敌人无法破译
也有很多网友感慨
这么有魅力的方言,应该好好去守护
为了能够守护方言
更好地理解方言
今年5月,中国电信推出了
具备超多方言识别能力的
星辰语音大模型
构建了一座打通隔阂的 AI 之桥
星辰语音大模型
攻克“全国最难懂方言”——温州话
更是让大家津津乐道
星辰语音大模型实现了单模型同时支持普通话、英文和 40 种方言的自由混说,并可以通过“一个”ASR(自动语音识别)能力应用于全国多个方言区域,带来更灵活的功能和服务选择,大幅改善用户体验。星辰语音大模型的超多方言能力应用场景丰富多样,涵盖会议系统、智能客服、校园安全、助老助农等多个领域。在智能会议场景,其超多方言识别能力已上线星辰慧记智能会议系统,助力企业快速转写并总结不同地域的客户声音,提升开会效率。星辰语音大模型还落地多地市的12345平台,赋能客服人员更自然流畅地理解市民通过方言提出的问题和需求。在今年9月举办的权威国际语音顶会 Interspeech 2024上,星辰语音大模型凭借领先的技术实力,在离散语音单元建模挑战赛中斩获语音识别赛道冠军;并在 IEEE SLT 2024 说话人溯源国际挑战赛的说话人确认赛道获得第一名。在多方言语音识别建模过程中,首先面临的问题是人工标注的方言数据非常稀缺。中国电信TeleAI团队采取了两条路径,一是获取更多无标注的方言数据;二是减少模型对标注数据的依赖。与传统的有标注训练方法相比,TeleAI利用海量无标注数据进行预训练,再通过少量有标注数据进行微调。同时,TeleAI还在模型结构和成本优化上进行了创新,实现对人工标注数据的需求量大幅缩减约50倍,且保障模型效果与有监督训练的方言模型水平相当。在多方言联合建模的过程中,一些音频的识别文本看似与音频发音一致,但结果却严重错误,核心问题是发音混淆。例如,粤语中的“八”(粤语拼音:baat3)与普通话中的“八”(汉语拼音:ba1)发音基本一致;但粤语中的“二”(粤语拼音:yi6)与普通话中的“二”(汉语拼音:er4)在发音上相差甚远。为了解决这些问题,TeleAI团队采用“字+标签”作为新的建模单元,单元中的“字”代表了音频中的发音信息和音频对应文本的语义信息;而“标签”则是用于区分同字不同音的附加属性,如方言标签或语言标签等。这样既可以充分借鉴不同方言乃至语言间的发音规律,又能有效解决相似语言中的同字不同音问题。