香港特区立法会投用科大讯飞“智识听”系统:实时准确率 96%,特殊口音也能应对

2025-08-04 发布 · 浏览14次 · 点赞0次 · 收藏0次

8 月 4 日消息,据科大讯飞官方公众号,香港特区立法会与科大讯飞联合打造了智慧誊录系统“智识听”,可深度识别立法会场景的实时字幕功能,运用科大讯飞中英粤混读引擎,结合声纹识别和字幕与帧画面对齐压制技术,实现会议直播中文字和视频画面的同轨显示,公众可通过实时字幕无障碍获取政策资讯。

“智识听”深度学习 2.5 亿字语料、400 小时音频、20 万条香港特色关键词,口音、新地名、混语发言实时适配,即使面对议员特殊口音或复杂地名也能高效处理。目前,实时字幕的准确率达 96%,通过幕后同事的即时修正,准确率通过人机结合可达 99%。

图片

从官方获悉,“智识听”正式调研、研发、上线历时近 3 年,1.0 版具备录音转文字功能,2.0 引入对实时转文字的支持,3.0 版则开始支持实时字幕。为解决粤语俚语及法律专业术语较多、部分议员存在口音、中英粤混杂等问题,立法会秘书处整理了 2.5 亿汉字的中英文对照和 20 万个高频粤语词汇,将其作为语料库提供给机器学习。经过数据和算法的优化和不断地训练,立法会会议实时字幕的准确率达 96%。

原先,需要 7 个工作日才能发布的议事录,会议召开后第二天即可发布。目前智识听四期正在准备中,该期将建设英语字幕和多语种字幕系统。同时,基于星火大模型的进步,香港立法会的智慧办公系统也提上日程。

图片

香港特区立法会投用科大讯飞“智识听”系统:实时准确率 96%,特殊口音也能应对 - AI 资讯 - 资讯 - AI 中文社区

声明:本文转载自IT 之家,转载目的在于传递更多信息,并不代表本社区赞同其观点和对其真实性负责,本文只提供参考并不构成任何建议,若有版权等问题,点击这里。本站拥有对此声明的最终解释权。如涉及作品内容、版权和其它问题,请联系我们删除,我方收到通知后第一时间删除内容。

点赞(0) 收藏(0)
0条评论
珍惜第一个评论,它能得到比较好的回应。
评论

游客
登录后再评论
  • 鸟过留鸣,人过留评。
  • 和谐社区,和谐点评。