让语音和视频通话跨越无声世界

2022.05.19

腾讯与中国联通合作推出的语音转文字辅听工具正在改变中国近2800万听障人士的生活。

这款手机App采用了腾讯会议旗下天籁实验室开发的AI语音增强辅听算法。天籁实验室免费开放其AI音频技术,用于改善听障人士的生活质量。自2020年起,天籁实验室便联合腾讯公益慈善基金会、中国聋人协会等机构发起天籁行动,推出多款无障碍解决方案。

听力受损的足球运动员陈智慧正在使用搭载腾讯天籁AI技术的“畅听小助手”App和教练“通话”。

语音来电将被切换到文字界面。首先出现的是一条自定义开场白,这条信息告诉呼叫者,接听用户正使用语音转文字功能,回复时间可能较长,请予以谅解。

电话接通后,语音自动转换成文字,出现在听障用户的屏幕上。

用户可以在文本框内输入文字,并将其转成语音。

反之亦然,接听者可以选择预先编写的信息或手动打字并转换成语音。

视频通话也是同样的原理,呼叫者的语音将转译成文字出现在视频通话界面上。单一字节言语识别率和实时字幕识别准确率分别提高66%6%-10%

在这款解决方案推出前,腾讯去年12月上线了“无障碍急救功能”,让听障用户无需进行语音沟通即可呼叫救护车或报警。

借助“无障碍急救”“企鹅急救”微信小程序,听障人士可以用文字呼叫急救中心。该功能将文字转译成语音,传输给离求助者最近的急救中心。调度人员会收到特殊的提示音,呼叫者的位置信息将同步发送给急救中心。

用户可以按下企鹅急救小程序的SOS按钮,在紧急情况下获得帮助。

腾讯表示,这项功能采用了腾讯云语音识别技术,该技术可以识别24种方言,识别准确率可达98%

腾讯正在与全国各地的急救中心合作,目前已率先在北京、南京、武汉、九江等24座城市上线。

腾讯将继续完善其应急开放平台,涵盖急救云调度、AED设备和急救志愿者等。