国际创新创业博览会

讯飞智能录音笔 如何做到AI录音笔行业领先水准?

发布时间:2020-04-01 11:57 来源:中青在线 作者:龙雨

    人工智能已经深入我们的生活,你可列举的AI硬件不在少数如:智能音箱、录音笔、可穿戴设备等等。作为AI录音笔品牌领导者,讯飞智能录音笔支持“1小时录音,5分钟成稿”,同时它的软硬件能力均做到了行业领先,支持15米超远拾音、识别准确率高达98%等。

    早在2016年,科大讯飞就提出了一种全新的基于深度全序列卷积神经网络的语音识别框架,在实现识别效果大幅提升的同时,解决了解码时延高的问题,更适合实际应用。在2019年,科大讯飞更是业界首次实现了联合声学和语言同时建模的端到端语音识别框架的大规模稳定上线,显著改善了用户体验。讯飞智能录音笔语音识别模块采用基于深度全序列卷积神经网络的语音识别框架,识别准确率高达98%,且从录音到文字的转写延时更少,1小时的会议录音,5分钟即可转写完成。在语音识别过程中还会根据识别结果及时调整,利用相关声学信息、语言模型等进行重新评估,进行口语规整操作,过滤语气词、无意义的词、重复词、智能调整词序,进一步提高流利性和可阅读性。

    讯飞智能录音笔采用A.I.算法降噪,采用多麦克风阵列去混响和多麦克风波束形成提升信噪比(信噪比指一个电子设备或者电子系统中信号与噪声的比例,信噪比越高表明混在信号里的噪声越小,反之亦然)。讯飞智能录音笔硬件上配备2+6麦克风阵列,同时利用具有自主知识产权的A.I.算法降噪,针对声源定位,采用自适应滤波的方法消除噪声,采用七大场景模式智能拾音,拾音距离可达15米。以远场演讲场景为例,讯飞智能录音笔会调用2个定向麦克风拾音,同时6个矩阵式麦克风识别周边及其他方向反射回来的噪声,通过算法进行比对消噪;而在会议模式下,2个定向麦克风将停止工作,6个矩阵麦克风对收集的信号进行加权算法,在目标信号的方向形成一个拾音波束,同时衰减来自其他方向的噪声,可以定向拾取与会者的发言,使得录制声音清晰准确。

    讯飞智能录音笔拥有丰富的“智能”功能,在文件管理上,满足了各场景记录者方便录、查找易、编辑快等需求。对于大量的文件素材,用户可利用内置的语音助手,通过语音就可以在海量的录音文件中搜索录音内容,一键直达重点处。此外,基于云账号,讯飞智能录音笔还支持用户在录音笔、手机APP、网页等多个客户端自动同步和管理数据,同时还能进行录音回听、文稿编辑、一键导出等操作,对用户来说大大增加了整理工作的便捷性。

【责任编辑:于璧嘉】

指导单位

  • 中华全国总工会
  • 共青团中央

主办单位战略支持

  • 国务院国资委新闻中心
  • KAB全国推广办公室
  • 中国科协科学技术传播中心
  • 北京大学创业训练营
  • 中国科学院科学传播局
  • 北京大学战略研究所
  • 中国青年报社
  •  
  • 中国职工国际旅行社总社

承办单位

  • 中工卓越国际会展有限公司
  • 北京中青在线网络信息技术有限公司
  • 中青海德(北京)国际传媒有限公司