“一张嘴”就能在手机上隔空打字,图片上各种潦草的手写文字只需拍个照就能立马变成可编辑的文档,输入各国外语秒出中文翻译……这些曾经只能借助高精尖设备实现的场景,现在通过手机里的小小讯飞输入法就能做到。

讯飞输入法有什么隐藏功能(揭秘讯飞输入法背后的黑科技)(1)

接下来,小编就带着大家看看整个讯飞输入法背后有哪些我们不知道的强大功能,并为大家揭开讯飞输入法功能背后的人工智能技术真相,了解下语音识别技术见长的讯飞,如何将时下流行的云计算和AI技术运用在了手机输入法中,让上述科幻电影场景变为可能,成为人工智能落地的典型。

“1分钟400字”,手机打字也要“多快好省”

研究显示,人类接受输入信息80%来自于眼睛,所以很多人类推认为机器人的视觉很重要。但是还有一个数字可能大家没有注意过,就是人类输出信息的90%来自于嘴。十年前,讯飞输入法就利用科大讯飞在语音识别方面的技术优势,在行业内率先推出中文语音输入,颠覆了人们对于“打字”的已有认知。

讯飞输入法有什么隐藏功能(揭秘讯飞输入法背后的黑科技)(2)

经过10多年的发展,讯飞输入法如今已轻松实现1分钟400字的语音输入,准确率更是超过98%。即使轻声耳语也能精准识别。噪声等诸多不确定复杂场景,依然能够保持超高识别率,极大拓展了语音输入的外延。不仅如此,讯飞输入法洞察用户需求,率先推出方言语音输入,支持粤语、四川话、东北话、闽南语等23种方言,用最熟悉的家乡话就能快速打字,惠及更多地域用户。

讯飞输入法有什么隐藏功能(揭秘讯飞输入法背后的黑科技)(3)

语音输入从0到1的突破,离不开背后长期智能语音技术积累和研发攻关。讯飞输入法的AI语音输入,承载了科大讯飞强大的语音识别框架,将在线语音识别精度不断提升的同时,借助超过20万小时的训练数据,让机器懂人所说,将手机输入效率进化到新的层次。

2020年5月,在国际权威英文语音识别大赛“CHiME-6”中,科大讯飞联合中科大语音及语言信息处理国家工程实验室夺冠,大幅刷新该项赛事历史最好成绩。

10余种外语和中文实时互译,小小输入法也能秒变“翻译机”

成立20年来,科大讯飞不仅实现了“把中文语音技术做到全球最好”的小目标,连英文识别也做到了全球第一。2017年10月21日,科大讯飞与上外高翻签订合作,建立了人工智能口笔译研究联合实验室。2018年与外文局达成合作,共建国家级人工智能翻译平台;2022年北京冬奥会和冬残奥会,科大讯飞更是成为语音转换与翻译独家供应商。

讯飞输入法有什么隐藏功能(揭秘讯飞输入法背后的黑科技)(4)

除了拳头产品翻译机之外,本文开头提到的输入各国外语秒出中文翻译就是讯飞输入法的核心功能之一。聊天或者会议过程中,对方突然用英文沟通你恰好听不懂,复制到翻译工具去翻译又来不及,这时候开启讯飞输入法的中英文翻译就可以解决了。

除了英汉互译,目前讯飞输入法支持日、韩、俄等多国语言输入,无论是实时翻译,还是中外文语音混合输入,都能轻松实现。

这些功能背后同样离不开技术以及大数据的加持。针对不同翻译场景,科大讯飞提出了融合副语言特征的高鲁棒性语音翻译技术,借助大量的数据,在模型训练中动态构建对抗样本等方式,提升各种外语口音、噪声环境下的翻译效果,提升多语种翻译性能。

图像识别技术加持 拍照就能实现文字扫描输入

如果说上述这些技术大都是通过大数据以及语音识别技术提高输入的效率,那么下面这个功能更多借助图像识别的功能!直接通过拍照就能实现文字扫描输入。

讯飞输入法有什么隐藏功能(揭秘讯飞输入法背后的黑科技)(5)

基于用户刚需,讯飞输入法新增OCR拍照输入,相当于给输入法安装了一双“眼睛”。这个新功能的用心之处是不管书本、路牌、名片还是其他纸质图中的文字,都能轻松识别并提取出来,方便用户进行编辑、归类、管理,省去大量录入的时间。更令人惊喜的是,内置文字扫描不仅能识别各类印刷体,对于手写识别准确率也高达90%以上,就算字体潦草也轻松识别。 作为高效输入的一种补充,文字扫描可以捕捉输入过程中多场景下的文字,满足用户多样的需求,助力讯飞输入法成为未来最智能化的输入法。

当然,这背后也离不开一系列强大的识别技术。就拿其中手写识别技术来说,不仅支持实时手写轨迹,边写边出字。单个字符识别仅需15ms,响应迅速无延迟。单字识别率超过95%,处于行写领先地位。能够满足具有不同书写习惯的用户的多种书写需求,随意书写不受限。

值得一提的是,除了强大的专业能力,讯飞输入法还拥有一系列依靠技术支撑的趣味功能,例如在增进表达趣味的BiuBiu键盘,阅后即焚、成语接龙、斗图神器等,借助AI赋能,科大讯飞人工智能应用愿景正在从“能听会说”到“能理解会思考”。

在科大讯飞看来,手机端输入方式发生了巨大的变化,语音输入已经达到了实用的门槛,语音交互的比重越来越大,加上对涟漪效应的理解,讯飞输入法已经成为高粘性的工具类产品。未来,讯飞输入法将继续结合AI,不断提升语音识别、语义理解、机器翻译、图像识别、语音合成技术能力,赋予输入法更多想象空间