博客首页|TW首页| 同事录|业界社区

人工智能的战火从2017烧到2018,从国内的各大峰会到美国的CES,丝毫没有偃旗息鼓的意思,而这一次引发关注的却是我们往往不会和AI联系在一起的输入法。

易观发布的《中国手机输入法市场系列分析2017》显示,2017年第一季度,手机输入法活跃用户超过4.1亿,相较于2016年Q4增长13.83%。作为手机主要的输入工具,输入法用户规模和用户数量都保持着持续稳定增长。

AI技术的发展,使人工智能、搜索技术与输入法的结合日益紧密。随着用户对输入法辅助功能和场景的需求越来越多样,输入法也在这过程中不断迭代自身,不断优化用户体验。在百度输入法《AI输入——开启全感官输入时代》为主题的发布会上,百度副总裁王海峰就表示:“输入法是百度AI技术的桥头堡,未来将用更多人工智能技术打造AI输入,让输入法更懂用户的表达。”

一款人人都在用的输入法,为何能受到如此重视?

当AI遇见输入法之前,其实我们每个人都是程序员

输入法,IME(input method editor),即输入策略编辑器。上世纪80年代,电脑开始在中国普及,如何将汉字输入到电脑上成了当时亟需解决的问题。这个时期,五笔输入法的诞生,开创了中文输入法的先河,掀起了一阵全民学五笔输入法的潮流。

到了90年代,随着电脑用户的增加,五笔输入法入门难、强背字根的问题逐渐凸显,用户需要一款使用简单,入门轻松的输入法来代替它。这个时期,智能ABC应运而生。这款只要懂拼音就能使用的输入法,迅速受到用户喜爱,并得到了广泛的普及。

进入21世纪以来,拼音输入法得到了全面的发展。智能联想、自我学习、模糊、细分专业词库等功能不断完善。这个时期,市场上的各种输入法争奇斗艳,但最终拼音输入法以其高速的文字录入、简便的使用方法获得用户青睐,奠定了市场的主流地位。

总体来看,PC时代,输入法存在的作用是,用户把脑子里想的文字,转码成五笔或拼音等,再用英文键盘,按照某种策略输入,从而得到了汉字。换句话说,使用输入法,其实就是在进行一种编程行为,这个阶段,每个用户都像是一名程序员。

随着移动互联网的发展和手机用户规模的增长,手机输入法在用户的日常生活中扮演着越来越重要的角色,输入法的竞争也从PC端转移到了手机端。随着用户流量的转移,手机输入法逐渐成为用户搜索、表达的重要工具,而用户的持续增长,也将助力输入法搜索功能成为新的流量入口。对于各大输入法来说,如何抢占这一波流量,成了一个巨大的考验。

谁满足用户需求,谁就抢占市场先机,在互联网行业,这是亘古不变的定律,对输入法来说也一样。移动互联网时代,简单的文字录入已经不能满足用户多元化的需求。手写、语音等输入形态的出现,使用户和手机等移动终端的交互不再依赖键盘。在用户时间逐渐碎片化的今天,这种高效率的文字录入形式进一步推动了输入法的革新。

那么,AI时代,输入法还会有哪些可能呢?

AI输入,未来一切皆有可能

对于移动互联网用户来说,网络环境、智能手机和输入法是上网必备的“三件套”,不论是社交、网购、游戏、搜索,只要用手机上网,用户就必然会用到输入法。对于输入法行业来说,超过4.1亿的活跃用户,是十分具有吸引力的。

作为国内搜索巨头的百度,在成立之初就开始了对智能输入法的布局,把输入法作为自身的主打产品之一。依靠着多年的语音、图像、NLP、知识图谱等能力的积累,早就几年前,百度输入法就已经成为和手机百度、百度地图一样量级的超级APP。在AI时代,搭载了AI技术的百度输入法俨然成了一款人人可用的免费AI产品,让用户的输入体验得到了进一步提升。

移动互联网的发展与迭代,改变了用户的上网习惯。《中国手机输入法市场系列分析2017》报告显示,目前,在各类输入方式的用户规模上,语音输入占比18.85%,而这个数字在一年前还是6%。其中,单是百度输入法一家,语音输入日流量就超过2.5亿。为了满足日益增长的输入法语音用户及其需求,百度输入法在语音技术方面实现了新的突破——Deep Peak 2模型,全称为“基于 LSTM 和 CTC 的上下文无关音素组合建模”。该模型突破了沿用十几年的传统模型,能够更充分地发挥神经网络模型的参数优势,大幅提升中英文、多种口音、多种风格(如朗读、聊天、轻声)混合输入的识别准确率,聊天场景下的相对正确率较行业领先水平提升20%,让机器更能适应用户的聊天、游戏、搜索、地图、人名等。

游戏键盘也是百度将输入法与AI技术融合的一个亮点之一。这个键盘适配用户多游戏场景,将输入面板简化为一条语音输入的工具条,不遮挡游戏页面的内容,提供语音输入、悬浮键盘、游戏短语、和谐转换等游戏辅助功能,更好地提升游戏中的输入体验。对于广大喜欢一边交流一边打游戏的玩家来说,这个功能确实十分友好。

语音指令功能在一定程度上,推动了百度构建输入法生态的步伐。作为国内最大搜索引擎,百度拥有庞大的用户流量和资料数据库。在输入法中,百度将搜索功能与AI技术相结合,用户可直接通过输入法的面板搜索全网内容,无需切换应用,最大限度地提高用户的搜索效率。通过语音指令找表情、打电话、查天气等功能,使用户的相关操作都能在输入法中直接进行,无需切换APP,甚至连盲人等残障人士也可以轻松体验移动互联网带来的各种便利。

将声纹识别技术应用到输入法中,是百度输入法的又一个大招。针对许多用户在会议记录中手忙脚乱的速记痛点,百度输入法的语音速记功能不仅支持对会议进行录音并自动识别为文本,还能根据声纹自动区分发言人。在笔记模式中,语音速记功能则可以满足用户通过语音快速记录大段文本的需求,同时支持回放该段录音或者语音指令修改识别内容。

而“AR表情”功能是百度输入法基于百度的人脸识别技术和 AR 技术推出的新功能。用户可以根据相机或相册进行人脸识别,制作表情包,甚至通过自己的表情控制虚拟人物形象。制作出来的AR表情,可以直接通过输入法搜索、语音输入和键盘输入时展示出来,更加贴近用户聊天的个性化需求。

此外,百度输入法的多语种语音识别,语音实时翻译,有效地帮助用户在不同的场景中,提供更为智能化的信息。

随着AI技术的进一步发展及在输入法应用中的深度渗透,未来,输入法的交互方式将有更多的可能,而用户的体验也将因此不断变化和提升。

全感官输入时代到来

读懂人类的语言,识别人类的命令并做出相应的反馈,是AI技术最基本的体现。而搭载了AI技术的输入法,除了早期的词根联想外,下一步要做的是突破“转录”的单一价值,从声音、图片,甚至有望从动作、眼神中捕捉信息,让用户拥有更自然、更个性化的体验。

在国外,备受用户喜爱的Moment Keyboard输入法搭载AI技术后,在原有的翻译、联系人、天气查询等功能基础上,增添了 Smart bar 功能。这个功能可以根据语义分析以及人工智能自动匹配相应的服务,比如用户在打字时,可以联想他们常用的表情,免去用户到图库和微信表情里苦苦寻找的步骤。

而在国内,百度输入法早已实现这个功能。未来,百度还将通过AI开放平台,与开发者、合作伙伴共同探索人机交互和信息输入的进化路径,并将语音、图像等支撑输入法进化的AI能力开放,推动AI落地。正如王海峰所言:“基于百度人工智能技术,全感官输入时代的序幕已经拉开,未来将会有更多AI能力应用到输入法中,让输入变得更便捷,让人与机器的交互方式更自然。”

作者:高灵灵

编辑:南七道

南七道:南七道新媒创始人&CEO,虎嗅等年度作者,互联网明星创业公司脸萌、FaceU等品牌操盘手,关注互联网和科技创业。公号南七道。


上一篇: 大佬疯狂撒币的思考:高潮还在后面
下一篇:从中国知名到雄踞全球第一,海尔挑战不可能背后的引领者之道

评论

Good.Be the first to comment on this entry.

发表评论