智能语音站在神秘入口 后来者壁咚了谁

物联网

一个假期接着一个假期而来,出行订票时我们对着手机上的智能语音机器人说话,就能让它帮忙找到出行所需信息。如果不想走出去,在家里,我们对着智能语音电视说出想看什么,然后,我们只需要静静等待精彩节目的上演。还不止这些,我们的手表、我们的眼镜等都能通过语音理解我们的需求,智能语音控制大有成为智能硬件标配的趋势。

某一天,一个男人站在北京上地某办公室的落地窗前,内心起伏,想着这些智能语音给生活带来的改变,他脸上满是笑容,看着窗外渐绿的世界,他知道尽管春天已经来了,但冬天远未离去。智能语音的征途还很漫长,但景色还是要看的。

这个男人在向我们如此介绍智能语音带来的智慧生活同时,他感慨道:“智能语音会是下一个互联网入口,尤其在移动互联网时代,这个入口将更快形成。”

智能语音或是那个神秘入口

这个男人是雷臻,OKVoice的联合创始人,2014年8月,他和另外两位联合创始人决定要做一件厚积薄发的事情,说是厚积薄发,是因为他们有着五年左右的技术储备,这件事情就是现在的OKVoice。

OkVoice主要从事智能语音技术和人工智能探索,仔细想想这也算是一家比较老的公司了,加上创始团队五年左右的技术储备期,这家公司快6岁了。OKVoice联合创始人雷臻在接受硅谷网专访时,所表现出来的创业姿态和思路,对应这家公司后来者的身份,更是难以让人不好奇。当谈到争论和声音不断的“移动互联网入口”问题的时候,雷臻脸上浮现出了比以往更多的笑容,他表示,智能语音现在正站在风口等风来,它就是移动互联网入口。

资料显示,目前,国内外多家公司从事智能语音相关产品的研发和生产,国外主要以微软、谷歌、苹果、英特尔、IBM等巨头为代表,国内主要以百度、腾讯、盛大、搜狗、科大讯飞、云之声、OKVoice为代表,其中,科大讯飞、云之声、OKVioce一类公司是以智能语音为标签之一的垂直公司。

金矿是容易让人趋之若鹜的事物,智能语音,被称为互联网的下一个金矿,尤其是在这个移动互联网炙手可热的时期。此间,虽然智能语音更多时候仅是表现为新潮的人机交互方式,但智能语音市场早已开始布局备赛,你未唱罢,我便登台,抢占传说中的“入口”。

巨头公司纷纷涉足语音市场,加剧智能语音市场竞争的同时,抢滩“移动互联网入口”的目的越发清晰,在雷臻看来,智能语音市场的潜力现在仍被低估了,随着智能硬件的不断升级改造,未来智能语音市场是会被真的“智能硬件”引爆的。从巨头公司争相布局智能语音拉开“移动物联网入口”战备竞赛来看,未来几年,智能语音会上升到一个前所未有的战略地位,相应的智能语音市场,也会有一个明显的爆发现象。

渗透式改造行业才刚刚开始

让机器理解人的语言,是一个从语音到文本、从文本到理解的技术过程。由于中国方言和口语丰富多样,智能语音的准确率和理解率会偏低。面对这样的中国智能语音市场,国内外巨头必将面临更为残酷的竞争。雷臻和他所带领的Okvoice不愿错过抢滩中国智能语音市场的绝佳时机,但是雷臻认为,智能语音和行业的结合更有意义,更让大家心动的是,渗透式改造行业才刚刚开始。

所以,OKvoice除了针对中国方言和口语推出的“语音识别”服务外,还推出了“字幕服务、口语评测、智能客服”等特色服务。

其中,“字幕服务”就是典型的智能语音和行业深度整合的技术类产品,借助“字幕服务”,可以将影视作品、电视节目、在线课程、视频会议等视频中的声音,通过语音识别技术自动生成文字并导入生成字幕。雷臻告诉硅谷网,借助云计算和大数据,这项服务未来或可实现工具化的在线服务。非专业人士拍摄的小视频,通过这项在线服务,就能轻松制作出具有影视风格的短片。

据第三方数据不完全显示,OKVoice推出的“字幕服务“快速通过语音识别自动生成文字,目前阶段,准确率在垂直领域可达到95%,省时省力。当然还有提升空间,随着技术不断完善,更高的准确率下带来的便捷体验,对“字幕制作”这个行业小痛点,也算是莫大的安慰。

比以上这些更引人注目的,是智能语音与硬件的互动,在市场需求及技术和模式创新的驱动下,全球智能语音产业正在快速发展。像蓝牙耳机、车载导航、语音门禁等智能语音解决方案,都在逐步完善中。不得不承认,智能语音正在改变我们的生活。

随着智能终端设备的普及以及可穿戴设备、智能家居等发展,智能语音行业发展趋势见好。语音会是未来一种简单和常用的人机交互模式。特别是在场景化的环境中,如驾车,不方便通过手或者眼球操作,语音是一种首选的方式。受硬件形态的约束,市场上将会有更多的硬件引入智能语音的技术。

一次公开场合上,智能语音技术和人工智能探索者作为OKVoice的定位被进一步夯实,陆续上线的服务中就有我们前面提到的渗透式的行业解决方案。当然,这些解决方案,还有待市场和用户的进一步检验。

格局未定,后来者自我壁咚

“互联网+”的概念提出后,在不久前刚刚举办的2015博鳌论坛上,互联网领袖的关注度格外高涨。本次活动上,李彦宏、比尔盖茨、马斯克这三位大佬的对话更是引人瞩目,其中很多观点都蕴含着对未来的重要意义。其中,人工智能就是三位大佬在对话上都高度关注的领域,而众所周知的事情是,智能语音是人工智能的基础支持和核心要点。

这听起来很让人兴奋,虽然智能语音距离人工智能似乎还比较遥远,但是,越来越多的通道将被打开,在中国,越来越多的公司加入智能语音市场,百度宣布语音识别技术及能力全面开放,微信发布了语音识别开放平台……现阶段,互联网巨头都还只是在试水,还没有大规模地进入语音这块市场。大公司考虑更多的是自己的商业闭环,而垂直的公司更多做一些聚焦,前者进入语音市场是立足做一个平台级的产品,而后者更关注垂直与细分市场。

OKVoice也是这么做的,格局未定,后来者可发挥空间还很大。“巨头的参与让智能语音这个领域容易得到更多的关注,共同培育市场,市场对参与者反馈越多。”雷臻在说这句话的时候异常平静。

对雷臻来说,这是他的第二次创业了,第一次是做优惠券,就是现在O2O的雏形。第二次,他选择了智能语音这块大蛋糕。30多岁的雷臻,看起来干练自信,言谈举止亲切而自然。当年雷臻从华为出来的时候,他就坚信,创业这件事情,厚积薄发更能带来惊喜。

前面提到的OKVoice五年的技术储备,来源于团队构成的强大技术背景,但这还不够,应该还有这个团队共同的强大理想所架设的“极客”氛围。在OKVoice创业初期,公司还在研发“语音识别”的升级产品,一个主抓技术的同事因为家中有事,雷臻给了他一个星期的事假,其实,用7天来处理该技术的家事还是有点紧张的,结果,这个可爱的技术大牛只用了不到一半的时间就赶了回来,结果,该阶段项目进展提前完成,为后面“渗透性行业智能语音服务”节省出了竞争时间。

“这样的一个团队,是一个可以创造神奇的团队。”雷臻对来访者说,又像是在自言自语。言语当中自豪和压力都有,他对现在的OKVoice的估值是一亿美元,别人问他,你这么估值的依据是什么:是行业前景,是市场体量,还是技术储备?雷臻笑语,他说,我们不主动寻找资本介入,也不排斥资本介入,我这是在逼迫自己呀。

雷臻是一个紧跟潮流的人吗?像也不像,他似乎忘了一个潮词。这个潮词是“壁咚”。壁咚的字面意思是大力拍打墙壁发出“咚咚”声的行为,但分场合又有着不同的意义。通常是指恋爱中,男性把女性逼到墙边,单手或者靠在墙上发出“咚”的一声,让其完全无处可逃的动作。

现在的雷臻就像在谈一场恋爱,恋爱对象是“智能语音”,是“竞争对手”,是“行业未来”,但更多的是他自己。这和自恋无关,他做为后来者,究竟壁咚了谁?在智能语音风起云涌的当下,后来者雷臻壁咚的是自己。

未经允许不得转载:物联网的那些事 - Totiot » 智能语音站在神秘入口 后来者壁咚了谁