王小川:音箱不会成为AI时代具有重大潜力的产品
这是最近我们和新华社合作的一款产品,新华社从今年2月份开始就用机器取代人进行新闻播报,之后我们又做了好几版的升级,能够使得产品升级从表情、手势都会变得更好。这样的一个主持人从原来每周下午一、二、五上班,现在转变为完全解放,开始升级成了一个采访记者,拿着摄像机和麦克风去做实际的采访,所以原有的工作已经被机器完整取代,不用化妆、灯光和摄像。新闻行业当中第一个被取代的职位反而是新闻主播,说明新闻主播本身的技术含量不是很高,不涉及到很多情感的表演表达。 平安普惠产品已经上线,以前都是靠人面对面的签约服务,随着技术的进步,人工客服已经被完全取代,我们提供语音合成和视觉合成能力,不过都是客服当中简单的确认性服务,要是销售的话估计这样会把客户吓跑。 目前语音视觉已经开始逐步走向语言,今天能够摸得到边的技术就是翻译,全球有70亿人当中汉语为母语的人口占到多少?大概20%,全球英文母语的占到多少?其实只排在全球人口的第四名,要比葡萄牙语和印地语还少,但英文是今天全球通用的语言,网页上95%的有效信息都是英文写的,100%的商贸活动都是用英文。所以作为中国人很难堪的是,当我们去国际上交流的时候需要被迫做多年的英文学习,除非是在当地生活或者理解外国的文化,那么需要精深的学习,大多数投入的学习成本和得到的收益是并不值当的,是否能够让机器帮助我们做到更好的翻译工作? 六十年代有了人工智能之后就一直在进行翻译,直到最近才大放异彩,中国的机器翻译是比美国做得更好,原因不在于技术更领先,而是态度更认真,今天的AI不仅靠算法,还要靠背后的数据驱动,中国公司是很努力地进行大量的数据搜集和加工工作。搜狗在2016年1月是全球首个在通用场景和大会上发布了这样一个英到中的同传系统,2017年1月也是行业当中首个英文检索,识别中文词语之后可以转化为英文,这对英文不是足够良好的人来讲有机会在全球获得交流信息,也是使用了一定的机器计算工作,加上很好的交互,使得我们的信息获取方式极大地拓展。 2017年10月,我们首个发布离线深度学习产品,也是一款翻译机。今天的深度学习网络结构特别大,如何把这种结构装到一个小设备当中?到了2018年我们是首个能够在Q3做到英到中的同传系统,也已经进入了使用状态,包括在苹果发布会当中进行精准转写,不过需要定期进行优化,包括医疗、科技、教育和物理学等等,因为机器并不具备足够高的认知能力,需要不断优化才能逐渐靠谱。 (编辑:衢州站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |