10月29日,在搜狗2016年合作伙伴大会上,搜狗CEO王小川认为,搜索的未来是“问答”,就是对问题给出准确的答案。
年初,“阿尔法狗”战胜了人类象棋冠军李世石,让我们看到了人工智能时代的到来,人工智能开始真正实用化。
至于人工智能的未来趋势,王小川认为将是两个不同的系统:虚拟世界和机器智能。人工智能的意义在于让机器参与人的决策。
人工智能是基于大数据、云计算、机器学习的基础智商,搜索引擎是三个领域的核心技术载体。王小川断言“搜索的未来是人类智能时代的明珠”。
搜索的未来是什么?王小川认为,语音搜索和图像识别不是搜索的未来,但搜索的未来是“问答”。“现在搜索关键词,也许机器会给你十个答案,但未来的趋势将是对问题给出更准确的答案。”
他以苹果和谷歌在王小川在人工智能领域的布局为例,说乔布斯去世前过早地将Siri推向市场,率先推出语音助手,但谷歌最终会后来居上,因为这和谷歌擅长的搜索引擎是一样的。
至于输入法,王小川表示,它是大数据、云计算和人工智能相结合的产物。搜索公司很容易把一些领先的技术植入输入法。
根据王小川的说法,搜狗的输入法每天可以处理1.9亿次数据,这比所有其他做语音识别的中国公司的总和还要多。
王小川表示,未来输入法不仅仅是作为一个表达上的工具,而是会和用户“契合”,知道用户想说什么、回答什么,未来机器会取代用户的回复。
以下为王小川演讲实录:
在今天的分享中,我不一定要讲搜狗现有的一些业务,而是跟大家讲一些新的想法,所以我会更进一步,讲一下搜狗的人工智能之路,在这里你可以感受到我们的一些策略。
在阿尔法狗击败李世石的第三场比赛后的第一个工作日,搜狗放假庆祝这样的胜利,这一天被称为“狗胜利日”,阿尔法狗的胜利。在这里,我们看到了一个新时代的到来,那就是人工智能。
所以我在大学的时候,从大一开始就在学习人工智能。那么为什么2016年会有这样的变化呢?其实不仅仅是技术本身的突破,而是市场和媒体的巨大变化。
所以我们可以看到,今年之前有两波人工智能。但是我们可以看到,过去人工智能只存在于高校,现在涉及人工智能的企业数量是以前的好几倍。从今年开始,人工智能真正走向实用。
在我的预测中,AI下去主要有两个系统,一个是虚拟世界,一个是机器智能。
前者是怎么理解的?我想说的是搜狗不擅长的领域,比如游戏、小说、音乐、视频。这些领域的技术发展把我们带到了虚拟世界,这就是文化创意产业。这是为了满足人类社会更大的需求。第一,让人类找到自己的存在感。第二,降低人的判断力,把决策交给机器。所以我们知道,人工智能的意义不仅仅在于识别和生成,还在于机器参与人的决策。
搜索的未来是什么?
今年年初,有媒体朋友问我,搜狗是不是要转型做人工智能了?使用了“转换”一词。我说不是,你对人工智能一无所知,因为人工智能是基于大数据、云计算和机器学习的。搜索引擎本质上是这三个领域的核心技术载体。从我们的技术到我们的业务到人工智能,所以我说搜索的未来是人类智能时代的明珠。这是我对未来的预测。人们会问未来是什么。搜狗的未来如何?人工智能的未来是怎样的?为什么是珍珠?
当人们理解智能的时候,从科幻小说或者科学家的角度来看,它是什么?20世纪60年代,图灵开发的人工智能是一台对话机器。以至于你不知道对面是人还是机器。
大量的文学作品或者科幻电影中也提到了一种会说话会回答问题的机器,比如《大白》或者《星际穿越》中的机器人。在阿西莫夫的小说《最后一个问题》中,一台终极机器被制造出来。他说人类控制了地球,甚至任何一个星系的所有资源,来建造一个可以回答问题的机器。
这部小说很短。故事中,这台机器可以回答人类几乎所有的问题,但只有一个问题无法回答。宇宙是如何诞生的?。这部小说的最后,这台机器想通了,叫“让有光”,于是这台机器再造了宇宙。这是一部科幻电影。所以我们对人工智能的终极理解,大多数人会认为它是一个会思考会说话的机器。
这里是对人工智能未来的终极理解。
未来搜索会怎么样?
未来是语音搜索吗?将来,人们会说“王小川”来搜索。不要这样,应该用语音说出来。其实我觉得语音搜索并不能带来多少附加值。可能从我的口音能听出来我的声音有四川口音。你能给我一些关于四川的信息吗?,这个意义很小。
是形象吗?这两年图片的发展也很快,要么是个性化,要么是推荐系统。其实在我心目中,这些地方都不是搜索要解决的终极问题。
那会是什么?我的回答是“问答”。
我们可以理解为,今天的搜索引擎是我们输入一个关键词,然后给你十个答案或者十个结果,让用户自己选择。但这是我想要的最终效果吗?用关键词得到答案。不完全是。我们对答案不满意,我们需要的是一个准确的答案。即使通过个性化,我们也不可能知道这个答案是否更适合你。
例如,洪涛(搜狗·CMO饰)和我已经共事十多年了。我跟他说了两个字“搜狗”,洪涛一定不知道我要什么。即使我说“搜狗收入”,我也不知道我在说什么。所以个性化的附加值并不大。我们解决问题的唯一方法是用自然语言提问。
比如我问洪涛,我们第三季度的收入会怎么样?这个时候他就能给我想要的答案。因为一个关键字不包含完整的信息。事实上,在我们的搜索引擎中,今天的关键词输入占了97%。
1999年开始接触搜索引擎。当时人们更习惯于搜索整句。我漂亮吗?这是搜索的第一个要求,机器无法回答这个问题。其实我们今天用提问的方法的时候,为什么大家不这么用呢?机器不够智能,解决不了那么多问题,给你十个答案就成了关键词。未来的趋势真的会成为问题的答案。
苹果领先,但谷歌将赢得未来
谷歌也做了同样的事情。未来,用户70%的请求都要得到回答,这和我们对用户需求的理解高度一致。人工智能时代的到来,会让搜索引擎有能力从关键词问题变成十个结果,变成一个问题,给你一个准确的官方答案。这使得人们的表达更自然,赋予了更精确的含义。
乔布斯最大的贡献是,我们知道如何让人们用最自然的方式交流。以前用键盘,后来用鼠标,再后来发明智能手机,我们知道是用五指交互,触摸屏颠覆了手机行业。
在搜索或者人机交互领域,带来问答的不是语音识别,而是语言理解。外国公司也在这么做。苹果、脸书、谷歌和亚马逊都在这么做,但苹果是第一个推出问答系统的。为什么不是谷歌?
。苹果的效果不太好。用过苹果手机的人应该都有经验回答。并不是苹果的技术不够。我更相信的是,乔布斯生前能够通过早产将这样一个系统投入市场。Ssiri系统在iPhone 4s发布。乔布斯在病床上看完这场发布会后,第二天就去世了。这项技术被发布。
我相信谷歌会在这个战场上后来居上,不仅仅是因为它的技术积累,更是因为谷歌面临的问题和搜索一样。
搜狗下一个大目标是把搜索引擎从今天的关键词系统变成问答系统。我们的系统已经逐渐上线,大概有5%- 10%的问题可以直接回答。以后会有这样的变化。
起初,我们去搜狗的目的是让表达和获取信息变得更容易。获取信息就是给出答案,表达变得更简单。用语音或文字来驱动问题是一种表达方式。
除了搜索,搜狗还有另一个核心武器:输入法。
搜索引擎公司为什么要做输入法?
输入法的表达是最重要的工具。它有什么样的进化?输入法是高科技吗?很容易从搜索公司把一些领先的技术放到输入法里。
搜狗输入法诞生的第一天是大数据的产物,那是在2006年。当年搜狗输入法为什么变得这么智能?。那时候我们还没有大数据这个词。我们会说,我们通过搜索引擎抓取整个互联网页面,放入输入法的词库,计算每个单词的词频和语法规则。今天的表达是大数据。
输入法也是云计算的产物。如果你使用搜狗输入法,当你输入时,你会发现键盘上飘着一朵小云。这时候结果就很准了。原因是我们认识到本地计算的最终结果可能不够好,所以我们会将这样的输入提交给服务器。云提供了更强大的计算和存储能力来计算和获得更高的质量。
同时,输入法也是人工智能的产物。在今年最热门的输入法功能介绍中,语音成为了非常重要的一部分。随着人工智能深入研究的突破,这项技术已经变得实用和可用。还有一个功能,图像识别功能,扫描出图像上的文字进行输入。
输入法的未来如何?
这些是终极吗?先说语音。今天,搜狗一天可以处理1.9亿次数据,这比中国所有其他语音识别公司在线语音识别的总和还要多。
我们一天的识别会产生几十万小时的语音数据,超过当今中国主流公司用于语音识别的语料库规模。除了为搜狗这样的用户做数据积累,我们还有这样的技术让语音输入更加极致,比如语音合成、声纹识别、中断处理等等。我们可能做的宣传工作还不够,但是输入法已经为用户提供了很多便捷的服务。在我心目中,这不是输入法的未来,而是现在。
未来是怎样的?我放一段视频给大家看看。这是一个概念视频,类似于今年下半年要推出的功能。出于保密的原因,这里显示的不是我们的最终功能。最后的功能比这个更神奇!
这个视频给你一个基本概念。我们不是在强调语音或者图像,而是让机器开始理解你想表达的东西,并将其转化为更丰富的表达方式。可能是一个餐饮信息,一个地图,一个百科,一首歌或者别的什么。我们将在今年下半年推出其他内容。除了分享,还有智能回复的功能。
通过这两个视频,我想表达的意思是——我记得几年前我们有过一次讨论,技术的进步让人们变得更强大了?还是更弱?我的回答很简单。如果我们把自己和科技放在一起,我们会变得更强大。
现在的90后很厉害。由于他们只有20多岁,他们可以自己订机票去岛上旅游,因为互联网已经为他们提供了技术能力。但是没有这些技术工具,我们比古人弱多了。在我心里,我相信通过技术改造人类可能会让我们变得更笨,但是当我们和技术在一起的时候,我们会变得更强。
输入法的未来不仅仅是作为表达上的工具,而是和你的结合。它知道你想说什么,知道你在回答什么。也许在未来,当人们问你问题的时候,你不需要动脑子,机器会代替你做出这样的回答。这是输入法未来需要解决的问题,通过智能处理与人有了新的契合。
关于对输入法的理解,在谈到人工智能和对话系统时,输入法是通向通用对话系统的最佳路径。很多公司都在研究对话系统,但是直到今天也没有成熟的使用场景。搜狗不仅有这样的技术积累,更重要的是我们有这样庞大的用户场景帮助我们收集数据,在改进的过程中不断迭代,这是人工智能极致中的一个制高点。
为了更容易表达和获取信息,我们需要做两件事。一种是自然交互,不仅是语音还有语义,这是自然交流。另一件事是知识计算。只有机器更智能,更懂语言,我们的搜索,我们的输入,我们的人工智能才能达到极致的高度。这是今天和大家分享的,谢谢!
技术是专注于全球TMT行业的领先信息媒体。
作为今日头条青云计划、百家号100+计划获得者、2019年百度数字年度作者、百家号科技领域最受欢迎作者、2019年搜狗科技文化作者、2021年百家号季刊影响力创作者,曾获2013年搜狐最佳行业媒体人、2015年中国新媒体创业大赛北京赛区季军、2015年辉煌体验奖季军、2015年
投稿及商务合作请联系微信微信官方账号
免责声明:本站原创文章版权归点集科技所有,转载时须注明作者及出处;本站转载文章仅代表原作者观点,不代表电子科技立场。图文版权归原作者所有。如有侵权,请联系我们删除。