王小川 文|扬子晚报记者 徐晓风
中国江苏网5月22日讯他是所有爸妈心目中“别人家的孩子”,这位清华学霸从小学习优异,拿到的大大小小各类竞赛奖项无数;他是互联网业界的钻石王老五,27岁就当上了搜狐高级副总裁,现任搜狗CEO,曾声称搜狗就是自己的“老婆”……这是一次反射弧很长的采访,缘起于去年世界互联网大会期间,记者在乌镇内一家小店邂逅王小川后的简单餐叙,一直到不久前的博鳌亚洲论坛。这位搜狗掌舵者留给记者的印象是他始终散发着强大的自信和对未知领域的狂热探索欲望。
“有个很著名的自媒体人问我,搜狗要转型做AI(人工智能的英文缩写)了?我听了一肚子火。因为搜索其实就是AI,它就是让机器像人一样去思考,越来越聪明的搜索引擎能够帮我们选择出更好的页面来。百度集团总裁兼首席运营官陆奇就放出一句话,说搜索是AI最好的场景,搜索和AI是天生在一块儿的。”
不管是在乌镇水乡小店的长条餐桌上,还是在搜狗发布2016年全年和2016年Q4财报的访问现场,或者是前不久举办的博鳌论坛上,王小川跟记者聊得最多的都是人工智能。2月21日公布的财报显示,2016年全年,搜狗营收44亿元人民币,已经连续12个季度实现了持续盈利,把自己最美好的18年青春年华都与搜狗绑在一起的王小川感慨“搜狗搜索活下来了”,也开始秀搜狗与AI的“二三事”。
说到搜狗的AI,其实最近大家很熟悉的就是2017年2月6日,耗资4000万打造的搜狗问答机器人汪仔登录江苏卫视的《一站到底》。在人类获胜选手领先3分的情况下,汪仔最终完胜哈佛女学霸。“搜索的未来将走向问答机器人。用户的搜索行为会从输入一个关键词,变成表达一个完整的句子,让机器找出其中的含义,同时,搜索引擎返回的内容,也将从简单的10条链接转向直接给出答案或者是建议。”王小川如是说。而搜狗汪仔无疑是“问答机器人”这一理念的具象形态。搜狗汪仔背后依靠的是基于人工智能技术的搜狗立知问答系统,这个搜狗研发的面向未来的搜索技术,在理解用户的问题或信息需求后,利用海量网络信息及大规模知识库,能够直接给出答案,背后蕴含了语义分析,问题理解,信息抽取,知识图谱,信息检索,深度学习等众多技术。
学霸出身的王小川回答记者问题时也略带着学术味儿,不过对于汪仔的能干,他举了个简单的例子:以前机器人和人比赛,要求是全部说完才能抢答,可是《一站到底》里只要主持人开始念题,在任何时间点都可以去答,这代表高手可以预测题并抢答,对人工智能机器人来说就非常难,比如节目组派了顶尖选手来做测试,一个题目说“《鹿鼎记》中哪一种毒药……?”提到这个问题的时候,人已经答了,题还没问完呢。所以如何判断问题并且去推测、抢答,汪仔背后是有综合的技术挑战。
参加了江苏卫视另一个王牌节目《最强大脑》的百度机器人小度现在也正当红,与汪仔同样粉丝无数,王小川对此并不回避:“大家可能都想看百度小度跟搜狗汪仔比几场,这是不可避免的事,这个场景也是挺好的。”
“去年六月份,我去了英国伦敦,和开发阿尔法狗的工程师做了交流,我特别好奇的事情就是机器输掉的那一局到底发生了什么事情?他们说不是程序有BUG,就是深度学习本身有瓶颈。围棋比赛是三月份,我是在六月份去的伦敦,已经过了三个月,这个问题依然没有解决。但是我离开以后一个星期,他们的程序就能够正确面对之前输掉的那一局棋谱,我问他是否这个BUG修好了,工程师说没有,只是代表那一局那个特定问题,正好机器可以解决。但依然不知道在什么情况下,阿尔法狗会继续出错。所以深度学习这样一个体系其实还是有瓶颈在的。”
去年11月份,王小川在乌镇世界互联网大会上展示了实时机器翻译技术,该技术可将演讲者的中文同步翻译成英文并实时上屏,被现场同声传译的翻译戏称为职业终结者。不过在展示自己新技术的同时,王小川聊得更多的还是:以深度学习为代表的今天的人工智能技术,还有哪些不靠谱的地方?在产品上不适用之处有哪些?
拿语音识别来说,王小川表示现在技术在安静的环境里面识别准确度已经到了97%,但是一旦有噪音,准确率就会迅速下降。研究人员把汽车的引擎噪音、风的噪音等等也加入了机器学习系统,但是如果碰到两个人在说话,同声传译的机器又该怎么分辨?对于人来说,只要有细微的音色等差别就能够把其中的一个声音识别出来,和机器在处理过程当中有巨大的不同。
“另外一件事情是语义靠谱吗?”王小川说,去年自己在一个实验室看到最先进的人机对话系统,这个系统可以帮你订餐订酒店,对话过程当中机器的表现非常惊艳,比如有一个环节,机器问你:“你是需要停车位还是不要停车位?”这个时候我们回答要或者不要都没问题,可是如果回答“我没车”,问题就来了:因为机器完全不理解我没车代表着我不需要停车位。所以很多对于人来讲非常好理解的东西,对计算机的挑战却非常大,这是深度学习人工智能还不够的地方。
王小川还跟记者提到了一个很敏感的问题:无人驾驶靠谱吗?去年被炒得很热的无人驾驶汽车,在王小川看来,确实在特定的或者封闭场景中都可以使用,但是对于真正开放的复杂的道路环境,技术还不成熟,也有可能会犯严重的错误,“就像AlphaGo下棋一样会突然发疯”,所以作为辅助驾驶是可以的,真正无人驾驶目前还做不到。
翻开王小川的履历,被称为天才一点也不夸张,1978年出生于成都的他,从小就是学霸,还是那种还没参加考试就被特招走的顶级学霸。中考,高考、研究生考、博士考,几乎人生每个最重要的考试节点,他不是特招就是保送,根本没机会坐考场,还一路拿下无数大大小小、国内国外的竞赛大奖,几乎慕煞一票头悬梁锥刺股的学子;步入职场,还是实习生的他就为老板赚了2个亿,27岁就成为了搜狐最年轻副总裁,如今身为搜狗CEO,公司估值甚至超过了350亿……
在互联网业界,有很多王小川的传说,比如别人都把自己创业的公司比作儿子,可是他却说搜狗就是自己的老婆;比如据说包括网易的丁磊、百度的李彦宏等诸多互联网巨头都曾来挖他,可是谁也没挖走,最后一直到了2013年,马化腾拍板投资4.48亿美元战略入股搜狗,还把旗下搜搜业务直接交给了王小川来做。
学霸出身的王小川不但是个工作狂,还是个技术狂。他告诉记者,现在机器能够像人一样听懂东西了,会下棋了,会做面部识别了,但是自己特别想看看人的极限是怎样的。比如之前《最强大脑》的水哥,他的眼睛比常人厉害很多,于是自己做搜狗输入法的时候就会想,除了做语音识别之外,是否可以基于视觉可以做唇语的识别,看你的嘴唇怎么动就能识别你说什么?“当我把这个课题和工程师讨论的时候,他们表示这个太难了,人都看不懂。这时候我们就跑去找水哥了,问他你觉得这个唇语识别能做到吗?水哥说‘当然’。我拿到这个消息就跟我们团队讲,你看,人是可以做到的。”所以王小川坚持认为,再难的事情只要技术足够好是可能解决的,是我们的技术不够,而不是这个题目不对。
快问快答
X=扬子晚报记者 徐晓风
W=王小川
X 一个最常被提到的问题,你认为人工智能会把人干掉吗?
W 我不认为机器能把人干掉。创造生命太难了。我们有时候会高估人工智能现在的能力,开始想象人工智能是否会威胁人取代人,这是不存在的。但凡你和一些比较严肃的做学问的人聊的时候,大家都会不断给你降低这里面的预期。
X 你以前曾举例说,阿尔法狗看着很厉害,但如果把棋盘多添一个格子,可能就出了它的逻辑范畴了,有可能打败它?
W 对,它得靠人的传统经验来训练。但凡操作经验或者是数据量不够,这个时候人是可以靠推理和思考来解决,但机器就不行了。人作为一个生命,有对环境的适应能力,还有自我的繁衍能力,机器远远做不到。机器现在没有生命,我们也没有打算赋予其生命权,我们今天关一台电脑说关就关了,也没有想这个电脑不高兴了。换句话说,想造一个让你害怕得想关掉它的机器,现在我们的能力也不够。
X 我们用过一些翻译软件,尤其是一些学术上的东西,结果翻译出来很可能句子的架构、逻辑完全不通,还不如自己从头来写,现在人工智能的翻译水平如何?
W 我原来在研究生里学过科技英语,非常严谨,折腾得很,句子又臭又长,每个词性都巨复杂,现在机器已经能够在这个架构里轻松帮你解决掉。
X 你参加了一些科技的综艺秀,现在其实很多大佬都会干这件事,但是你还没有做过直播吧?你感兴趣吗?
W 我还没做过,我不感兴趣。
X 你觉得中美之间在人工智能领域的差距是什么样的?
W 我觉得基础研究上差距巨大。国外很多科学家真的能够发明新的算法和新的体系结构来解决人工智能的问题,我们基本是看论文,看谁能够最快把论文的这些东西用到我们系统里去。我给你个数据,全球前十大互联网上市公司,中国占了4家,但全球前100所高校,中国只有两家,一个清华一个北大,在这种研究能力上差距是巨大的。