◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。
薄言创始人李明,加拿大皇家学会院士、滑铁卢大学教授、现代信息论奠基者、国家“千人计划”专家。2010年获得加拿大顶级国家科学奖Killiam Prize。他是研究Kolmogorov复杂性的权威专家,在研究机器学习,算法平均复杂度、信息距离,和生物信息学方面做出了重大贡献。薄言创始人李明出席了由葡萄创投主办的2017春季人工智能产业峰会,并做出了《让机器人聊天更自然》主题演讲。
以下为李明演讲实录:
智能是什么?
现在呢咱们这个会是关于人工智能的,人工智能到底是什么?在1958年的时候,咱们这些先驱们定义了人工智能,人工智能是说用机器来模拟Homo erectus,如果有这个定义的话,现在图像识别还是吗?自动驾驶还是吗?走路还是吗?这些是没有智能的。Homo Sapienc是有智能的。
这个智人和直立的人区别是什么呢?其实不是工具,工具是咱们社会主义教育说的,实际上是语言。我给大家举个例子,这是块石头,在两百年之前直立人用的工具就是这些石头,发展的特别特别慢,因为?因为他没有语言,传承起来非常难,爸爸教给儿子这个石头要这么凿,没有语言的话,技术的进步改革和传承就非常困难。所以这个石器时代的工具,直到人类出现语言以后,进步的非常非常快了。所以直立人是没有复杂语言,那么简单的语言,手势什么的有,但是没有复杂语言。智人学会了语言,才有了智能。
人工智能的核心
人工智能的核心是语言,说话。那么我们要做人工智能,要先学会说话。当然其他的开车啊这都不是人工智能,但是我觉得如果我们要做好人工智能,最核心的工作是要让机器学会说话。
第一轮的对话
第二轮的对话是下一步做,现在薄言豆豆第一轮对话可以了,当然第一轮对话需要趣闻性,而且需要有鲁棒性。大家看这个例子,这就是鲁棒性,不管你怎么说,我回答的总是正确的,这是机器回答,这是在做实验,我说我渴了,机器说喝水。我说我有点渴了怎么办?机器说多喝水。我瞎说了,机器还说多喝水。然后我接着来,我中国有点渴了怎么办?瞎加字了,还多机器,北京渴了怎么办?王老吉,这不是做广告啊,真说王老吉。我就瞎加字了,瞎说了,仍然告诉我喝点水。我说好,我改了一个字,我说蝴蝶我北京有点饿了怎么办?它就说你吃东西吧。
这是第一轮对话。第二轮对话怎么办?要想对话更自然,做深度对话,还需要几件事。我的回答还需要非常鲁棒性,我不能说我说你好,我永远说你好,我永远说一件事,人在不同的场合,不同的情况,不同的时间你问我同样的话我回答不一样,我不可能老说一样的东西对不对?这个事情也必须得解决。现在我们公司也在做研究,希望对抗神经网络来生成不同的回答,同样的语义不同的回答。
多轮对话
多轮对话就是刚才王卓然,三角兽的CEO,他在讲,一半是一轮对话的东西,30%是因为上下文,所以你要想做好多轮对话,一定要把上下文解决。当然还有其他很多问题,一定有很多推理啊、情感啊、记忆啊,这种总结啊。这种事情以后再说吧,现在一步一步来。
那么多轮对话上下文怎么办?我们就做了一些分析。上下文呢,大概是这样的,这种上下文有15%是指代的,比如说曹操是谁?然后下一个就问他是什么时候死的?第一句问曹操是谁?人家说曹操什么时候死的。这个时候显然他是曹操,你需要把曹操给代起来,大家如果用薄言豆豆的话,你可以问曹操什么时候死?但是你要分开说他是怎么死的?它肯定不知道了。
有35%是省略恢复,比如说我脚崴了,那你怎么办啊?那怎么办?这句话意思是说我脚崴了怎么办?假如你问薄言豆豆你说我脚崴了怎么办?它回答的非常好,上医院或者怎么着。但是你要分两句话说它就不会了,这个时候要解决这个问题。
承接递进
这种事情我们也可以解决,今天只讲一个,解决指代的问题。比如说曹操是谁?或者什么时候死的?这个你可以重写曹操是什么时候死的?豆豆会回答。但是有各种各样的表达方式,就刚才王卓然讲的,没有数据没法去训练怎么办?我们的办法呢,就是我们造数据,怎么造?我们自己有很多大量的问题,比如说曹操是什么时候死的?诸葛亮什么时候死的?孙权什么时候死的?你把所有的,把曹操换成他就好了,就有大量的数据,但是问题是在数据里头不是那么简单的你都可以这么换的。所以因此我们就做了这么一个代入点寻找的这么一个深度学习网络。
这个网络从句子开始在做短语的表示,词的表示,句子的分析。这个就做出来这样的东西,比如说名字POI、地址,它能训练出,有非常高的准确率。然后让机器学会,如果上面有曹操是怎么死的?曹操是什么时候生的?曹操是谁?他什么时候死的?我们就知道这个他是可以被指代。有时候不是所有的他都可以被指代的。比如说曹操什么时候死的?这个他不要再替代了。所以呢其实是非常非常复杂,人的自然语言的表达方式是非常非常复杂的。
聊天机器人的商业模式
刚才大家讲聊天机器人的商业模式,现在有很多人表示机器人本身没有在线的模式,但是其实人工智能的核心刚才我在讲是说话,说话一定要说好,聊天一定要聊好,聊天聊好了说话说好了才可能去做这些汽车、客服、智能家居、教育。我举个例子,我在加拿大教数学教好多年了,但是我的英文肯定不如街上要饭的,为什么?就是因为我不是在加拿大生长的,我的英文是学来的。但是英文不是要学的,英文是要在你的环境的成长里长大的。最好的办法是在这个环境里自然就学会,你要去学永远学不会。那么怎么给他一个环境?或者到美国去、加拿大去,或者家里有收听人,爷爷奶奶跟你说英语,有个很简单的办法,把薄言豆豆带到你们家去说英文,当然现在还没有说这么好,机器人如果他能说英文,创造英文环境,主动跟大家说英文,那就是一个挺好的市场。
另外就是我自己学的,只做垂直是非常短视的行为,我们薄言呢,我们觉得这个垂直领域其实应该用户去做。用户怎么做呢?用户做了我们做什么?我们有一个平台,有一个语法,用户只要学自然语言就好了,用户写了自然语言,你想卖什么也好?你想做什么客服也罢,做什么垂直搜索也行,就用语言写,用中文写。写完了以后,我把它去推广,然后把它变成非常有意义的,通过一个短暂跟用户的互动过程,就让用户生成一个不用写自然语言程序,而生成一个自然对话的这么一个垂直领域。
(来源:中访在线/作者:何芳)
责任编辑:文禾
支付宝
微信
◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。