本篇文章1749字,读完约4分钟
工作室场景
4月8日一大早,据报道,“冷扑大师”对中国龙队德州扑克人机对战大赛第二天在海南生态软件园传奇智能体育馆落幕。全天共握8400手,龙队共输了347565分,与冷闯大师大相径庭。
4月7日下午,创新工场创始人兼董事长李开复做客新浪实训室,向大家讲述了他所看到的德德人机大战以及人工智能技术在未来的应用前景。
以下是新浪科技根据李开复博士的话所做的总结:
就像阿尔法戈打败了世界冠军一样,德普的人工智能程序天平动也打败了美国顶尖选手。
人类第一次失去了10,000多点,第二次失去了50,000点,第三次失去了120,000点。我们可以看到第一次几乎是平等的,代表中国派出的球员非常强大。然而,在玩完每一个部分后,“冷扑大师”会学习机器,并根据每个玩家的弱点调整自己的参数。因此,在比赛的第一天下午,他被改造成六个“冷大师”,根据每个玩家的弱点调整参数,从而将差距拉至50,000;在第三场比赛中再次学习后,他以12万领先。
我们可以看到,机器的自我调整是非常强大和可怕的。
“冷普大师”是如何学习与德国作战的
事实上,“冷急大师”和阿尔法戈还是有很大的区别的。
冷普大师从来没有学习过人类的牌谱,但是阿尔法戈从人类的牌谱开始,然后自我提升。这位“冷扑大师”几乎是从博弈论加上德州扑克的规则中,不断推动自己的算法前进。因此,每次他下注或做决定时,他都会做出对自己最有利的判断。这个判断做出后,不管人类如何反应,对“冷扑大师”来说已经接近最佳状态。而且,“冷普大师”会不断优化自己的打法,让对手猜不到,但他能猜出人类的应对方式。
如果你揭开“掷冷大师”的盖子,你会发现它实际上是一个巨大的数据库,存储着所有牌的排列组合,以及如何在立即排列组合下找到平衡点,这样对手就猜不到你有什么牌。
所以归根结底,它仍然是一个庞大的统计系统。
人工智能能向人类隐藏信息吗?
从“冷普大师”的表演来看,他是在隐藏信息,但实际上,它是由人类传授的。如今,人工智能的所有工具,无论是机器人(300024,购买)、无人驾驶、阿尔法机还是“冷突袭机大师”,本质上都是人类编写的代码和人类控制的工具。因此,他们处于人类的控制之下,人类不自觉地操纵自己来隐藏信息。他们显示隐藏信息的原因实际上是他的程序员让他这么做的。所以不要太担心机器人将来会欺骗我们。
与围棋相比,我们可以看到围棋是黑白棋盘,是完全开放的,而不是隐藏的。我们可能会问,真正的应用在哪里?需要明确的是,人们的真实应用很少被曝光,而德普可能更适合你买房——价格是900万,而你心里期望的是850万。你应该付700万然后慢慢增加吗?还是你只出价840万却拒绝提价?
说到这,我们发现商务谈判实际上与德普非常相似。这也意味着德国可以克服商业谈判中的一些问题,甚至是政治外交和国际关系中的问题,并帮助人类在未来做出决定。
“冷大师”会用尽所有的可能性
“扔冷大师”不断地评估他自己和对方反应的所有可能性,以及下一张牌发行的所有可能性,并不断地推进。
一方面,德州扑克本身的搜索范围相对较小,所以“冷闯大师”可以穷尽所有的可能性。他要做的是平衡人类不同的游戏风格,以及如何选择一种让人类感到左右为难的游戏风格。最终的目标是优化对手犯错的可能性,让他们自己得到更多完整的代码。例如,如果两个人玩石头、剪刀和纸,如果你使用任何策略的概率不是三分之一,那么对方会发现你的弱点。
事实上,除了阿尔法戈和“寒流大师”,我们现在被人工智能技术所包围。百度、淘宝、滴滴、今日头条、智虎等公司在为用户服务的过程中应用了人工智能技术。
此外,人工智能的应用场景包括金融领域、医学领域、语音识别、人脸识别等。我预测在十年内,人类50%的工作将被机器取代。
我希望人类玩家能赢得一场比赛
目前,在两天内的四场比赛中共有15600手牌,龙队落后412702点,平均每100手牌损失26.2倍大盲注。龙组和“冷大师”的分数差别很明显。
情况越来越糟,因为机器在不断地学习,当然,人类也在不断地学习。但是很明显,机器学习更快,所以我预测差距会扩大。
在阿尔法戈对李世石的比赛中,人类玩家最终赢得了一场比赛,这也拯救了人类的尊严。我希望在接下来的七场比赛中,我们的中国德国摔跤手也能赢一场。
标题:李开复点评德扑人机战:AI会向人隐瞒信息?
地址:http://www.9u2j.com/wnylyw/15069.html