20070723/赌神今斗电脑争啤牌王 被视为人类取胜最后机会

【明报专讯】人工智能(AI)发展一日千里,在强调理性思考布局精密的国际象棋对弈上,人脑已屡败给电脑,如今就连对局更千变万化、更讲心理战的“话事啤”,电脑也大有机会胜过人脑。“美国赌神”拉克(Phil Laak)今天起一连两日,会与阿尔伯达大学设计的扑克程式来一场“人机啤王争霸战”,对赌2000局,若电脑战胜,势将标志人工智能发展迈向新高峰。

国际“先进人工智能协会”今天起在温哥华举行周年研讨会,而这场号称“全球首次人机话事啤锦标赛”的比并,正是研讨会期间的焦点。美联社指出,由于电脑程式的赌啤技术日渐精湛,今次对决已被视为人脑操啤战胜电脑的最后机会。报道引述业界人士说,业余扑克玩家目前已无法与电脑匹敌,估计随?人工智能不断改进,不用10年,即使是职业界的一代赌神,也要向电脑俯首称臣。

在今次人机争霸中,赌神拉克将要迎战的,是阿尔伯达大学电脑程式研究小组炮制的超级电脑程式“Polaris”。它曾于06年的“先进人工智能协会”电脑程式话事啤比赛中夺冠。事实上,由该大学电算科学系主任谢弗教授领导的人工智能研究小组,国际上极之有名。谢弗教授上周才宣布,他们研制出无敌的“奇努克”(Chinook)西洋跳棋电脑程式,程式能依据西洋跳棋全数“5万亿亿”可能步法组合,准确下棋,永远不败。

今次人机对战,将以美国赌场现时最流行的“得州话事啤”玩法进行(详见另稿)。主办单位安排拉克跟拍档伊斯拉米一起上阵,他们于今明两天分别在两个隔绝的房间,跟两套原则上各自独立运算的Polaris,进行一共4节的比赛。研究员说,为排除运气因素,伊斯拉米所持的牌,将是拉克所面对的电脑的啤牌;拉克所持的牌,则是伊氏所面对的电脑的啤牌。

拉克和米氏,跟两部电脑初时都会拥有相同的注码,若最后拉克与米氏手上的筹码总数,“明显”多于两部电脑之和,则判人脑胜,二人可共分享5万美元奖金,反之则为电脑胜;若双方差距小,则判“打和”。

在国际象棋等游戏中,人脑几乎已非电脑敌手,因为这些棋局都按既定形式展开、按既定规则下子,下子的可能性虽极多,却非无限,理论上电脑可推算出对手一切下子的可能,从而选出对电脑最有胜算的一?。IBM电脑“深蓝”1997年击败前棋王卡斯帕罗夫,就是凭这道板斧。

但相比下扑克却存在大量不明朗因素,令上述的板斧失去作用。电脑专家诺尔说:“你不可能掌握牌局进行期间的一切资料,例如对手的底牌。这意味当对手有什么举动,你都难以确定原因。”然而,正因为这个资讯处理上的缺陷,反而令人工智能专家近年对研究话事啤愈感兴趣。

谢弗教授的研究小组说:“今次研究和比赛的总体目标,是了解如何处理涉及不明朗和不完全资讯的电脑运算问题,但具体目标,是发展出一套比任何人类玩家更强的话事啤程式。”

超级程式Polaris 懂找对手弱点

与国际象棋等不同,玩话事啤,牌局没有所谓最佳的对策,甚至没有最佳出牌策略,相比其他棋艺游戏,电脑程式员较难调校电脑如何玩好话事牌。

话事啤顶级高手会不断调节出牌方式,同时揣摸对手牌路;但电脑专家难以将这种洞察力列入程式,也不能硬定若干规矩,让电脑依样葫芦,因为若对战的人类是高手,就定可看出个中规律。

举例说,若硬绷绷指示电脑应按手头啤牌的好坏决定下注和去牌,结果玩家很易就能洞悉,并针对地调整策略和下注方法,这亦是拉克两年前在赌城击败电脑Poker Probot的关键。

那么Polaris今回能否打败人类?电脑专家谢弗教授甚有信心。他说经“特殊调校”后,Polaris已能像人脑一样“学习、调整和找出任何对手的弱点”,比Probot强得多。

理论上,程式员可用博弈理论(Game theory),去补救“资讯不完全”的弱点。以猜“包剪槌”游戏为例,按照博弈论,最佳长线策略是随意兼平均地出包、剪或槌(累计出现次数要大致相同)。若你依照一定模式来玩,或长时间偏向某一项,便会被对手摸熟,不能取胜。

话事啤当然较“包剪槌”复杂,但原理一样,就是说电脑必须不时改变玩法来扰乱对手,令对手不能摸清电脑牌路。

惟博弈论亦有其限制,因在理论中,长远而言,所谓“成功”并非指“胜出”,只是确保不输。而要电脑玩扑克玩得出色,还须“鉴颜辨色”,很多传奇赌神都能凭对方小动作来猜度对方的牌;电脑当然不能观察对方,却可留意到对手牌不好时虚张声势及盖牌的次数,把这些资讯包括在内。这亦是Polaris一个强项。

玩得州话事啤 近年热爆

今次“人机对战”所玩的话事啤,是近年在美国赌场极受欢迎的“得州话事啤”(Texas Holdem)。它是传统话事啤的一款变种,于20世纪中出现,最初只有很少拉斯维加斯赌场有这种玩法,直至近几年由于成为世界扑克巡回赛(World Series of Poker)的指定玩法,加上美国电视台的转播吹捧,令它风头一时无俩,在美国赌场的受欢迎程度,甚至胜过传统话事啤。

得州话事啤最特别之处,是有所谓“公家牌”(community cards)。在多人赌局中,每个玩家会轮流做庄;每人(包括庄家)先获派两张“底牌”,之后庄家会先后揭开5张“公家牌”,每个玩家都可选择其中3张,与自己2张“底牌”配成一组5张,拥有最强牌面者胜出(详见上图)。

在落注规则方面,得州话事啤包括有设上限和没设上限两类,今次“人机对战”采用的,是有上限的玩法。

由于每个玩家一开始只有两张牌,“公家牌”都是共用的,这就令到数学家较有法子透过数理推算,给这款话事啤玩法作“最佳策略分析”,指示电脑“作战”。

Leave a Comment