AlphaGo对软件测试有何启发?

发表于:2016-11-02 10:26

字体: | 上一篇 | 下一篇 | 我要投稿

 作者:李学平    来源:51Testing软件测试网采编

  1、Alphago 简介
  AlphaGo(阿尔法围棋)是一款围棋人工智能程序,由谷歌Google)旗下DeepMind公司开发完成。这个程序利用“价值网络”去估算局面,用“策略网络”去选择下子。
  2015年10月阿尔法围棋以5:0完胜欧洲围棋冠军、职业二段选手樊麾;2016年3月对战世界围棋冠军、职业九段选手李世石,并以4:1的总比分获胜后而风靡全世界。
  2、Alphago 工作原理
  AlphaGo主要工作原理是“深度学习”:包含离线学习和在线对弈两个过程。
  >>>> 离线学习
  离线学习过程分为三个训练阶段。
  1) 第一阶段:利用3万多幅专业棋手对局的棋谱来训练两个网络。
  一个是基于全局特征和深度卷积网络(CNN)训练出来的策略网络(Policy Network),其主要作用是给定当前盘面状态作为输入,输出下一步棋在棋盘其它空地上的落子概率。
  另一个是利用局部特征和线性模型训练出来的快速走棋策略(Rollout Policy)。
  策略网络速度较慢,但精度较高;快速走棋策略反之。
  2) 第二阶段:通过自我对弈增强学习,最终得到增强的策略网络。
  3) 第三阶段:利用增强的策略网络来完成后面的自我对弈过程,直至棋局结束分出胜负。此后,以当前盘面作为特征输入,胜负作为label,学习一个价值网络(Value Network),用于判断结果的输赢概率。
  通过大量的自我对弈,AlphaGo产生了3000万盘棋局,用作训练价值网络。
  >>>> 在线对弈
  在线对弈过程包括以下5个关键步骤:其核心思想是在蒙特卡洛搜索树(MCTS)中嵌入深度神经网络来减少搜索空间。
  1) 根据当前盘面已经落子的情况提取相应特征。
  2) 利用策略网络估计出棋盘其它空地的落子概率。
  3) 根据落子概率来计算此处往下发展的权重,初始值为落子概率本身(如0.18)。实际情况可能是一个以概率值为输入的函数,此处为了理解简便。
  4) 利用价值网络和快速走棋网络分别判断局势,两个局势得分相加为此处最后走棋获胜的得分。
  这里使用快速走棋策略从被判断的位置出发,快速行棋至最后(自我对弈),每一次行棋结束后都会有个输赢结果,然后综合统计这个节点对应的胜率。
  价值网络只要根据当前的状态便可直接评估出最后的结果。两者各有优缺点、互补。
  5) 利用第四步计算的得分来更新之前那个走棋位置的权重(如从0.18变成了0.12);此后,从权重最大的0.15那条边开始继续搜索和更新。
  3、AlphaGo对测试的启发
  测试与围棋有众多相似之处,很多原理与AlphaGo相似相通。AlphaGo对作者在测试方面的启发有很多,但是主要是以下两点:
  >>>> 深度学习
  深度学习是近年机器学习领域的重大突破,有着广泛的应用前景特别是在人工智能领域。近年来在语音识别、图像识别等领域均取得了突破性进展。
  AlphaGo是基于3万多幅专业棋手对局的棋谱来训练策略网络和快速走棋网络,并且通过深度学习以及大量的自我对弈去增强策略网络,而且产生3000万盘棋局以创建价值网络。
  测试也是类似。除了学习基本的产品知识,行业知识和测试技术以外,也需要学习他人的经验教训,通过一定的探索实践和改革创新,建立适用于自己的知识体系和经验数据库
  因此这里的深度学习的基本概念是:在理解基本知识的基础上学习者能够批判的学习新的思想和事实,并把它们融入原有的认知结构中,能在众多思想中进行联系,并能将已有的知识迁移到新的情景中去,并作出决策和解决问题的学习。它鼓励学习者积极地探索、反思和创造,而不是反复的记忆。
  >>>> 对弈过程中对落棋精度和速度的平衡
  策略网络速度较慢,但精度较高;快速走棋策略反之,效率高但是精度偏低。AlphaGo正是充分利用两者的互补性,在精度和速度之间找到一种平衡,保证赢棋的情况下尽快下棋。
  测试也是类似。测试过程中需要对测试质量,测试时间和测试成本进行一定平衡,以便最大限度地发挥测试的价值.
21/212>
《2023软件测试行业现状调查报告》独家发布~

关注51Testing

联系我们

快捷面板 站点地图 联系我们 广告服务 关于我们 站长统计 发展历程

法律顾问:上海兰迪律师事务所 项棋律师
版权所有 上海博为峰软件技术股份有限公司 Copyright©51testing.com 2003-2024
投诉及意见反馈:webmaster@51testing.com; 业务联系:service@51testing.com 021-64471599-8017

沪ICP备05003035号

沪公网安备 31010102002173号