Tensorflow如何使糖果挤压虚拟玩家

2022-04-12 09:46:05来源:

模拟人类游戏玩家使糖果粉碎开发人员King能够加快释放循环。

DeepMind的AlphaGo深度学习算法的演变是移动游戏开发人员King的启示,以使用Google的Tensorflow建立游戏播放器的模拟。

Alphago在2016年击败了World Champion Lee Sedol。为了模拟Go的古老游戏,Alphago需要一遍又一遍地玩游戏,应用一种称为蒙特卡罗搜索的技术,它使用深度神经网络来“学习”是什么最佳的游戏移动。

当时,人工智能(AI)研究员Demis Hassabis,DeepMinds的联合创建者,谷歌在2014年获得的,描述了使用数据流图(例如TensorFlow)的数字计算的开源库允许研究人员有效地部署所需的计算用于多CPU或GPU的深度学习算法。

据Github的2018年报告称,Tensorflow是2018年最受欢迎的开源项目。

国王的团队希望看到alphago使用的一种技术可以应用于使用tensorflow的糖果粉碎。但为什么要模拟游戏?

仿真是公司驱动器的关键部分,以便快速测试和释放新的糖果水平。挑战国王想解决是如何加快游戏测试人员完成的工作,以评估其发布前的新糖果粉碎水平的难度。

亚历克斯Nodet,国王的AI工程师说:“我们曾经有过游戏玩家播放相同的水平20次并写一份报告。但这花了大约一个星期,我们希望能够每周发布15个新的水平。“

底线是:King越多可以测试,它可以释放越多。但是测试游戏游戏传统上是由人类完成的 - 它很慢。

为了解决这个问题,三年前的Nodet表示,三年前开始了一个研究项目,开发了使用Tensorflow建造的机器学习应用程序,可以测试使用机器人运行模拟的可行性,以便在扫描糖果粉碎的新程度才能玩。

了解需要解决的问题大约需要六个月,并使用受监督学习使用糖果粉碎游戏玩家的Tensorflow创建机器学习模型。Tensorflow有一个陡峭的学习流程,但深入了解框架工具的能力远远超过了深度学习。

“我们做了很多实验,让它更接近真正的球员并改变了建筑建造一个真正的球员,”Nodet说,并补充说公司需要经过大约20个模型的迭代来到达它的位置用于其预期目的。

在NODET的经验中,大部分时间在机器学习项目上花费实际上没有花在调整机器学习模型。相反,困难的部分是将数据放入正确的格式,然后将其转换为可以使用的东西。

国王发现,在开发新的深度学习模型的许多时间和精力涉及数据清理,数据标签和数据编组。

但是仅在等式的一部分中训练数据。“拥有训练有素和学习的机器学习模型只是工作的一半,”King机器学习工程师菲利普·埃森说。

Eisen表示还有必要考虑机器学习在生产中的工作原理,因为机器学习数据是对任何模型的整体性能产生巨大影响的东西。“他必须将一流的公民视为网络架构和培训算法,”他说。

国王团队使用云部署经理部署Google Kubernetes Engine工作负载,以创建数百名虚拟播放器,为机器学习模型培训。nodet说:“我们的缩放功能不够动态,谷歌Kubernetes Engine可以解决这个问题。在开发AI应用时,谷歌云机学习引擎也是一个很大的补充。“

由此产生的数据与云PUB / Sub,Google的公共云的消息中间件被送回国王的数据分析模块。这将创建反馈循环使MING能够优化其游戏的设计,以确保基于实体数据的基础,确保新的级别不太容易或太难。

“我们能够将我们的原型转换为人们想要使用的生产规模支持工具,”Nodet说。

根据Nodet,使用机器学习,缩减在Google的G-Cloud上,现在可以在仅需五分钟内完成对新糖果粉碎水平的反馈。


返回科技金融网首页 >>

版权及免责声明:凡本网所属版权作品,转载时须获得授权并注明来源“科技金融网”,违者本网将保留追究其相关法律责任的权力。凡转载文章,不代表本网观点和立场,如有侵权,请联系我们删除。


相关文章