雷锋网注:图片来自DeepMind。
众所周知,强化学习(Reinforcement Learning)是一种人工智能训练技术。
无论是在棋牌游戏中击败人类玩家的机器人,还是在训练自动驾驶系统中,强化学习都发挥着作用。
发挥着至关重要的作用。
最近,Alphabet 旗下的 DeepMind 发表了一篇由 27 名研究人员共同撰写的论文,详细介绍了一个名为 OpenSpiel 的游戏强化学习框架——这正是 DeepMind 的强项所在。
OpenSpiel 有什么了不起的?这个名为OpenSpiel的框架可以看作是强化学习环境和算法的集合(其中大部分已经经过充分测试),可用于一般的强化学习研究和游戏搜索/规划研究;它还提供了用于分析学习动态和其他常见评估指标的工具。

雷锋网在论文中发现,OpenSpiel旨在在许多不同的游戏中推广多智能体强化学习,重点是学习,而不是竞争;而且,框架的构建基于两个重要标准,即简单性和轻量级——简单主要体现在编程语言上,即使是不同领域的研究人员也能轻松理解;轻量级体现在OpenSpiel将依赖关系保持在最低限度,减少了出现兼容性问题的可能性。
截至目前,OpenSpiel框架中包含了28种游戏和24种算法。
正如“Spiel(棋盘游戏)”一词所暗示的那样,该框架支持相关游戏;而且,这些博弈还包括多种博弈方法,如正和博弈、零和博弈、协调博弈和一般博弈等。
在编程语言方面,OpenSpiel的游戏是用C++实现的,算法是用C++和Python实现的,部分代码也被移植到了Swift。
不过,DeepMind 研究人员指出,OpenSpiel 仅在 Linux 系统(Debian 10 和 Ubuntu 19.04)上进行了测试,但由于代码在 MacOS 和 Windows 上免费提供,因此在这些平台上编译和运行时不应该出现 OpenSpiel。
问题。
如何安装OpenSpiel?论文中,DeepMind还提供了OpenSpiel的安装方法。
他们在 Debian 和 Ubuntu 两个 Linux 系统上测试了该框架。
安装方法如下: 值得一提的是,DeepMind 尚未在 Linux 以外的平台上测试 OpenSpiel,因此部分脚本和指令目前假设基于 Debian 的发行版(Debian 和 Ubuntu)。
如果您使用的是其他Linux发行版,install.sh中安装依赖的命令仍然可用,但安装命令需要自行修改。
为了能够从任何位置导入 Python 代码,请将根目录和 open_spiel 目录添加到 PYTHONPATH。
按照上述步骤构建 OpenSpiel 后,从构建目录运行示例。
接下来,您可以在框架中看到游戏列表并运行游戏。
站长声明
版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件
举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。
相关文章
-
“那是黄昏之后,理想让少年的头都白了。 ”前一天晚上参加了《乐夏》演唱会的梁龙,第二天就搬到了京东直播间,开始弹唱《月牙五更狂想曲》。 10月23日晚,多名明星主播走进京东福利超播直播间带货。 带货间隙,梁龙和宝石老九也唱了几首歌。 “龙阿姨有点矜持。 ”梁龙在直
06-18
-
在宽阔的海边,有时能看到这样晶莹剔透的石头。 其实它们并不是石头,而是长期经受风吹日晒、海浪侵蚀的玻璃碎片,所以有人称它们为“海玻璃”。 ▲图片来自:Unsplash 作为一种无机物,玻璃并不像塑料制品那样对环境产生有害影响,但大量没有回收利用的废旧玻璃也失去了再利
06-21
-
《人类简史》据说,人类有一种极其强大的能力:可以创造并相信“虚构的故事”。 金钱、荣誉甚至国家之所以存在并且有价值,是因为人们相信相应的故事并愿意为之努力。 不言而喻,创造概念和讲故事的能力是多么重要。 在餐饮行业,今年最流行的概念和故事无非三个字——新中式
06-18
-
头条编译 马来西亚宣布一系列经济刺激措施,以缓解新型冠状病毒疫情对经济的影响。 上周四,该国临时总理马哈蒂尔穆罕默德表示,政府将斥资47.62亿美元支持受疫情影响的企业,特别是从事旅游业的企业。 为了筹集资金,马来西亚可以发行债券。 疫情严重扰乱亚洲各地的运输和供
06-17
-
这是中国消费的风向标。 2月25日至26日,蓝鲨消费携手新浪财经、新潮传媒、天眼查、互动吧以及80御嘉一线消费投资机构共同主办的新消费品牌独角兽峰会在杭州临平成功举办。 本次峰会以“周期中的弹性增长”为主题,由杭州市临平区人民政府指导,中国时尚科技创新研究院主办。
06-18
-
据投资界11月23日消息,凯辉基金宣布与Seaya创投联手设立Seaya国泰拉美基金。 新基金的设立有助于双方深化优势资源整合,为更多初创企业提供资金和资源支持,促进企业及其合作伙伴持续规模化成长,将继续帮助企业进一步拓展全球业务。 市场。 该基金总部位于墨西哥,专注于拉
06-18
-
简介 领克发布Next Day概念车前途K20开始预售,预售售价8.68万元 自从丰田宣布推出卡罗拉官方写真集以来,副总裁和朱江相继辞职,加盟不到半年。 多家车企表示,芯片危机正在缓解比亚迪应对更换零部件的影响。 “三电三保”宝马、福特或将迎来首批固态电池组。 丰田发布O-Uch
06-21
-
23日,1600万柔光自拍相机vivo这款新机已通过线下渠道如乐语通讯等同步发布。 同时,vivo(vivo官方商城)已与天猫(天猫vivo官方旗舰店)、京东(京东vivo官方旗舰店)、苏宁(苏宁vivo官方旗舰店)等三大电商合作。 多家商业公司合作,同步在线推出X7Plus。 根据vivo官方微
06-18
-
今年双11在选品党的疯狂下创下了新纪录。 订单创建峰值达到每秒54.4万笔,最终交易额锁定1亿元。 与以往不同的是,今年阿里巴巴将首次将双11核心交易系统的%运行在阿里云上,利用公有云支撑全球最大规模的线上交易。 普通消费者可能不会关注这个事件,但对于整个云计算行业来
06-17
-
投资界(ID:pedaily)领投 据8月15日消息,江苏木腾光精密光学仪器有限公司(简称:木腾光精密)获融资首轮融资由亿达资本领投,本轮融资将加速穆腾光精密在光学传感器和智能成像光学系统产品的研发。 牧腾光精密成立于2008年,是一家专注于微精密场景下光学镜头、光学传感器
06-17
-
投资界(ID:pedaily)9月22日消息,威马汽车今日宣布,已完成1亿元人民币D轮融资。 本次投资由上海国投平台与上汽集团共同领投,百度、海纳亚洲创业投资基金(SIG)继续参与投资,湖北长江产业基金、苏州昆山产业基金、湖南衡阳国投平台上,安徽合肥产业基金、国投创益产业基
06-18
-
据3月11日消息,爱物管宣布完成数千万Pre-A轮融资,兰驰创投独家投资。 该资金将用于企业规模化发展以及核心技术的优化迭代。 爱物管成立于2007年,是一家利用人工智能、大数据、智能物联网设备等高科技赋能建筑物业的商业地产运营智能服务商。 爱物管为业主提供建筑运营过程
06-17
最新文章
Android旗舰之王的过去与未来
智能手表不被开发、AR眼镜被推迟,Meta的产品经历了一波三折
为什么Cybertruck是特斯拉史上最难造的车?
更新鸿蒙3后,文杰允许你在车里做PPT了
新起亚K3试驾体验:追求“性价比”,韩系汽车仍不想放弃
阿维塔15登场!汽车配备了增程动力,理想情况下会迎来新的对手吗?
马斯克宣布创建 ChatGPT 竞争对手! OpenAI的CEO给他泼了冷水, GPT-5可能会发生巨大变化
骁龙无处不在,是平台也是生态