支持Python3.10,OpenAI强化学习工具包Gym迎来史上最大更新

时间:2023-04-06 09:26:10 | 浏览:331

机器之心报道编辑:杜伟OpenAI 创建的 Gym 是开源的 Python 库,通过提供一个用于在学习算法和环境之间通信的标准 API 以及一组符合该 API 的标准环境,来开发和比较强化学习(DL)算法。自推出以来,Gym 的 API 已

机器之心报道

编辑:杜伟

OpenAI 创建的 Gym 是开源的 Python 库,通过提供一个用于在学习算法和环境之间通信的标准 API 以及一组符合该 API 的标准环境,来开发和比较强化学习(DL)算法。自推出以来,Gym 的 API 已经成为了领域标准。

目前,在 Gym 的项目主页,Star 量已经达到了 26.6k。

项目地址:https://github.com/openai/gym

近日,Gym 迎来了迄今为止最大的更新,包括 API 变化、环境变化和其他变化。

API 变化

首先是 API 变化,包括如下:

    env.reset 接受 3 个新的参数(options - 对于无再次初始化环境时控制课程学习等操作有用;seed - 未来环境 seed 可以传递到 reset 参数。老的 .seed() 方法被弃用,但考虑到向后兼容,该方法在 Gym 1.0 发布之前仍继续如常工作;infos - 当设置为 True,reset 将返回 obs, info。当前这种做法默认为 False,但将变成 Gym 1.0 版本的默认行为);

    环境名称在注册期间不再需要一个版本,并将智能推荐类似名称;

    Vector 环境支持 info 中的 terminal_observation 并支持批处理操作空间。

环境变化

    blackjack 和 frozen lake 示例环境现在使用 PyGame 进行了更好的图形渲染;

    机器人环境已移动到 gym-robotics 包中;

    bipedal walker 和 lunar lander 环境现在被合并称为一类;

    Atari 环境现在使用标准种子 API 了;

    修复了 car_racing box2d 环境中的大错误修复,碰撞版本;

    重构了所有 box2d 和 classic_control 环境,以使用 PyGame 而不是 Pyglet。因为 pyglet 的问题一直是 gym 项目生命周期中最常见的 GitHub 问题来源之一。

其他变化

    移除 DiscreteEnv 类,内置环境将不再使用;

    增加了大数类型提示;

    支持 Python 3.10 版;

    大量额外的代码重构、清理、错误消息改进和小错误修复;

    所有环境文件的描述文件现在都有了明显改进。

相关资讯

友情链接

天天财经元宇宙中国SEO域名抢注宝宝起名网网站监控妈妈知道欣灵电气股票贵州茅台A股易方达基金资讯网柴蔚影迷网熊猫资讯网玉石网宋氏起名字大全网红名人榜台州头条新闻网金秀瑶浴官网莲花山旅游攻略面膜资讯网老凤祥黄金纪念币收藏网柳州新闻资讯网
python编程教学网-python数据库开发教程、python基础知识入门、python数据库编程入门、python语法基础、python下载安装教程、python下载手机版、python翻译器下载手机版、python翻译器代码、python语言翻译、python基础代码、python编程自学网。
python编程教学网 dadeji.cn©2022-2028版权所有