欧易

欧易(OKX)

国内用户最喜爱的合约交易所

火币

火币(HTX )

全球知名的比特币交易所

币安

币安(Binance)

全球用户最多的交易所

支持Python3.10,OpenAI强化学习工具包Gym迎来史上最大更新

时间:2023-04-06 09:26:10 | 浏览:477

机器之心报道编辑:杜伟OpenAI 创建的 Gym 是开源的 Python 库,通过提供一个用于在学习算法和环境之间通信的标准 API 以及一组符合该 API 的标准环境,来开发和比较强化学习(DL)算法。自推出以来,Gym 的 API 已

机器之心报道

编辑:杜伟

OpenAI 创建的 Gym 是开源的 Python 库,通过提供一个用于在学习算法和环境之间通信的标准 API 以及一组符合该 API 的标准环境,来开发和比较强化学习(DL)算法。自推出以来,Gym 的 API 已经成为了领域标准。

目前,在 Gym 的项目主页,Star 量已经达到了 26.6k。

项目地址:https://github.com/openai/gym

近日,Gym 迎来了迄今为止最大的更新,包括 API 变化、环境变化和其他变化。

API 变化

首先是 API 变化,包括如下:

    env.reset 接受 3 个新的参数(options - 对于无再次初始化环境时控制课程学习等操作有用;seed - 未来环境 seed 可以传递到 reset 参数。老的 .seed() 方法被弃用,但考虑到向后兼容,该方法在 Gym 1.0 发布之前仍继续如常工作;infos - 当设置为 True,reset 将返回 obs, info。当前这种做法默认为 False,但将变成 Gym 1.0 版本的默认行为);

    环境名称在注册期间不再需要一个版本,并将智能推荐类似名称;

    Vector 环境支持 info 中的 terminal_observation 并支持批处理操作空间。

环境变化

    blackjack 和 frozen lake 示例环境现在使用 PyGame 进行了更好的图形渲染;

    机器人环境已移动到 gym-robotics 包中;

    bipedal walker 和 lunar lander 环境现在被合并称为一类;

    Atari 环境现在使用标准种子 API 了;

    修复了 car_racing box2d 环境中的大错误修复,碰撞版本;

    重构了所有 box2d 和 classic_control 环境,以使用 PyGame 而不是 Pyglet。因为 pyglet 的问题一直是 gym 项目生命周期中最常见的 GitHub 问题来源之一。

其他变化

    移除 DiscreteEnv 类,内置环境将不再使用;

    增加了大数类型提示;

    支持 Python 3.10 版;

    大量额外的代码重构、清理、错误消息改进和小错误修复;

    所有环境文件的描述文件现在都有了明显改进。

相关资讯

支持Python3.10,OpenAI强化学习工具包Gym迎来史上最大更新

机器之心报道编辑:杜伟OpenAI 创建的 Gym 是开源的 Python 库,通过提供一个用于在学习算法和环境之间通信的标准 API 以及一组符合该 API 的标准环境,来开发和比较强化学习(DL)算法。自推出以来,Gym 的 API 已

“小天才学Python少儿编程夏令营”在深圳超算开营

8月5日,由国家超级计算深圳中心、中国计算机学会深圳分部联合云创大数据举办的“小天才学Python少儿编程夏令营”在深圳超算正式开营。30位7-10岁的孩子参与本期夏令营。在5天营期中,导师们将带孩子们认识turtle库、for循环、pen

用PythonAI模型预测世界杯结果靠谱吗?

看到kaggle、medium上有不少人用球队的历史数据来进行建模预测,比如用到泊松分布、决策树、逻辑回归等算法,很大程度上能反映强者恒强的现象,比如巴西、英格兰等大概率能进8强,就像高考模拟考试成绩越好,大概率高考也会考得好。这个和人脑的

必须收藏的python兼职网站大全

当下python需求量还是挺大的,对于想要做兼职的程序员还是挺友好的:起码不用愁找不到;目前来看,其兼职方向大致有三:开发、爬虫、数据分析。就开发来说,目前python的轮子在Github上一抓一大把,开发成本和开发周期相比于其他语言会更低

python入门019:认识字典

一、字典简介1、什么是字典字典由"键"和对应的“值”成对组成。可以理解成是一个无序、可变和有索引的集合。2、字典的表示方法字典示例:dict = {"name": "Tom","class": "2", "age": 16}字典拥有键和值,

文科生也能学会Python---第六讲:字典

复习:请说出字符串和列表的特征,并举例。答案:字符串:必须有引号表示列表:是[]括起来,多个内容用逗号隔开举例:"我是中国人":字符串[1,2,3]:列表参考答案下面来讲今天的新内容:字典试着看懂这两段代码dict={"Name":"Zar

python笔记15:字典

一、定义1、字典是另一种可变容器模型,且可存储任意类型对象。2、一对一关系。键和值在内存中是无序存在的。3、字典的每个键值 key=>value 对用冒号 : 分割,每个对之间用逗号(,)分割,整个字典包括在花括号 {} 中键必须是唯

快评GPT-4:OpenAI不open了,机器视觉不存在了

今天凌晨,OpenAI 发布了多模态预训练大模型 GPT-4。眼花缭乱的技术迭代和全新功能毫无疑问再次带给我们巨大震撼,但在冷静之后,本次发布的一些细节也让我们感到担忧:这家将“open”写在公司名称里的科技企业,似乎正在朝着close的方

OpenAI是一家什么样的企业——OpenAI介绍与成果总结

OpenAI是全球最著名的人工智能研究机构,发布了许多著名的人工智能技术和成果,如大语言模型GPT系列、文本生成图片预训练模型DALL·E系列、语音识别模型Whisper系列等。由于这些模型在各自领域都有相当惊艳的表现,引起了全世界广泛的关

回顾|OpenAI入门(二)-用Blazor构建OpenAI应用

OpenAI与支付公司Stripe合作,将ChatGPT商业化

OpenAI将与支付公司Stripe合作,后者为其ChatGPT等人工智能工具提供支付和订阅服务。Stripe 还将把 OpenAI 的新自然语言技术 GPT-4 融入其产品和服务中。Stripe首席技术官David Singleton表示

OpenAI发布新语音系统「Whisper」,英文识别能力可接近人类水平

OpenAI入门(三)|构建自己的VisualStudioCodeCopilot组件

怎样学习日语最好?日语学习方法有哪些?快速学习日语

怎样学习日语最好大家要知道一点,其实学日语并不难,难的是看你有没有信心学好日语,这才是至关重要的。怎样学习日语最好?南京日语提出,如果你三天打鱼两天晒网的话,我劝你还是趁早死心,在语言世界里没有任何的捷径,有的只是艰辛和不懈的努力。举个例子

OpenAI官方推出AI生成内容识别器,成功率26%,不如论文查重工具

机器之心报道编辑:泽南、杜伟很多人也许已经忘记,ChatGPT 正式发布时间是去年 11 月底,到现在才刚刚两个月,但它掀起的热潮却已引发科技公司纷纷跟进,催生了独角兽创业公司,还让学术界修改了论文接收的要求。在 ChatGPT 引发 AI

友情链接

网址导航 SEO域名抢注宝宝起名网妈妈知道币圈吴京影迷网双鱼球拍南宁交友相亲网文淇影迷网手机租赁网柴蔚影迷网苹果手机评测网千里达自行车巴黎旅游网瑞士旅游网鸿星尔克股票网游泳运动网数字电商资讯网途牛旅游资讯网圣女果种植网
python编程教学网-python数据库开发教程、python基础知识入门、python数据库编程入门、python语法基础、python下载安装教程、python下载手机版、python翻译器下载手机版、python翻译器代码、python语言翻译、python基础代码、python编程自学网。
python编程教学网 dadeji.cn ©2022-2028版权所有