时间:2023-04-06 09:26:10 | 浏览:477
机器之心报道
编辑:杜伟
OpenAI 创建的 Gym 是开源的 Python 库,通过提供一个用于在学习算法和环境之间通信的标准 API 以及一组符合该 API 的标准环境,来开发和比较强化学习(DL)算法。自推出以来,Gym 的 API 已经成为了领域标准。
目前,在 Gym 的项目主页,Star 量已经达到了 26.6k。
项目地址:https://github.com/openai/gym
近日,Gym 迎来了迄今为止最大的更新,包括 API 变化、环境变化和其他变化。
API 变化
首先是 API 变化,包括如下:
env.reset 接受 3 个新的参数(options - 对于无再次初始化环境时控制课程学习等操作有用;seed - 未来环境 seed 可以传递到 reset 参数。老的 .seed() 方法被弃用,但考虑到向后兼容,该方法在 Gym 1.0 发布之前仍继续如常工作;infos - 当设置为 True,reset 将返回 obs, info。当前这种做法默认为 False,但将变成 Gym 1.0 版本的默认行为);
环境名称在注册期间不再需要一个版本,并将智能推荐类似名称;
Vector 环境支持 info 中的 terminal_observation 并支持批处理操作空间。
环境变化
blackjack 和 frozen lake 示例环境现在使用 PyGame 进行了更好的图形渲染;
机器人环境已移动到 gym-robotics 包中;
bipedal walker 和 lunar lander 环境现在被合并称为一类;
Atari 环境现在使用标准种子 API 了;
修复了 car_racing box2d 环境中的大错误修复,碰撞版本;
重构了所有 box2d 和 classic_control 环境,以使用 PyGame 而不是 Pyglet。因为 pyglet 的问题一直是 gym 项目生命周期中最常见的 GitHub 问题来源之一。
其他变化
移除 DiscreteEnv 类,内置环境将不再使用;
增加了大数类型提示;
支持 Python 3.10 版;
大量额外的代码重构、清理、错误消息改进和小错误修复;
所有环境文件的描述文件现在都有了明显改进。
机器之心报道编辑:杜伟OpenAI 创建的 Gym 是开源的 Python 库,通过提供一个用于在学习算法和环境之间通信的标准 API 以及一组符合该 API 的标准环境,来开发和比较强化学习(DL)算法。自推出以来,Gym 的 API 已
8月5日,由国家超级计算深圳中心、中国计算机学会深圳分部联合云创大数据举办的“小天才学Python少儿编程夏令营”在深圳超算正式开营。30位7-10岁的孩子参与本期夏令营。在5天营期中,导师们将带孩子们认识turtle库、for循环、pen
看到kaggle、medium上有不少人用球队的历史数据来进行建模预测,比如用到泊松分布、决策树、逻辑回归等算法,很大程度上能反映强者恒强的现象,比如巴西、英格兰等大概率能进8强,就像高考模拟考试成绩越好,大概率高考也会考得好。这个和人脑的
当下python需求量还是挺大的,对于想要做兼职的程序员还是挺友好的:起码不用愁找不到;目前来看,其兼职方向大致有三:开发、爬虫、数据分析。就开发来说,目前python的轮子在Github上一抓一大把,开发成本和开发周期相比于其他语言会更低
一、字典简介1、什么是字典字典由"键"和对应的“值”成对组成。可以理解成是一个无序、可变和有索引的集合。2、字典的表示方法字典示例:dict = {"name": "Tom","class": "2", "age": 16}字典拥有键和值,
复习:请说出字符串和列表的特征,并举例。答案:字符串:必须有引号表示列表:是[]括起来,多个内容用逗号隔开举例:"我是中国人":字符串[1,2,3]:列表参考答案下面来讲今天的新内容:字典试着看懂这两段代码dict={"Name":"Zar
一、定义1、字典是另一种可变容器模型,且可存储任意类型对象。2、一对一关系。键和值在内存中是无序存在的。3、字典的每个键值 key=>value 对用冒号 : 分割,每个对之间用逗号(,)分割,整个字典包括在花括号 {} 中键必须是唯
今天凌晨,OpenAI 发布了多模态预训练大模型 GPT-4。眼花缭乱的技术迭代和全新功能毫无疑问再次带给我们巨大震撼,但在冷静之后,本次发布的一些细节也让我们感到担忧:这家将“open”写在公司名称里的科技企业,似乎正在朝着close的方
OpenAI是全球最著名的人工智能研究机构,发布了许多著名的人工智能技术和成果,如大语言模型GPT系列、文本生成图片预训练模型DALL·E系列、语音识别模型Whisper系列等。由于这些模型在各自领域都有相当惊艳的表现,引起了全世界广泛的关
OpenAI将与支付公司Stripe合作,后者为其ChatGPT等人工智能工具提供支付和订阅服务。Stripe 还将把 OpenAI 的新自然语言技术 GPT-4 融入其产品和服务中。Stripe首席技术官David Singleton表示
怎样学习日语最好大家要知道一点,其实学日语并不难,难的是看你有没有信心学好日语,这才是至关重要的。怎样学习日语最好?南京日语提出,如果你三天打鱼两天晒网的话,我劝你还是趁早死心,在语言世界里没有任何的捷径,有的只是艰辛和不懈的努力。举个例子
机器之心报道编辑:泽南、杜伟很多人也许已经忘记,ChatGPT 正式发布时间是去年 11 月底,到现在才刚刚两个月,但它掀起的热潮却已引发科技公司纷纷跟进,催生了独角兽创业公司,还让学术界修改了论文接收的要求。在 ChatGPT 引发 AI