浅色标志 深色标志 PettingZoo 文档
Farama Foundation 标志 Farama Foundation
Contents Menu Expand Light mode Dark mode Auto light/dark mode
浅色标志 深色标志 PettingZoo 文档

介绍

  • 基本用法
  • 环境创建
  • 测试环境

API

  • AEC API
  • Parallel API
  • 封装器
    • PettingZoo 封装器
    • Supersuit 封装器
    • Shimmy 兼容性封装器
  • 工具类

环境

  • Atari
    • 篮球乒乓
    • 拳击
    • 战斗:飞机
    • 战斗:坦克
    • 双重灌篮
    • 夺宝奇兵:竞技
    • 夺宝奇兵:合作
    • 夺旗
    • 桌面足球乒乓
    • 冰球
    • 马上枪术
    • 马力欧兄弟
    • 迷宫狂热
    • 奥赛罗
    • 乒乓
    • 四人乒乓
    • 太空侵略者
    • 太空战争
    • 围攻
    • 网球
    • 视频跳棋
    • 排球乒乓
    • 军阀
    • 沃之巫师
  • Butterfly
    • 合作乒乓
    • 骑士弓箭手僵尸('KAZ')
    • 活塞球
  • 经典
    • 国际象棋
    • 四子棋
    • 金拉米
    • 围棋
    • 花火
    • 勒杜克扑克
    • 石头剪刀布
    • 无限注德州扑克
    • 德州扑克
    • 井字棋
  • MPE
    • 简单
    • 简单对抗
    • 简单加密
    • 简单推
    • 简单参考
    • 简单说话者听者
    • 简单扩散
    • 简单标签
    • 简单世界通信
  • SISL
    • 多行走者
    • 追捕
    • 水世界
  • 第三方环境

教程

  • 自定义环境教程
    • 教程:仓库结构
    • 教程:环境逻辑
    • 教程:动作遮罩
    • 教程:测试你的环境
  • CleanRL 教程
    • CleanRL:实现 PPO
    • CleanRL:高级 PPO
  • Tianshou 教程
    • Tianshou:基本 API 用法
    • Tianshou:训练智能体
    • Tianshou:命令行界面和日志记录
  • Ray RLlib 教程
    • RLlib:活塞球的 PPO
    • RLlib:简单扑克的 DQN
  • LangChain 教程
    • LangChain:创建 LLM 智能体
  • Stable-Baselines3 教程
    • SB3:骑士弓箭手僵尸的 PPO
    • SB3:水世界的 PPO
    • SB3:四子棋的动作遮罩 PPO
  • AgileRL 教程
    • AgileRL:实现 DQN - 课程学习和自博弈
    • AgileRL:实现 MADDPG
    • AgileRL:实现 MATD3

开发

  • Github
  • 发布说明
  • 贡献文档
返回顶部
编辑本页

自定义环境教程¶

这些教程将引导你从头开始创建自定义环境的完整过程,对于 PettingZoo 的新手来说,这些教程是很好的起点。

  1. 项目结构

  2. 环境逻辑

  3. 动作遮罩

  4. 测试你的环境

对于更简单的示例环境,包括 AEC 和 Parallel 两种实现,请参阅我们的环境创建文档。

下一页
教程:仓库结构
上一页
第三方环境
版权所有 © 2023 Farama Foundation