迷宫疯狂¶

此环境属于 Atari 环境的一部分。请先阅读该页面以获取一般信息。
导入 |
|
---|---|
动作 |
离散 |
并行 API |
是 |
手动控制 |
否 |
智能体 |
|
智能体 |
2 |
动作形状 |
(1,) |
动作值 |
[0,17] |
观测形状 |
(250, 160, 3) |
观测值 |
(0,255) |
一个考验记忆力和规划能力的竞技游戏!
这是一场逃离迷宫的竞赛。游戏主要有 3 个版本。
竞赛:游戏的简单版本。第一个逃离迷宫的玩家获胜
强盗:有 2 个强盗随机穿梭于迷宫。如果您被强盗抓住,您将输掉游戏,获得 -1 奖励,并结束回合。未被抓住的玩家不会获得任何奖励,但他们仍然可以逃出迷宫获胜,获得 +1 奖励。
抓捕:每个玩家必须在逃出迷宫前抓住所有 3 个强盗。此外,您可以通过创建一个看起来与迷宫中的墙壁完全相同的方块来迷惑对手(如果您不小心也会迷惑自己!),但所有玩家都可以穿过它。您一次只能创建一个墙壁,当您创建新的墙壁时,旧的会消失。
第一个逃离迷宫的玩家得 +1 分,另一个玩家得 -1 分(除非该玩家在强盗模式下已被捕获)。
官方迷宫疯狂手册。请注意,模式表中存在一些不准确之处。特别是游戏模式 12 启用了 Blockade,而不是模式 11。
环境参数¶
一些环境参数适用于所有 Atari 环境,并在基础 Atari 文档中描述。
Maze Craze 特有的参数是
maze_craze_v3.env(game_version="robbers", visibilty_level=0)
game_version
: 可能的值为“robbers”、“race”、“capture”,对应于上面描述的 3 种游戏版本
visibilty_level
: 一个从 0 到 3 的数字。设置为 0 表示地图 100% 可见,设置为 3 表示地图 0% 可见。
动作空间¶
在任何给定回合中,智能体可以从 18 个动作中选择一个。
动作 |
行为 |
---|---|
0 |
无操作 |
1 |
射击 |
2 |
向上移动 |
3 |
向右移动 |
4 |
向左移动 |
5 |
向下移动 |
6 |
向右上移动 |
7 |
向左上移动 |
8 |
向右下移动 |
9 |
向左下移动 |
10 |
向上射击 |
11 |
向右射击 |
12 |
向左射击 |
13 |
向下射击 |
14 |
向右上射击 |
15 |
向左上射击 |
16 |
向右下射击 |
17 |
向左下射击 |
版本历史¶
v3:最小动作空间 (1.18.0)
v2:整个 API 的重大更改 (1.4.0)
v1:修复了所有环境处理过早死亡的方式 (1.3.0)
v0:初始版本发布 (1.0.0)
用法¶
AEC¶
from pettingzoo.atari import maze_craze_v3
env = maze_craze_v3.env(render_mode="human")
env.reset(seed=42)
for agent in env.agent_iter():
observation, reward, termination, truncation, info = env.last()
if termination or truncation:
action = None
else:
# this is where you would insert your policy
action = env.action_space(agent).sample()
env.step(action)
env.close()
并行¶
from pettingzoo.atari import maze_craze_v3
env = maze_craze_v3.parallel_env(render_mode="human")
observations, infos = env.reset()
while env.agents:
# this is where you would insert your policy
actions = {agent: env.action_space(agent).sample() for agent in env.agents}
observations, rewards, terminations, truncations, infos = env.step(actions)
env.close()