网球¶

此环境是 Atari 环境的一部分。请先阅读该页面以获取一般信息。

导入	`from pettingzoo.atari import tennis_v3`
动作	离散
Parallel API	是
手动控制	否
智能体	`agents= ['first_0', 'second_0']`
智能体	2
动作形状	(1,)
动作值	[0,17]
观察形状	(210, 160, 3)
观察值	(0,255)

一个关于站位和预测的竞技游戏。

目标：将球打过对手。不要让球打过你。

当得分时（球离开区域），你会获得 +1 奖励，而你的对手会获得 -1 奖励。与正常的网球比赛不同，赢得的游戏数量不会直接获得奖励。

发球计时：如果球员在接到球后 3 秒内没有发球，他们将获得 -1 分，计时器重置。这可以防止一方无限期地拖延比赛，但也意味着这不再是一个纯粹的零和游戏。

官方网球手册

环境参数¶

环境参数对所有 Atari 环境都是通用的，并在Atari 基础文档中有所描述。

动作空间¶

在任何给定的回合中，智能体可以从 18 种动作中选择一种。

动作	行为
0	无操作
1	开火
2	向上移动
3	向右移动
4	向左移动
5	向下移动
6	向右上移动
7	向左上移动
8	向右下移动
9	向左下移动
10	向上开火
11	向右开火
12	向左开火
13	向下开火
14	向右上开火
15	向左上开火
16	向右下开火
17	向左下开火

版本历史¶

v3：最小动作空间 (1.18.0)
v2：无动作计时器 (1.9.0)
v1：整个 API 的重大更改 (1.4.0)
v0：初始版本发布 (1.0.0)

用法¶

AEC¶

from pettingzoo.atari import tennis_v3

env = tennis_v3.env(render_mode="human")
env.reset(seed=42)

for agent in env.agent_iter():
    observation, reward, termination, truncation, info = env.last()

    if termination or truncation:
        action = None
    else:
        # this is where you would insert your policy
        action = env.action_space(agent).sample()

    env.step(action)
env.close()

Parallel¶

from pettingzoo.atari import tennis_v3

env = tennis_v3.parallel_env(render_mode="human")
observations, infos = env.reset()

while env.agents:
    # this is where you would insert your policy
    actions = {agent: env.action_space(agent).sample() for agent in env.agents}

    observations, rewards, terminations, truncations, infos = env.step(actions)
env.close()

API¶

class pettingzoo.atari.tennis.tennis.raw_env(**kwargs: Any)[source]¶