Add test for wrapping gym environments in jax

Toni-SM · Aug 9, 2024 · ca3b036 · ca3b036
1 parent d1db914
commit ca3b036
Show file tree

Hide file tree

Showing 3 changed files with 198 additions and 0 deletions.
diff --git a/tests/jax/__init__.py b/tests/jax/__init__.py
diff --git a/tests/jax/test_wrapper_gym.py b/tests/jax/test_wrapper_gym.py
@@ -0,0 +1,99 @@
+import pytest
+
+from collections.abc import Mapping
+import gym
+
+import numpy as np
+import jax
+import jax.numpy as jnp
+
+from skrl import config
+from skrl.envs.wrappers.jax import GymWrapper, wrap_env
+
+
+@pytest.mark.parametrize("backend", ["jax", "numpy"])
+def test_env(capsys: pytest.CaptureFixture, backend: str):
+    config.jax.backend = backend
+    Array = jax.Array if backend == "jax" else np.ndarray
+
+    num_envs = 1
+    action = jnp.ones((num_envs, 1))
+
+    # load wrap the environment
+    original_env = gym.make("Pendulum-v1")
+    env = wrap_env(original_env, "auto")
+    assert isinstance(env, GymWrapper)
+    env = wrap_env(original_env, "gym")
+    assert isinstance(env, GymWrapper)
+
+    # check properties
+    assert env.state_space is None
+    assert isinstance(env.observation_space, gym.Space) and env.observation_space.shape == (3,)
+    assert isinstance(env.action_space, gym.Space) and env.action_space.shape == (1,)
+    assert isinstance(env.num_envs, int) and env.num_envs == num_envs
+    assert isinstance(env.num_agents, int) and env.num_agents == 1
+    assert isinstance(env.device, jax.Device)
+    # check internal properties
+    assert env._env is original_env
+    assert env._unwrapped is original_env.unwrapped
+    # check methods
+    for _ in range(2):
+        observation, info = env.reset()
+        with capsys.disabled():
+            print(observation.shape, type(observation.shape))
+        assert isinstance(observation, Array) and observation.shape == (num_envs, 3)
+        assert isinstance(info, Mapping)
+        for _ in range(3):
+            observation, reward, terminated, truncated, info = env.step(action)
+            env.render()
+            assert isinstance(observation, Array) and observation.shape == (num_envs, 3)
+            assert isinstance(reward, Array) and reward.shape == (num_envs, 1)
+            assert isinstance(terminated, Array) and terminated.shape == (num_envs, 1)
+            assert isinstance(truncated, Array) and truncated.shape == (num_envs, 1)
+            assert isinstance(info, Mapping)
+
+    env.close()
+
+@pytest.mark.parametrize("backend", ["jax", "numpy"])
+@pytest.mark.parametrize("vectorization_mode", ["async", "sync"])
+def test_vectorized_env(capsys: pytest.CaptureFixture, backend: str, vectorization_mode: str):
+    config.jax.backend = backend
+    Array = jax.Array if backend == "jax" else np.ndarray
+
+    num_envs = 10
+    action = jnp.ones((num_envs, 1))
+
+    # load wrap the environment
+    original_env = gym.vector.make("Pendulum-v1", num_envs=num_envs, asynchronous=(vectorization_mode == "async"))
+    env = wrap_env(original_env, "auto")
+    assert isinstance(env, GymWrapper)
+    env = wrap_env(original_env, "gym")
+    assert isinstance(env, GymWrapper)
+
+    # check properties
+    assert env.state_space is None
+    assert isinstance(env.observation_space, gym.Space) and env.observation_space.shape == (3,)
+    assert isinstance(env.action_space, gym.Space) and env.action_space.shape == (1,)
+    assert isinstance(env.num_envs, int) and env.num_envs == num_envs
+    assert isinstance(env.num_agents, int) and env.num_agents == 1
+    assert isinstance(env.device, jax.Device)
+    # check internal properties
+    assert env._env is original_env
+    assert env._unwrapped is original_env.unwrapped
+    assert env._vectorized is True
+    # check methods
+    for _ in range(2):
+        observation, info = env.reset()
+        observation, info = env.reset()  # edge case: vectorized environments are autoreset
+        assert isinstance(observation, Array) and observation.shape == (num_envs, 3)
+        assert isinstance(info, Mapping)
+        for _ in range(3):
+            observation, reward, terminated, truncated, info = env.step(action)
+            env.render()
+            assert isinstance(observation, Array) and observation.shape == (num_envs, 3)
+            assert isinstance(reward, Array) and reward.shape == (num_envs, 1)
+            assert isinstance(terminated, Array) and terminated.shape == (num_envs, 1)
+            assert isinstance(truncated, Array) and truncated.shape == (num_envs, 1)
+            assert isinstance(info, Mapping)
+
+    env.close()
diff --git a/tests/jax/test_wrapper_gymnasium.py b/tests/jax/test_wrapper_gymnasium.py
@@ -0,0 +1,99 @@
+import pytest
+
+from collections.abc import Mapping
+import gymnasium as gym
+
+import numpy as np
+import jax
+import jax.numpy as jnp
+
+from skrl import config
+from skrl.envs.wrappers.jax import GymnasiumWrapper, wrap_env
+
+
+@pytest.mark.parametrize("backend", ["jax", "numpy"])
+def test_env(capsys: pytest.CaptureFixture, backend: str):
+    config.jax.backend = backend
+    Array = jax.Array if backend == "jax" else np.ndarray
+
+    num_envs = 1
+    action = jnp.ones((num_envs, 1))
+
+    # load wrap the environment
+    original_env = gym.make("Pendulum-v1")
+    env = wrap_env(original_env, "auto")
+    assert isinstance(env, GymnasiumWrapper)
+    env = wrap_env(original_env, "gymnasium")
+    assert isinstance(env, GymnasiumWrapper)
+
+    # check properties
+    assert env.state_space is None
+    assert isinstance(env.observation_space, gym.Space) and env.observation_space.shape == (3,)
+    assert isinstance(env.action_space, gym.Space) and env.action_space.shape == (1,)
+    assert isinstance(env.num_envs, int) and env.num_envs == num_envs
+    assert isinstance(env.num_agents, int) and env.num_agents == 1
+    assert isinstance(env.device, jax.Device)
+    # check internal properties
+    assert env._env is original_env
+    assert env._unwrapped is original_env.unwrapped
+    # check methods
+    for _ in range(2):
+        observation, info = env.reset()
+        with capsys.disabled():
+            print(observation.shape, type(observation.shape))
+        assert isinstance(observation, Array) and observation.shape == (num_envs, 3)
+        assert isinstance(info, Mapping)
+        for _ in range(3):
+            observation, reward, terminated, truncated, info = env.step(action)
+            env.render()
+            assert isinstance(observation, Array) and observation.shape == (num_envs, 3)
+            assert isinstance(reward, Array) and reward.shape == (num_envs, 1)
+            assert isinstance(terminated, Array) and terminated.shape == (num_envs, 1)
+            assert isinstance(truncated, Array) and truncated.shape == (num_envs, 1)
+            assert isinstance(info, Mapping)
+
+    env.close()
+
+@pytest.mark.parametrize("backend", ["jax", "numpy"])
+@pytest.mark.parametrize("vectorization_mode", ["async", "sync"])
+def test_vectorized_env(capsys: pytest.CaptureFixture, backend: str, vectorization_mode: str):
+    config.jax.backend = backend
+    Array = jax.Array if backend == "jax" else np.ndarray
+
+    num_envs = 10
+    action = jnp.ones((num_envs, 1))
+
+    # load wrap the environment
+    original_env = gym.make_vec("Pendulum-v1", num_envs=num_envs, vectorization_mode=vectorization_mode)
+    env = wrap_env(original_env, "auto")
+    assert isinstance(env, GymnasiumWrapper)
+    env = wrap_env(original_env, "gymnasium")
+    assert isinstance(env, GymnasiumWrapper)
+
+    # check properties
+    assert env.state_space is None
+    assert isinstance(env.observation_space, gym.Space) and env.observation_space.shape == (3,)
+    assert isinstance(env.action_space, gym.Space) and env.action_space.shape == (1,)
+    assert isinstance(env.num_envs, int) and env.num_envs == num_envs
+    assert isinstance(env.num_agents, int) and env.num_agents == 1
+    assert isinstance(env.device, jax.Device)
+    # check internal properties
+    assert env._env is original_env
+    assert env._unwrapped is original_env.unwrapped
+    assert env._vectorized is True
+    # check methods
+    for _ in range(2):
+        observation, info = env.reset()
+        observation, info = env.reset()  # edge case: vectorized environments are autoreset
+        assert isinstance(observation, Array) and observation.shape == (num_envs, 3)
+        assert isinstance(info, Mapping)
+        for _ in range(3):
+            observation, reward, terminated, truncated, info = env.step(action)
+            env.render()
+            assert isinstance(observation, Array) and observation.shape == (num_envs, 3)
+            assert isinstance(reward, Array) and reward.shape == (num_envs, 1)
+            assert isinstance(terminated, Array) and terminated.shape == (num_envs, 1)
+            assert isinstance(truncated, Array) and truncated.shape == (num_envs, 1)
+            assert isinstance(info, Mapping)
+
+    env.close()