외부 환경

자체 환경 (First-Party Environments)

Farama 재단은 Gymnasium API를 사용하는 다양한 프로젝트를 유지 관리하고 있습니다. 환경은 다음과 같습니다: 그리드 월드 (Minigrid), 로보틱스 (Gymnasium-Robotics), 3D 내비게이션 (Miniworld), 웹 인터랙션 (MiniWoB++), 아케이드 게임 (Arcade Learning Environment), 둠 (ViZDoom), 메타 목표 로보틱스 (Metaworld), 자율 주행 (HighwayEnv), 레트로 게임 (stable-retro), 그리고 더 많은 환경이 있습니다.

Farama 재단은 또한 RL을 위한 대체 API를 유지 관리합니다. 다음을 포함합니다: 다중 에이전트 RL (PettingZoo), 오프라인 RL (Minari), 다중 목표 RL (MO-Gymnasium), 목표 기반 RL (Gymnasium-Robotics).

Gymnasium을 사용하는 타사 환경 (Third-party environments)

이 페이지에는 Farama 재단에서 유지 관리하지 않는 환경이 포함되어 있으며, 따라서 의도한 대로 작동함을 보장할 수 없습니다.

환경을 기여하고 싶으시다면, Discord를 통해 연락 주신 후 이 파일을 편집하여 PR을 제출해 주세요. 해당 파일 안에 추가 지침이 있습니다.

자율 주행 환경 (Autonomous Driving environments)

자율 주행 차량 및 교통 관리.

생물학 / 의료 환경 (Biological / Medical environments)

생물 시스템과의 상호 작용.

경제 / 금융 환경 (Economic / Financial environments)

경제 관련 모든 것.

전기 / 에너지 환경 (Electrical / Energy environments)

전자의 흐름 관리.

게임 환경 (Game environments)

보드 게임, 비디오 게임 및 기타 모든 대화형 엔터테인먼트 매체.

수학 / 계산 환경 (Mathematics / Computational)

계산량 감소, 수학 정리 증명 등.

로보틱스 환경 (Robotics environments)

자율 로봇.

  • BSK-RL: 우주선 계획 및 스케줄링 환경

    Gymnasium version dependency GitHub stars

    BSK-RL은 우주선 태스크 문제를 위한 Gymnasium 환경을 구축하기 위한 파이썬 패키지입니다. 모듈식 고속 우주선 시뮬레이션 프레임워크인 Basilisk 위에 구축되어 시뮬레이션 환경이 고정밀이며 계산 효율적입니다. BSK-RL은 이러한 환경에서 작업하기 위한 유틸리티 및 예제 모음도 포함합니다.

  • Connect-4-gym : 자기 플레이 연습 환경

    Connect-4-Gym은 스스로 플레이하여 학습하고 Elo 레이팅을 할당하는 AI 생성을 위해 설계된 환경입니다. 이 환경을 사용하여 클래식 보드 게임 Connect Four에서 강화 학습 에이전트를 훈련하고 평가할 수 있습니다.

  • FlyCraft: 고정익 UAV 환경

    Gymnasium version dependency GitHub stars

    FlyCraft는 고정익 UAV 태스크를 위한 Gymnasium 환경입니다. 기본적으로 FlyCraft는 자세 제어 및 속도 벡터 제어의 두 가지 태스크를 제공합니다. 이러한 태스크는 다중 목표 및 장기적 특성을 가지므로 RL 탐색에 상당한 어려움을 안겨줍니다. 또한 보상은 마코프적이거나 비마코프적으로 구성될 수 있어 FlyCraft는 비마코프 문제 연구에 적합합니다.

  • gymnax: 하드웨어 가속 RL 환경

    JAX에서 구현된 RL 환경으로, Gymnasium, MinAtari, bsuite 등 여러 환경을 지원하는 고도로 벡터화된 환경을 사용할 수 있습니다.

  • gym-jiminy: Jiminy에서의 로봇 훈련

    Gymnasium version dependency GitHub stars

    gym-jiminy는 Pinocchio를 사용하여 물리 평가를 수행하고 Meshcat을 사용하여 웹 기반 3D 렌더링을 수행하는 매우 빠르고 가벼운 다관절 시스템 시뮬레이터인 Jiminy를 사용하여 초기 Gym을 로보틱스용으로 확장한 것입니다.

  • gym-pybullet-drones: 쿼드콥터 제어 환경

    Gymnasium version dependency GitHub stars

    PyBullet을 사용하여 Bitcraze Crazyflie 2.x 나노쿼드 로터의 동역학을 시뮬레이션하는 간단한 환경입니다.

  • Itomori: UAV 위험 인식 비행 환경

    Gymnasium version dependency GitHub stars

    Itomori는 위험 인식 UAV 비행을 위한 환경이며, Chance-Constrained Markov Decision Processes (CCMDP)를 해결하기 위한 도구를 제공합니다. 이 환경은 GPS 불확실성, 충돌 위험, 적응형 비행 계획과 같은 변수를 통합하여 복잡하고 위험한 환경에서의 UAV 내비게이션을 시뮬레이션, 시각화 및 평가할 수 있습니다. Itomori는 조정 가능한 매개변수, 상세한 시각화 및 불확실한 환경에서 에이전트 행동에 대한 통찰력을 제공하여 UAV 경로 계획 연구를 지원하기 위해 고안되었습니다.

  • OmniIsaacGymEnvs: NVIDIA Omniverse Isaac 용 Gym 환경

    Omniverse Isaac 시뮬레이터를 위한 강화 학습 환경입니다.

  • panda-gym: PyBullet 물리 엔진을 사용하는 로보틱스 환경

    Gymnasium version dependency GitHub stars

    PyBullet 기반으로 물체를 움직이는 로봇 팔 시뮬레이션입니다.

  • PyFlyt: 강화 학습 연구를 위한 UAV 비행 시뮬레이터 환경

    다양한 UAV에서 강화 학습 알고리즘을 테스트하기 위한 라이브러리입니다. Bullet 물리 엔진 위에 구축되었으며, 유연한 렌더링 옵션, 시간 이산 스텝 가능 물리, Python 바인딩 및 복엽기, 쿼드콥터, 로켓 등 생각할 수 있는 모든 구성의 사용자 정의 드론 지원을 제공합니다.

  • safe-control-gym: RL 알고리즘의 안전성 평가

    CasADi (기호적) 사전 역학 및 제약 조건이 있는 PyBullet 기반 CartPole 및 Quadrotor 환경을 통해 안전성, 견고성 및 일반화 능력을 평가합니다.

  • Safety-Gymnasium: 실제 RL 시나리오에서 안전 보장

    Gymnasium version dependency GitHub stars

    높은 확장성과 사용자 정의가 가능한 안전 강화 학습 라이브러리입니다.

통신 시스템 환경 (Telecommunication Systems environments)

무선 및/또는 유선 통신 시스템과 상호 작용 및/또는 관리.

기타 (Other)

  • Buffalo-Gym: 다중 암 밴딧 Gymnasium

    Gymnasium version dependency GitHub stars

    Buffalo-Gym은 주로 RL 구현 디버깅을 돕기 위해 구축된 다중 암 밴딧(MAB) Gymnasium입니다. MAB는 에이전트가 무엇을 학습하고 있는지, 그리고 그것이 올바른지 추론하기 쉬운 경우가 많습니다. Buffalo-gym은 밴딧, 콘텍스트 밴딧, 그리고 엘리어싱이 있는 콘텍스트 밴딧을 포함합니다.

  • CARL: 콘텍스트 적응형 RL

    Gymnasium version dependency GitHub stars

    길이가 가변적인 폴을 가진 CartPole 또는 지면 마찰이 다른 Brax 로봇과 같이 일반화를 위한 훈련 및 테스트 분포를 가능하게 하는 인기 있는 강화 학습 환경의 콘텍스트 확장입니다.

  • DACBench: 동적 알고리즘 구성 벤치마크

    Gymnasium version dependency GitHub stars

    동적 알고리즘 구성을 위한 벤치마크 라이브러리입니다. 다양한 DAC 방법의 재현성 및 비교 가능성, 그리고 최적화 프로세스의 쉬운 분석에 중점을 둡니다.

  • gym-cellular-automata: 셀룰러 오토마타 환경

    Gymnasium version dependency GitHub stars

    에이전트가 셀 상태를 변경하여 _셀룰러 오토마타_와 상호 작용하는 환경입니다.

  • Gym-Gridworlds: 사용자 정의 가능한 미니멀리스트 그리드 월드 모음

    Gymnasium version dependency GitHub stars

    기본 클래스는 “목표 지점 이동”을 구현하지만, 다양한 그리드, 보상, 역학 및 태스크로 다른 태스크에 맞게 쉽게 사용자 정의할 수 있습니다. 다양한 관찰 유형(이산, 좌표, 이진, 픽셀, 부분)을 지원합니다. 테이블형 및 함수 근사 RL 알고리즘을 빠르게 테스트하고 프로토타이핑하는 데 유용합니다.

  • matrix-mdp: 이산 MDP를 쉽게 생성

    Gymnasium version dependency GitHub stars

    이산 MDP를 gym 환경으로 쉽게 구현하기 위한 환경입니다. 행렬 세트(P_0(s), P(s'| s, a)R(s', s, a))를 이러한 동역학에 의해 지배되는 이산 MDP를 나타내는 gym 환경으로 변환합니다.

  • SimpleGrid: Gymnasium을 위한 간단한 그리드 환경

    Gymnasium version dependency GitHub stars

    SimpleGrid는 Gymnasium을 위한 매우 간단하고 미니멀한 그리드 환경입니다. 사용 및 사용자 정의가 쉽고 다양한 RL 알고리즘을 신속하게 테스트하고 프로토타이핑하기 위한 환경을 제공합니다.

Gym을 사용하는 타사 환경 (Third-Party Environments using Gym)

다양한 버전의 Gym을 사용하는 타사 환경이 많이 있습니다. 이들 중 상당수는 Gymnasium과 함께 작동하도록 조정될 수 있지만(Gym과의 호환성 참고), 완전히 기능함을 보장하지는 않습니다.

비디오 게임 환경 (Video Game environments)

로보틱스 환경 (Robotics environments)

자율 주행 환경 (Autonomous Driving environments)

기타 환경 (Other environments)