D4RL(DeepMind Control Suite for Offline Reinforcement Learning)は、オフライン強化学習のための標準化されたデータセットと環境を提供するライブラリです。ただし、Windowsネイティブ環境でのインストールは多くの依存関係やビルドツールの互換性問題により困難です。
重要注意:WindowsではD4RLの安定動作が保証されていません。代わりにWSL2(Windows Subsystem for Linux)の利用を強く推奨します。WSL2上ではLinuxと同等の環境が構築でき、サーバーとの互換性も高く、VS CodeなどのIDEからもシームレスに接続可能です。
Windows環境での試行的インストール手順(MuJoCo 2.1.0対応)
1. PyTorchのインストール
強化学習実験の基盤としてPyTorchが必要です。PythonバージョンとCUDAバージョンに注意してインストールしてください。例:
torch==1.13.1+cu117
torchaudio==0.13.1+cpu
torchvision==0.14.1+cu117
2. MuJoCoの設定
- MuJoCo公式GitHubからバイナリ(
mujoco210.zip)をダウンロードし、C:\mujocoに展開。 - 環境変数
PATHにC:\mujoco\binを追加。 - コマンドプロンプトで
simulateを実行し、GUIウィンドウが起動すれば成功。 - 次にPythonバインディングである
mujoco-pyをインストール:- 事前に「Visual Studio C++ ビルドツール」とCMakeをインストール。
- 以下のコマンドでインストール:
pip install mujoco-py==2.1.2.14Pythonインタプリタで
import mujoco_pyがエラーなく実行できればOK。
3. D4RLの依存ライブラリ導入
- Gym / Gymnasium:
D4RLは古いGym APIに依存するため、通常は以下をインストール:
(最新のGymnasiumとは互換性がない場合がある)pip install gym==0.21.0 - mjrl:
GitHubからの直接インストールは不安定なため、ローカルZIPをダウンロードし、解凍後インストール:cd C:\mjrl pip install . - その他の依存パッケージ(国内ミラー使用推奨):
pip install numpy==1.24.4 h5py==3.11.0 termcolor==1.1.0 pybullet==3.2.7 click==8.1.8 -i https://pypi.tuna.tsinghua.edu.cn/simple
4. D4RL本体のインストール
- D4RLのソースコードをZIPでダウンロードし、
C:\d4rlに展開。 setup.py内のinstall_requiresを以下のように修正(コメントアウトで不要な依存を除外):
※ 既に手動でインストール済みのパッケージ(numpy, mujoco_pyなど)は削除またはコメントアウト。install_requires=[ "gym<0.24.0", "dm_control>=1.0.3", ]- 編集モードでインストール:
cd C:\d4rl pip install -e .
この手順でも多くのユーザーがビルドエラーやDLLロード失敗に直面します。安定した開発環境を確保するには、WSL2上でUbuntuを用いたLinux環境構築が現実的な選択です。