本論文では、強化学習(RL)における一般化能力の評価のために設計されたシンプルなスタイルのローグライクゲーム「Rogue-Gym」を提案します。最近の深層ニューラルネットワークの進展により、RLは多くのゲームで人間レベルのエージェントを訓練できるようになりました。しかし、RLで訓練されたエージェントが訓練環境に対して過剰適合し、わずかに異なる環境でうまく働かないことが指摘されています。そこで本研究では、ダンジョンの構造が毎回異なるローグライクゲームを用いて、RLエージェントの一般化能力を評価する基準を提案します。実験では、標準的な強化学習手法であるPPOを使用し、一般化のための強化策を施した場合としない場合の結果を比較しました。その結果、いくつかの強化策は過剰適合を軽減できない一方で、他の策は若干の一般化能力の向上を示しました。