本論文では、動的およびスケーリング環境におけるモデルの適応性を定量化するための「流動性指数(FI)」が紹介されています。このベンチマークは、初期状態、現在の状態、および未来の環境状態の偏差に基づいて応答の精度を評価し、文脈の切り替えや連続性を査定します。特に、適応性をテストするために、閉ループのオープンエンド実世界ベンチマークを優先しています。このアプローチは、スケーリング環境における状態変化を理解し、予測し、調整する能力を測定します。真にスーパーインテリジェントなモデルは、少なくとも二次の適応性を引き出し、デジタル補充を通じて最適な流動性を実現するために自己持続的な計算能力を示すべきであると述べています。