本稿では、HSKBenchmarkという新たに提案された中国語第二言語習得(SLA)のためのベンチマークを紹介しています。言語習得は人間の言語知能の本質を明らかにするために重要ですが、従来の実験方法では人間の学習者の言語入力をコントロールすることが難しいため、中国語SLAのモデル化において課題があります。HSKBenchmarkは初めて段階的なモデル化と文章評価を行うためのベンチマークで、HSKレベル3から6をカバーし、6.76百万のトークンを持つ教科書、16Kの合成指導サンプル、30のテストトピックを含んでいます。さらに、初心者から上級者までの学習の進展を模擬するためのカリキュラム調整フレームワークを導入し、評価システムを用いて文法のカバレッジ、文章エラー、語彙と構文の複雑さを測定します。HSKAgentを構築し、10Kの学習者作成の作品を用いて調整を行いました。実験結果は、HSKBenchmarkが中国語SLAの効果的なモデル化だけでなく、動的な文章評価の信頼性のあるベンチマークとしても機能することを示しています。