クレジットスコアリングモデルは、通常10%未満のデフォルト率によって引き起こされる深刻なクラス不均衡という課題に直面しています。この問題に対処するためにSMOTEやADASYNなどの合成データ拡張技術が提案されていますが、最適な拡張比率は不明です。本研究は、Give Me Some Creditデータセットを使用し、異なる増幅係数でSMOTE、BorderlineSMOTE、ADASYNの10のデータ拡張シナリオを評価しました。結果、ADASYNの1x倍(マイノリティクラスを倍増)が最適なパフォーマンスを示し、AUCは0.6778、ジニ係数は0.3557を達成しました。従来の1:1のバランスを取る方法とは対照的に、最適なクラス不均衡比は6.6:1であることが明らかになりました。この研究は、不均衡データセットにおけるデータ拡張の最適比率を示す初の実証的証拠を提供しています。