本記事では、ソフトウェア品質研究のための大規模データセット「SQuaD」を紹介しています。従来のリソースは、コードの匂いや技術的負債など限定的な視点に偏っているため、包括的な分析が難しい状況でした。SQuaDは、ApacheやMozillaなど、450の成熟したオープンソースプロジェクトから抽出された多次元かつ時間意識のあるソフトウェア品質指標のコレクションです。9つの最先端の静的解析ツールを統合し、700以上のユニークなメトリクスを提供します。また、63,586件のプロジェクトリリース、バージョン管理、問題追跡履歴、ソフトウェア脆弱性データを含んでおり、JIT欠陥予測を支援するプロセスメトリクスを含んでいます。これにより、ソフトウェアの保守性や技術的負債、品質評価に関する実証研究が可能になります。SQuaDはZENODOで公開されています。