arXiv cs.AI

LLM生成コードの品質保証:非機能的品質特性への対処

Quality Assurance of LLM-generated Code: Addressing Non-Functional Quality Characteristics

http://arxiv.org/abs/2511.10271v1


近年、LLM(大規模言語モデル)はソフトウェア工学のワークフローに広く統合され、コード生成などのタスクをサポートしています。しかし、機能的には正しい出力を生成する一方で、非機能的特性の理解や評価は不十分です。本研究は、ISO/IEC 25010品質モデルに基づき、108本の文献レビュー、複数の業界ワークショップ、実際のソフトウェア問題のパッチ生成に関する実証分析を行いました。その結果、学術的にはセキュリティと性能に重視される一方で、業界では保守性や可読性が優先されています。生成されるコードが技術的負債を増加させる懸念についても警告されています。機能的に正しいパッチの評価では、一つの品質が向上することで他が損なわれることが多く、実行時やメモリの結果にもモデル間での大きなばらつきが見られました。このことは、学術的関心、業界の優先事項、モデルのパフォーマンスのミスマッチを浮き彫りにし、非機能的品質を確保するための品質保証メカニズムをLLMコード生成パイプラインに統合する必要性を示しています。