arXiv cs.AI

精密医療のゲノムワークフローのための効率的な染色体並列処理

Efficient Chromosome Parallelization for Precision Medicine Genomic Workflows

http://arxiv.org/abs/2511.15977v1


精密医療における大規模なゲノムワークフローは、サンプルごとに数十から数百ギガバイトのデータセットを処理するため、高いメモリ使用量、激しいディスクI/O、メモリ不足によるタスクの失敗が発生します。従来の静的リソース割り当て方法では、染色体ごとのRAM需要の変動に対応できず、リソースの利用効率が悪く、処理時間が長くなります。本研究では、染色体レベルのバイオインフォマティクスワークフローの適応型でRAM効率の高い並列化手法を提案しています。具体的には、タスクごとのメモリ消費を推定するシンボリック回帰モデルの開発や、タスク packing をナップサック問題として最適化する動的スケジューラーの提示、ピークメモリを最小化する染色体処理順序の最適化を行います。これらの手法により、メモリのオーバーランを減少させ、スレッド間の負荷を均等化することが可能となり、結果としてエンドツーエンドの実行速度が向上します。