本記事では、乱れたデータ(変動長エレメントの集合)を効率的に処理する新しいワークフローエンジン「Operon」を紹介します。従来のワークフローエンジンは、乱れたデータに内在する形状や依存関係を追跡するためのネイティブサポートを欠いており、ユーザーは複雑なインデックス管理を手動で行わなければなりませんでした。Operonは、Rustベースのワークフローエンジンで、明示的な依存関係を持つ名付けられた次元の新しい形式論を採用しています。ユーザーは次元の注釈を用いてパイプラインを宣言でき、実行時にデータの形状が発見されるにつれて動的にタスクがスケジュールされます。これにより、並列設定において確定的かつ収束的な実行が保証され、効率的なパラレル処理が実現されます。実験結果では、Operonが既存のワークフローエンジンに比べて14.94倍の基準オーバーヘッド削減を達成し、大規模データ生成パイプラインに特に適していることが示されています。