この論文では、科学の再現可能性の基盤となる正確で論理的な実験プロトコルの自動生成を目指しています。既存の大規模言語モデルは、しばしば不完全または一貫性のないプロトコルを生成するため、その有用性が制限されています。著者たちは、27の生物学のサブフィールドからなる12,000以上の構造化されたプロトコルからなるSciRecipeデータセットを提案し、プロトコル生成の精度を向上させるために「スケッチ・アンド・フィル」パラダイムを導入しました。これは、分析、構造化、表現を明確かつ検証可能に行うことを目指しています。また、構造化コンポーネントベースの報酬メカニズムにより、プロトコルのステップの粒度、行動の順序、および意味的正確性を評価し、モデルの最適化を実験の信頼性と整合させることを提案しています。最終的に設計したThothは、知識取得から運用的推論、実行可能なプロトコル生成への段階的な学習を行い、さまざまなベンチマークで既存のモデルを超える成果を上げています。これにより、知識と実験の実行を結びつける信頼性の高い科学アシスタントの実現が期待されます。