arXiv cs.AI

複雑な非検証可能な主題領域における自己進化型専門知識:暗黙のメタ強化学習としての対話

Self-evolving expertise in complex non-verifiable subject domains: dialogue as implicit meta-RL

http://arxiv.org/abs/2510.15772v1


本論文は、複雑なマルチ次元の設定や非検証可能な結果を含む『ウィケッド・プロブレム』に取り組むための人工知能システムの利用を探究しています。特に、対話を通じた自己進化型の専門知識の育成を目指したDialecticaというフレームワークを提案し、記憶や自己反省を活用してエージェントが構造化された対話を行います。対話は暗黙のメタ強化学習過程と見なされ、結果として得られたエージェントは従来の基準を上回るパフォーマンスを示しました。定性的および定量的な証拠は、対話主導のコンテクスト進化が非検証可能な領域における専門知識の増幅に実用的な道筋であることを示しています。