この記事では、人工エージェントが観察に基づいて行動を取る能力の重要性について述べています。通常、強化学習(RL)がこのポリシー学習に使用されますが、従来のRLアルゴリズムは報酬の形成や一般化の困難、サンプル効率の低さといった課題に直面しています。本研究では、神経科学からの規範理論である自由エネルギー原理とアクティブ推論の概念を探求し、これをRLコミュニティによく知られるマウンテンカー問題に適用しています。結果として、アクティブ推論がRLとデモからの学習の両方を包含していることを示しました。
arXiv cs.AI
Bayesian policy selection using active inference
http://arxiv.org/abs/1904.08149v2
この記事では、人工エージェントが観察に基づいて行動を取る能力の重要性について述べています。通常、強化学習(RL)がこのポリシー学習に使用されますが、従来のRLアルゴリズムは報酬の形成や一般化の困難、サンプル効率の低さといった課題に直面しています。本研究では、神経科学からの規範理論である自由エネルギー原理とアクティブ推論の概念を探求し、これをRLコミュニティによく知られるマウンテンカー問題に適用しています。結果として、アクティブ推論がRLとデモからの学習の両方を包含していることを示しました。