本研究では、自然言語理解モデルの対話における一貫性の捕捉能力を定量化するために、DialoguE COntradiction DEtectionタスク(DECODE)を導入し、新たに人間同士および人間とボットによる矛盾する対話を含んだデータセットを作成しました。この取り組みでは、一般的な無構造アプローチに対して、事前トレーニングされたTransformerモデルを用いた構造的発話ベースのアプローチを対話矛盾検出に適用し、その効果を比較しています。結果として、収集したデータセットが対話矛盾検出タスクへの指導力をより高めることが示され、構造的アプローチが無構造アプローチよりも安定性と適応性に優れていることが明らかになりました。さらに、最良の矛盾検出モデルが人間の判断と良好に相関し、先進的な生成系チャットボットの一貫性を自動評価し改善するための証拠を提供します。