近年、ニューラルネットワークに基づく対話システムは、デジタル社会において広く普及しています。しかし、その不透明性が原因で、ニューラルモデルの使用に関する懸念が高まっています。本論文では、ブラックボックスのニューラル対話モデルを操作し、特定の単語や文を出力させるための入力文を作成する方法を探求します。強化学習に基づく手法を提案し、人気のある最新のニューラル対話モデルに対して広範な実験を行った結果、希望する出力を得るための入力を効果的に見つけることに成功しました。この研究は、ニューラル対話モデルが操作できる可能性を明らかにし、今後の防御戦略の開発へつながる可能性があります。