DBMSの性能は、MySQLやPostgreSQLなどの設定において性能に重要なノブの調整に大きく依存しますが、手動での調整は複雑で非効率的です。本研究では、オフライン学習時の収束速度の遅さという問題を改善するために、DBMSのマニュアルやウェブフォーラムなどの文書に含まれる貴重な調整ヒントを活用する方法を提案しています。具体的には、文書から調整ヒントを効果的に抽出するために、条件を考慮した思考の連鎖を構成するプロンプトをデザインし、その情報をもとにしたデモンストレーション強化学習アルゴリズムHA-DDPGfDを開発しました。このDemoTunerは、DBMSノブ調整に強化学習アルゴリズムを初めて導入したものであり、実験結果はMySQLとPostgreSQLにおけるパフォーマンスの向上とオンライン調整コストの削減を示しています。また、未知のワークロードに対しても高い適応性を発揮します。