arXiv cs.AI

CycleGT: サイクルトレーニングによる教師なしグラフからテキスト及びテキストからグラフ生成

CycleGT: Unsupervised Graph-to-Text and Text-to-Graph Generation via Cycle Training

http://arxiv.org/abs/2006.04702v3


CycleGTは、知識グラフと自然言語処理の交差点に位置する2つの重要なタスク、すなわちグラフからテキスト(G2T)およびテキストからグラフ(T2G)への変換に関する手法です。データ収集の難しさから、これらの分野での教師ありデータは限られており、通常は数万件程度しか存在しないため、深層学習モデルは訓練データの不足に悩まされています。CycleGTは、完全に非並列なグラフとテキストデータから起動し、両者の間で逐次的に逆翻訳を行う教師なしの訓練方法を提案します。WebNLGデータセットでの実験では、同じ量のデータで訓練した我々の教師なしモデルが、いくつかの完全に教師ありモデルと同等のパフォーマンスを示しました。また、非並列のGenWikiデータセットにおいても我々の方法が最も優れた結果を確認しました。この結果は、G2TおよびT2G分野におけるデータ不足問題を克服する効果的なアプローチであることを示しています。