現代のEコマースカタログには、膨大な数の参照が含まれており、テキストや視覚的情報は商品の検索や閲覧において極めて重要です。特に書籍カテゴリでは、著者名のフィールドが大きな課題となっています。例えば、F.スコット・フィッツジェラルドが著した本が、異なる著者名でリストされてしまうことがあります。この問題を解決するため、オープンデータソースと深層学習を用いた自然言語処理の技術を駆使した複合的なシステムを設計しました。具体的には、シアミーズニューラルネットワークを使って既知の著者名との近似一致を図り、提供された著者名をシーケンス間学習により正確に修正します。このアプローチをフランスの楽天の製品データで評価した結果、システムの最上位提案の著者名は、72%の精度で正規化されました。