この記事では、Word2vecの理念を基にしたベクトル算術が、技術文書のコンテキストでどのように機能するかを実験を通じて探ります。Word2vecは語をベクトルで表現し、意味的に類似した語が近接する特徴を持っています。近年の埋め込みモデルは、単語だけでなく、段落や文書全体を表すベクトルを生成できるようになりました。著者は、Supabaseのドキュメントの全テキストを基にしたベクトルを用いて、異なるトピックや領域での実験を行い、期待される概念との類似性をコサイン類似度で評価します。最初の実験では、'supabase'を引き算し、'angular'を足すことで「Angularでのテスト」という概念に近いベクトルを得ることを期待しています。続いて、異なるトピックでも同様の手法を適用して、関連性の高い結果を導き出すことを目指します。