arXiv cs.AI

音声関連生体信号からの未見文の再構築とオープンボキャブラリ神経コミュニケーション

Reconstructing Unseen Sentences from Speech-related Biosignals for Open-vocabulary Neural Communication

http://arxiv.org/abs/2510.27247v1


本研究では、神経活動を直接言語表現に変換する革新的なブレイン・トゥ・スピーチ(BTS)システムの可能性について検討しています。従来の研究は事前に定義された単語や文をデコードすることに焦点を当てていましたが、自然な人間のコミュニケーションに匹敵するオープンボキャブラリの神経コミュニケーションを実現するためには、制約のないスピーチをデコードすることが求められます。本研究では、高密度脳波(EEG)信号から抽出された音素レベル情報を利用し、さまざまなスピーチモードにおいて未見文の合成が可能であることを示します。また、音素デコーディング精度に影響を与える特性を分析し、効果的な神経コミュニケーションソリューションのためのEEGデコーディングの向上に寄与する知見を提供します。これにより、様々な患者のニーズに適応したオープンボキャブラリの神経コミュニケーションシステムの開発が進展する可能性が示されています。