本記事では、マーケティングにおける音声分類の重要性を強調しており、顧客の態度を分析するための効果的な手法を提案しています。特に、膨大な音声データから顧客の購買傾向を効率的に分類することは依然として課題です。そのために'マルチセグメントマルチタスク融合ネットワーク(MSMT-FN)'という新しい手法を提案しています。独自のMarketCallsデータセットおよび既存のベンチマーク(CMU-MOSI、CMU-MOSEI、MELD)での評価により、MSMT-FNは最新の技術と比較して優れているか、同等の性能を示しました。この研究成果は、音声分類分野のさらなる研究を支援するために、GitHubでコードが公開され、MarketCallsデータセットも要求に応じて提供される予定です。