HackerNews

音声転写と新しいペリカンベンチマークを用いたGemini 3 Proの試用

Trying out Gemini 3 Pro with audio transcription and a new pelican benchmark

https://simonwillison.net/2025/Nov/18/gemini-3/


2025年11月18日、GoogleはGemini 3 Proを発表しました。このモデルはGemini 2.5の強化版で、テキスト、画像、音声、ビデオを含むマルチモーダル入力をサポートしています。入力トークンは100万まで受け付け、出力は最大64,000トークンです。ベンチマークでは、Gemini 3 Proは多数の標準ベンチマークでClaude 4.5 SonnetやGPT-5.1をわずかに上回るスコアを示しています。価格はGemini 2.5よりもやや高いですが、Claude Sonnet 4.5よりは安価です。記事内では、様々なパフォーマンスベンチマークを比較しており、特に数学や視覚的推論の問題に対する成績が優れています。また、音声からの転写や複雑な画像の解析においても優れた応答を示しました。