米Googleは3月26日(現地時間)、「Gemini」のリアルタイム対話機能を強化する「Gemini 3.1 Flash Live」を発表した。「Gemini 3 Pro」をベースとしたネイティブなマルチモーダル推論モデルだ。最大128K(12万8000)トークンのコンテキストウィンドウを備え、音声、画像、動画、テキストを処理して自然で人間らしい音声やテキストを出力する。
Google、音声モデル「Gemini 3.1 Flash Live」公開 感情に合わせて自然な対話を実現
ITmedia AI+