top of page
&SMART - ガジェット・IT・AI・FinTechに関するWebメディア

Google、「Gemini 2.5 Flash」を発表 - AIコストと性能の最適解へ

  • 執筆者の写真: 桜井 未来
    桜井 未来
  • 10 分前
  • 読了時間: 1分

image:Google
image:Google

Googleが新たに導入した「思考予算」により、用途に応じたコスト最適化が可能に


 米Googleは4月17日(現地時間)、生成AI「Gemini」シリーズの新たなモデル「Gemini 2.5 Flash」のプレビュー版を公開した。 このモデルは、前世代のGemini 2.0 Flashをさらに進化させ、速度とコスト効率を重視しつつも、高度な推論能力を兼ね備えている。「Gemini 2.5 Flash」は、開発者向けのGoogle AI StudioやVertex AIに加えて、一般ユーザー向けのGeminiアプリにも「Gemini 2.5 Flash (experimental)」として導入される。


「Gemini 2.5 Flash」の特筆すべき特徴として、開発者に柔軟性をもたらす「思考予算(Thinking Budget)」の設定が可能になった点が挙げられる。これにより、開発者はタスクの複雑さに応じてAIの推論コストを0から24,576トークンの範囲で細かく設定することが可能になる。たとえば、単純なQAや翻訳といったタスクでは、思考予算をゼロに設定することで、従来のGemini 2.0 Flashと同等の低コスト(出力100万トークンあたり$0.60)を維持できる。一方、複雑なデータ分析やマルチステップ推論が求められるタスクでは、思考予算を最大24,576トークンに設定し、より高い精度での出力(同$3.50)を選択するなど、ケースに応じて最適なバランスで利用することができる。


 Googleは今後、「Gemini 2.5 Flash」の正式リリースに向けて、開発者からのフィードバックを基にさらに改良を進めるとしている。

 

参照サイト

Google for Developers



 

TAGs

 

bottom of page