
ジェミニ2.0フラッシュの概要
- コアポジショニングインテリジェント・エージェントの時代のために設計され、マルチモーダルなインタラクション、リアルタイムの応答、ツールの統合をサポートし、AIアシスタントの実用的な採用を促進することを目指している。
- コアの強み低レイテンシー、コスト効率、マルチモーダル理解(テキスト、画像、ビデオ、オーディオ)、ネイティブツール使用機能。
ジェミニ2.0モデルファミリー
- ジェミニ2.0フラッシュ(汎用版)
- 特性低レイテンシー、高性能、1Mの入力トークンと8Kの出力トークンをサポート。
- ツール統合内蔵のGoogle検索、コード実行など。
- アプリケーションシナリオリアルタイム対話、タスク自動化、マルチモーダル対話。
- ジェミニ2.0プロ(実験版)
- 特性コード生成と複雑なタスク(数学的推論など)に重点を置く。
- パフォーマンスMMLU-Proベンチマークで79.1%を記録し、コード生成タスクで卓越したパフォーマンスを発揮。
- ジェミニ2.0フラッシュライト(ジェネリック版)
- 特性予算が限られているアプリケーションのための最もコスト効率の高いバージョン。
- ジェミニ 2.0 フラッシュ-エクスペリメンタル(実験版)
- 新機能ネイティブな画像生成と編集、混合グラフィック出力のサポート。
- ジェミニ2.0フラッシュ思考(実験版)
- 特性思考プロセスを示すことで解釈可能性を高め、推理力を強化する。
主な新機能
- ネイティブ・ツールの使用
- Google検索、コード実行、ジオロケーション(Maps APIとの統合)などをサポート。
- 開発者は、APIを通じてタスク(翻訳、情報検索など)を自動化するインテリジェント・エージェントを構築できる。
- マルチモーダルインタラクション
- ビデオ理解ビデオコンテンツを要約し、重要な情報(アクションやテキストなど)を抽出します。
- 空間理解画像内のオブジェクトの位置と関係を分析します。
- ライブ・ストリーミング・メディアオーディオ、ビデオ入力へのリアルタイム応答をサポート。
- 今後の機能
- 音声合成エモーショナル・スピーチ生成のサポート
- 画像生成コンテキストに応じた画像の作成と編集。
パフォーマンス向上
- ベンチマーク・ハイライト::
- すうりMATHベンチマークテストで91.8%、HiddenMath競技レベルの問題で65.2%の正解。
- コード生成LiveCodeBench(v5)スコア36.01 TP3T、Bird-SQLタスク精度59.31 TP3T。
- 多言語主義Global MMLU (Lite)は15言語をカバーし、86.5%を記録。
- 事実と安全SimpleQAは44.3%、FACTは84.6%の精度。

デベロッパーエコロジー
- ツールとプラットフォーム
- ジェミニAPIマルチモーダル機能の迅速な統合をサポート。
- グーグルAIスタジオモデルのデプロイと管理ツールの提供
- バーテックスAIエンタープライズAI開発プラットフォーム。
- サンプルアプリケーション
- トールドロー自然言語インタラクションのための無限キャンバスベースのプロトタイプ。
- 客室バーチャルキャラクターのためのテキストと音声インタラクションの強化。
- トゥーンストラ多言語マンガ翻訳ツール。
責任あるAI開発
- 安全対策モデルの安全性、倫理的審査、透明性を重視。
- 知識カットオフトレーニングデータは2024年6月まで利用可能で、古い情報の影響を軽減する。
モデル情報
- 入力サポートテキスト、画像、ビデオ、オーディオ
- 出力サポートテキスト(画像と音声は近日対応予定)。
- 展開方法Google AI Studio、Gemini API、Vertex AI、Gemini App。
概要
Gemini 2.0 Flashは、低レイテンシ、マルチモーダルインタラクション、およびツール統合を通じて、リアルタイムのタスク自動化、複雑な問題解決、および領域を超えたコラボレーションのためのAIエージェントの使用を促進する。モジュール化されたモデルファミリー(Pro、Lite、Thinkingなど)は、さまざまなシナリオのニーズを満たし、開発者のエコシステムとセキュリティ対策は、実世界への展開をサポートする。
ダウンロード許可
見る- ¥免费下载コメントとリフレッシュ後にダウンロードログインしてダウンロード