Gemini 2.5 现已在 Vertex AI 上运行:Pro、Flash 和模型优化器
Gemini 2.5 模型现已在 Vertex AI 上全面上市
Google Cloud 宣布在 Vertex AI 上全面推出 Gemini 1.5 Pro 模型,以及新的轻量级模型 Gemini 1.5 Flash。现在,希望大规模构建人工智能驱动的应用程序的企业开发人员可以使用这两种模型。
Gemini 1.5 Pro 的新增功能
Gemini 1.5 Pro 擅长长上下文理解,支持多达 100 万个令牌。这使得它非常适合处理大型文档、代码库或客户交互。它还显示出推理、指令遵循和编码任务的性能得到提高。
Gemini 1.5 闪存简介
Gemini 1.5 Flash 针对速度和效率进行了优化。它非常适合大容量、低延迟的用例,例如摘要、聊天和实时数据提取。虽然它比 Pro 更小、速度更快,但它在摘要和问答等关键领域保留了令人印象深刻的性能。
基于共享架构构建
1.5 Pro 和 Flash 均构建在相同的 Mixture-of-Experts 架构之上,可根据任务动态激活模型中最相关的部分。这可以实现更高效的资源使用和更快的推理。
与 Vertex AI 无缝集成
借助 Vertex AI,开发人员可以使用强大的企业工具,例如基于 Google 搜索、函数调用和多模式输入支持。 Gemini 模型还集成了模型评估和调整功能,使团队能够轻松微调行为和性能。
企业就绪且安全
Vertex AI 上的所有 Gemini 模型都提供企业级安全性、合规性和数据治理。用户保留对其数据的控制权,Google Cloud 确保模型不会在客户数据上进行训练,除非明确授权。
模型优化器和新的评估工具
Vertex AI 还推出了模型优化器,这是一种新工具,用于微调和提炼基础模型,以提高生产性能。此外,自动评估可以根据实际用例进行快速基准测试和改进。
开始使用
开发人员可以通过 Vertex AI Studio 或 API 访问 Gemini 1.5 Pro 和 Flash,并具有灵活的定价和配额选项。这些模型还为其他 Google 服务提供支持,包括 Workspace 和 Search。
要探索更多信息或开始构建,请访问 Vertex AI 主页。