Gemma 是什么?
Gemma 是 Google 面向开发者开放的轻量模型家族。文档中覆盖 Gemma 4、Gemma 3、Gemma 2、Gemma 1,以及 Gemma 3n、FunctionGemma、EmbeddingGemma、PaliGemma、ShieldGemma 等变体,支持文本、图片、视频、音频、函数调用、嵌入、安全分类、本地运行、QLoRA 微调和 Google Cloud 部署。它适合需要可控、可下载、可微调模型的技术团队。
核心能力
开放模型家族
提供不同规模和用途的轻量模型,适合本地与云端部署。
多模态能力
PaliGemma 等变体支持图像理解,Gemma 新版本覆盖更多输入类型。
函数调用与嵌入
FunctionGemma 与 EmbeddingGemma 面向工具调用和语义检索场景。
微调与部署
支持 Hugging Face、Keras、Unsloth、JAX/Flax、Cloud Run、GKE、Vertex AI 等路径。
适合 / 不适合
适合
- 需要开源开放模型进行本地推理、微调或私有部署的开发者。
- 研究轻量模型、多模态模型、函数调用和安全模型的团队。
- 希望在 Web、移动端、边缘设备或 Google Cloud 上部署模型的人。
- 想用 Google 生态文档、Colab 和开发工具快速实验的人。
不适合
- 只想使用托管聊天网页,不想处理模型权重和部署的人。
- 需要闭源旗舰模型最高推理能力且不在意可控性的人。
- 没有 GPU、云资源或模型工程经验,却想直接生产部署的人。
- 不愿阅读许可、禁止用途和安全说明的商业团队。
产品信息
开发方
Google
产品形态
开放模型;文档;Colab;Hugging Face;Ollama;Google Cloud;特殊形态:轻量开放模型家族
价格状态
完全免费:模型和文档可按许可使用;训练、推理、云部署和商业使用成本取决于算力与服务平台
关键标签
完全免费、开放模型、Google、多模态、本地运行、微调
注意事项
Gemma 适合开放模型开发与部署;上线前要做好许可核对、安全评估、性能测试和模型质量评估。
适用场景
怎么用更好
1
先根据设备和任务选择合适规模与变体,不要盲目使用最大模型。
2
微调前准备高质量数据集和评估集,避免模型记住错误样本。
3
部署到移动端或边缘设备时重点测试延迟、内存和能耗。
4
商业使用前阅读 Gemma 许可、禁止用途和安全框架。
典型使用场景
本地 AI 应用
在本地或私有环境运行轻量模型。
语义检索
用 EmbeddingGemma 构建向量检索和 RAG。
视觉理解
用 PaliGemma 等模型处理图像任务。
云端部署
部署到 Google Cloud 或兼容推理框架。
编程开发的其他工具
q
qwqqq AI Coding Plan
qwqqq AI Coding Plan 指向 gpt.qwqqq.cn 的 New API 模型聚合与分发网关,支持将多种大语言模型转换为 OpenAI、Claude、Gemini 兼容接口。
G
GitHub Copilot
GitHub Copilot 是 GitHub 的 AI 编程助手,覆盖编辑器补全、Chat、Agent Mode、Coding Agent、CLI、代码审查和 GitHub 工作流集成。
T
TRAE
TRAE 是字节跳动推出的 AI IDE,面向代码生成、补全、重构、调试、项目理解、Agent 模式和多模型辅助开发。
C
Claude Code
Claude Code 是 Anthropic 的 agentic coding 系统,可在终端、IDE、Web 和远程环境中读取代码库、修改文件、运行测试、提交 PR 并接入 MCP。
v
v0.app
v0.app 是 Vercel 推出的 AI UI 与应用生成平台,可通过自然语言生成 React/Next.js 界面、组件、应用原型和可继续部署的前端代码。
C
Cursor
Cursor 是基于 VS Code 体验的 AI 代码编辑器,提供 Tab 补全、Agent、Ask、Composer/Chat、代码库理解、终端命令和多模型开发工作流。
B
Bolt.new
Bolt.new 是 StackBlitz 推出的 AI 全栈 Web 开发平台,基于浏览器 WebContainer 运行环境,用提示词生成、运行、调试和部署应用。
无
无问芯穹 Coding Plan
无问芯穹 Coding Plan 是无问芯穹面向 GenStudio 和 AI 编程工具的模型调用订阅入口,适合接入 Claude Code、OpenCode、Cursor、Cline 等开发工作流。
京
京东云 Coding Plan
京东云 Coding Plan 是京东云 JoyBuilder 模型开发平台的 AI 编程订阅服务,支持多模型切换,并可接入 Claude Code、Cursor、OpenClaw、Roo Code 等工具。
联
联通云 Coding Plan
联通云 Coding Plan 是联通云推出的 AI 编程订阅套餐,公开信息显示支持 GLM-5、MiniMax、Qwen、DeepSeek 等模型,并适配 OpenCode、Claude Code、OpenClaw、CoPaw 等工具。
数据统计
浏览量
20
点击量
12
收录时间
2026-05-14
更新时间
2026-05-27