Gemma——轻量级开源大模型，前沿性能触手可及

Gemma 是由 Google DeepMind 团队基于 Gemini 技术打造的一系列轻量级、前沿开源大语言模型 (LLM)。它秉承 Google 对 AI 研发的严谨态度与强大工程实力，旨在为全球开发者、研究者及技术爱好者提供易于获取且性能卓越的模型选择。

核心优势：

前沿性能： 基于与 Gemini 同源的核心技术构建，Gemma 在同等参数量级的开源模型中展现出领先的文本生成、推理及编码能力。
轻量级设计： 提供 2B（20亿）和 7B（70亿）参数规模版本，对硬件资源要求更友好，可在多种设备（包括开发者笔记本电脑、云端或移动端）上高效运行与微调。
开放赋能： 遵循开源原则发布，包含模型权重及详细说明。支持通过主流框架（如 JAX, PyTorch, TensorFlow via Keras）使用，并集成在 Hugging Face Transformers、 NVIDIA NeMo 和 TensorRT-LLM 等流行工具链中，极大降低使用门槛。
负责任 AI 基石： 内置 Google 严格的安全与责任 AI 实践。开发过程包含自动化技术过滤有害内容，并配套提供负责任生成式 AI 工具包，帮助开发者安全地构建应用。
跨平台支持： 提供预训练和指令微调 (Instruction-tuned) 版本，满足不同任务需求。支持在 GPU 和 TPU 上运行，并通过 Google Cloud 的 Vertex AI 和 Google Kubernetes Engine (GKE) 实现便捷部署。
多语言能力： 训练数据覆盖广泛，具备良好的多语言理解与生成潜力。