EmbeddingGemma是谷歌于2025年9月开源的开放式文本嵌入模型,专为端侧设备设计,具备以下核心优势:
性能优势
在MTEB基准测试中,EmbeddingGemma在500M以下参数规模的多语言文本嵌入模型中表现最佳,性能接近参数翻倍的顶尖模型(如Qwen-Embedding-0.6B)。该模型已针对100多种语言进行训练,并经过量化处理,可在低于200MB内存的设备上运行。
端侧适配能力
支持手机、笔记本等设备的离线运行,提供可自定义的输出尺寸和2K令牌上下文窗口。其设计初衷是与Gemma 3n配合使用,共同推动移动端RAG(检索增强生成)和语义搜索的应用。
工具集成性
可与sentence-transformers、llama.cpp、MLX等工具无缝对接,简化开发者上手难度。
参数与特性
模型拥有3.08亿参数,断网环境下可生成高质量嵌入向量,用于提升文本语义表征精度。其设计注重隐私保护,生成的嵌入向量能有效保留语言细微差异。
部署方式
Ollama部署:
执行下面代码:
ollama run dengcao/EmbeddingGemma
ollama模型库:https://ollama.com/dengcao/EmbeddingGemma
魔搭:https://modelscope.cn/models/google/embeddinggemma-300m
Hugging Face地址:https://huggingface.co/collections/google/embeddinggemma-68b9ae3a72a82f0562a80dc4