谷歌发布文本嵌入模型EmbeddingGemma（附部署方式）

谷歌发布文本嵌入模型EmbeddingGemma（附部署方式）

news/2025/9/9 6:33:59/文章来源:https://blog.csdn.net/qq363685855/article/details/151327431

EmbeddingGemma是谷歌于2025年9月开源的开放式文本嵌入模型，专为端侧设备设计，具备以下核心优势：

性能优势

在MTEB基准测试中，EmbeddingGemma在500M以下参数规模的多语言文本嵌入模型中表现最佳，性能接近参数翻倍的顶尖模型（如Qwen-Embedding-0.6B）。该模型已针对100多种语言进行训练，并经过量化处理，可在低于200MB内存的设备上运行。 ‌

端侧适配能力

支持手机、笔记本等设备的离线运行，提供可自定义的输出尺寸和2K令牌上下文窗口。其设计初衷是与Gemma 3n配合使用，共同推动移动端RAG（检索增强生成）和语义搜索的应用。 ‌

工具集成性

可与sentence-transformers、llama.cpp、MLX等工具无缝对接，简化开发者上手难度。 ‌

参数与特性

模型拥有3.08亿参数，断网环境下可生成高质量嵌入向量，用于提升文本语义表征精度。其设计注重隐私保护，生成的嵌入向量能有效保留语言细微差异。

部署方式

Ollama部署：

执行下面代码：

ollama run dengcao/EmbeddingGemma

ollama模型库：https://ollama.com/dengcao/EmbeddingGemma

魔搭：https://modelscope.cn/models/google/embeddinggemma-300m

Hugging Face地址：https://huggingface.co/collections/google/embeddinggemma-68b9ae3a72a82f0562a80dc4

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。
如若转载，请注明出处：http://www.pswp.cn/news/921619.shtml
繁体地址，请注明出处：http://hk.pswp.cn/news/921619.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

CPU调度——调度的目标

CPU调度——调度的目标

2.2.2　调度的目标当系统中“想运行”的实体多于 CPU 的数量时，调度就不可避免地要在“效率”与“公平”之间做取舍。直观地说，一类目标希望把硬件压榨到更高的利用率，让单位时间内做更多的工作；另一类目标则关心个体体验&#x…

阅读更多...

C++ 8

C++ 8

封装一个学生的类，定义一个学生这样类的vector容器, 里面存放学生对象（至少3个）再把该容器中的对象，保存到文件中。再把这些学生从文件中读取出来，放入另一个容器中并且遍历输出该容器里的学生。#include <iostream…

阅读更多...

短视频矩阵系统源码开发搭建技术指南--支持OEM

短视频矩阵系统源码开发搭建技术指南--支持OEM

短视频矩阵系统架构设计短视频矩阵系统通常采用分布式架构，包含内容管理、用户管理、推荐算法、存储分发等模块。主流技术栈包括微服务框架（Spring Cloud/Dubbo）、消息队列（Kafka/RabbitMQ）、数据库（MySQL/…

阅读更多...

不连续页分配器补充

不连续页分配器补充

vmalloc流程 1. 背景：vmalloc() 要解决的问题 kmalloc() 要求虚拟地址连续，物理页也连续。大块内存分配可能失败。vmalloc() 只保证虚拟地址连续，物理内存可以由很多不连续的页拼接。实现的关键就是： 在 vmalloc 区域找一块空…

阅读更多...

bug | 事务粒度不能太大，含demo

bug | 事务粒度不能太大，含demo

刷到一个说法，建议不要使用transaction注解。这个说法不太准确，注解可以用，但标注的事务粒度不能太大，这样可能会引起数据库阻塞问题。以下介绍注解事务和编程式事务的两种用法。关键字：声明式事务，编程式…

阅读更多...

别再看人形机器人了！真正干活的机器人还有这些！

别再看人形机器人了！真正干活的机器人还有这些！

每次提起“机器人”，你脑海中是不是立刻浮现出双足行走、拟人微笑、还能陪你聊天的那种“人形机器人”？但真相是：人形机器人并非更实用，只是满足了我们对“人类替代品”的幻想。事实上，机器人的世界远比我们想象的更丰…

阅读更多...

垃圾回收，几种GC算法及GC机制

垃圾回收，几种GC算法及GC机制

1.什么是垃圾回收？如何触发垃圾回收？ 垃圾回收(GC)是自动管理内存的一种机制，它负责自动释放不再被程序引用的对象所占用的内存，这种机制减少内存泄漏和内存管理错误的可能性。可以通过多种方式触发：内存不足时&#x…

阅读更多...

更智能的零售终端设备管理：合规、安全与高效

更智能的零售终端设备管理：合规、安全与高效

目录引言：为什么零售连锁和自助终端需要更智能的设备管理？ 典型应用场景 1. 便利店连锁 2. 大型超市 3. 加油站 4. 自助终端核心功能，驱动高效与安全 1. 批量配置 2. 定时策略同步 3. 设备状态监控 4. Kiosk 模式，保…

阅读更多...

Elasticsearch：向量搜索过滤 - 保持相关性

Elasticsearch：向量搜索过滤 - 保持相关性

作者：来自 Elastic Carlos Delgado 仅执行向量搜索以找到与查询最相似的结果是不够的。通常需要过滤来缩小搜索结果。本文解释了在 Elasticsearch 和 Apache Lucene 中向量搜索的过滤是如何工作的。 Elasticsearch 拥有丰富的新功能，帮助你为自己的用例构…

阅读更多...

Linux 性能调优之 OOM Killer 的认知与观测

Linux 性能调优之 OOM Killer 的认知与观测

写在前面博文内容涉及到OOM Killer机制，以及利用 Cgroup/dmesg/BPF 观测 OOM Killer 事件，包括云原生环境下的 OOM Killer 机制的简单介绍这是内存调优的最后一篇，之后会分享一些网络调优相关内容理解不足小伙伴帮忙指正 😃,生活加油我不再将这个世界与我所期待的，塑…

阅读更多...

webrtc之高通滤波——HighPassFilter源码及原理分析

webrtc之高通滤波——HighPassFilter源码及原理分析

文章目录前言一、导读二、高通滤波过程1.HighPassFilter的创建1）HighPassFilter的作用2）开启条件3）开启配置2.高通滤波整体过程1）触发时机2）滤波器创建3）高通滤波过程三、算法实现1.原理1）滤波器…

阅读更多...

《sklearn机器学习——聚类性能指数》同质性，完整性和 V-measure

《sklearn机器学习——聚类性能指数》同质性，完整性和 V-measure

函数：homogeneity_score 参数： labels_true: array-like, shape [n_samples] 样本的真实标签。 labels_pred: array-like, shape [n_samples] 样本的预测标签。返回值： h: float 同质性得分，在0到1之间，值越大表示聚…

阅读更多...

HarmonyOS 应用开发新范式：深入剖析 Stage 模型与 ArkTS 状态管理

HarmonyOS 应用开发新范式：深入剖析 Stage 模型与 ArkTS 状态管理

好的，请看这篇关于 HarmonyOS 应用开发中 Stage 模型与 ArkTS 状态管理的技术文章。 HarmonyOS 应用开发新范式：深入剖析 Stage 模型与 ArkTS 状态管理引言随着 HarmonyOS 4、5 的发布以及 API 12 的迭代，HarmonyOS 的应用开发范式已经全面…

阅读更多...

一个Java的main方法在JVM中的执行流程

一个Java的main方法在JVM中的执行流程

一个Java的main方法在JVM中的执行流程可以分为四大阶段：加载 -> 链接 -> 初始化 -> 执行。// HelloWorld.java public class HelloWorld {public static void main(String[] args) {String message "Hello, JVM!";System.out.p…

阅读更多...

聚焦诊断管理（DM）的传输层设计、诊断服务器实现、事件与通信管理、生命周期与报告五大核心模块

聚焦诊断管理（DM）的传输层设计、诊断服务器实现、事件与通信管理、生命周期与报告五大核心模块

聚焦诊断管理（DM）的传输层设计、诊断服务器实现、事件与通信管理、生命周期与报告五大核心模块，明确 UDS（ISO 14229-1）与 SOVD（ASAM 服务化诊断）的功能逻辑、交互流程及规范性要求（SWS_DM 系列）。 1 UDS 传输层（UDS Transport Layer）作为 DM 与诊断客户端的 UDS …

阅读更多...

关于npm的钩子函数

关于npm的钩子函数

一、npm scripts 的生命周期钩子（Lifecycle Scripts） npm 提供了一些特殊的 script 名称，它们是生命周期钩子，会在特定时机自动执行。这些钩子包括： 1.prepublishOnly(在 npm publish之前执…

阅读更多...

167.在Vue3中使用OpenLayers模仿共享单车，判断点是否放在规划的电子围栏内

167.在Vue3中使用OpenLayers模仿共享单车，判断点是否放在规划的电子围栏内

一、前言大家好，这里分享一个 Vue3 OpenLayers 的小案例： 模仿共享单车的电子围栏功能，用户在地图上绘制停泊点时，系统会自动判断该点是否在规划好的电子围栏内（多边形或圆形）。这个功能在实际项目中有很大…

阅读更多...

键盘上面有F3，四，R，F，V，按下没有反应，维修记录

键盘上面有F3，四，R，F，V，按下没有反应，维修记录

打开游戏，按了好几遍F，结果都没反应，但是左右上下行走是没问题的。一脸懵逼？？？打开键盘测试网页，发现有一列没反应，F1不是，F1我定义了一个快捷键，跟测试冲突了…

阅读更多...

8051单片机-成为点灯大师

8051单片机-成为点灯大师

第三章成为点灯大师 1. 硬件设计上一章说到，怎么点亮LED灯，很简单啊，就是把P2口设置成低电平就行了。接下来让我们更进一步，完成LED闪烁、流水灯实验2. 软件设计 2.1 LED闪烁实验为了使LED闪烁，我们自然而然的想到要…

阅读更多...

Rust 日志库完全指南：从入门到精通

Rust 日志库完全指南：从入门到精通

GitHub 仓库: https://github.com/zhouByte-hub/rust-study ⭐ 如果这个项目对您有帮助，请给我一个 star！ 在 Rust 生态系统中，日志处理是一个至关重要的环节。无论是开发小型应用还是大型系统，良好的日志记录都能帮助我们追踪问题…

阅读更多...

最新文章