【目标检测】小样本度量学习

小样本度量学习(Few-Shot Metric Learning)通常用于分类任务​(如图像分类),但它也可以与目标检测(Object Detection)结合,解决小样本目标检测(Few-Shot Object Detection, FSOD)​问题。目标检测需要同时完成目标定位(Localization)​和分类(Classification)​,而小样本场景下,某些类别的训练样本极少(如“考拉”只有5张标注图像)。这会导致以下问题:样本不足​,尾部类别(如稀有物体)标注数据稀缺;特征泛化差​,模型容易过拟合到头部类别(如“人”、“车”);定位难度大​,边界框回归需要足够多样本才能稳定学习。

小样本学习

在小样本度量学习中,分为三类数据集——源数据集(open training set)、小样本训练集(support set)以及查询集(query set)。其中源数据集体量很大,可高达几十万张图片,用于训练一个CNN模型来提取图像特征;小样本数据集用C-way类别数和K-shot样本数来衡量,例如有五种类别,每种类别有一个样本,即5-way 1-shot,利用极少量样本学习新类别特征;查询集用来评估模型在新类别上的泛化能力。

例如,小样本训练集是2-way K-shot,这个集合不足以用来训练一个神经网络,只能提供一些参考信息。Few-shot learning与传统的监督学习有所不同,它的目标不是让模型学习测试集当中的图片并泛化到测试集,而是让模型自己学会学习,区分不同的事物。

小样本学习(Few-shot learning)和元学习(Meta learning)

小样本学习(Few-Shot Learning, FSL)​​是在极少量标注样本(如每类1-5张图)下,让模型快速学习新类别或任务,是元学习的一种。而​元学习(Meta-Learning)​​是让模型学会“如何学习”(learn to learn),从而在面对新任务时能快速适应。

学习一个相似函数(Similarity Function)

相似函数(Similarity Function)是小样本度量学习的核心组件,用于衡量两个样本在嵌入空间中的相似程度。它的核心目标​是量化样本特征向量之间的相似性,指导模型学习“同类相近,异类相远”的嵌入空间。

直观上理解, x1 和 x2 是同一类别,那么 sim(x1,x2)=1 ;x1 和 x3 以及x2 和 x3不是同一类别,那么 ,sim(x1,x3)=0,sim(x2,x3)=0

 

相似函数在实现过程中,首先在一个大规模训练集上学习一个相似函数,训练结束之可以用相似度函数来做预测,给出一个query图片,可以用它来跟support集上的样本做对比,计算相似度,找出相似度最高的作为预测结果。通过这样的方法,可以实现one-shot learning。

 

常用数据集

Omniglot 是小样本学习(Few-Shot Learning)和元学习(Meta-Learning)领域最经典的基准数据集之一,由 ​Brenden Lake​ 等人于2015年提出,旨在模拟人类“快速学习新概念”的能力。包含 ​50种不同文字系统​(如拉丁字母、日文假名、藏文等)的 ​1,623个手写字符,每个字符由 ​20个不同书写者​ 绘制,共 ​32,460张图像。测试模型在极少量样本下识别新字符的能力(类似人类学写陌生文字)。

 

Mini-ImageNet 由 ​Stanford 团队​ 于2016年提出,旨在简化原始 ImageNet 的复杂性,同时保留其多样性,便于研究者快速验证小样本学习算法的性能。它包含100 个类别(涵盖动物、植物、日常物品等),每个类别 600 张图片(共 60,000 张)。

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/web/91686.shtml
繁体地址,请注明出处:http://hk.pswp.cn/web/91686.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

cmd怎么取消关机命令

在 Windows 的命令提示符(CMD)中取消已计划的关机操作,可以通过 shutdown 命令的 ​**-a**​ 参数实现。以下是具体步骤:​操作方法​​打开 CMD​按下 Win R 组合键,输入 cmd 并回车,打开命令提示符窗口。…

网易云音乐硬刚腾讯系!起诉SM娱乐滥用市场支配地位

企查查APP显示,近日,法院公开杭州乐读科技有限公司、杭州网易云音乐科技有限公司起诉SM ENTERTAINMENT CO. 、卡斯梦(上海)文化传播有限公司等开庭信息,案由涉及滥用市场支配地位纠纷。公告显示,该案件计划…

[css]切角

使用css实现一个切角的功能&#xff0c;有以下几种方案&#xff1a; <div class"box"></div>方案一&#xff1a;linear-gradient linear-gradient配合backgroud-image可以实现背景渐变的效果。linear-gradient的渐变过渡区的占比是总的空间&#xff08;高…

分享一个可以测试离线服务器性能的脚本

在日常运维工作中&#xff0c;经常会遇到系统性能莫名跟不上业务需求的情况&#xff1a;服务器响应变慢、应用加载卡顿、资源占用异常飙升等问题频繁出现&#xff0c;却难以快速问题根源究竟在CPU过载、内存泄漏、磁盘I/O阻塞还是网络带宽瓶颈。这种时候&#xff0c;特别需要一…

Python Pandas.unique函数解析与实战教程

Python Pandas.unique 函数解析与实战教程 摘要 本文章旨在全面地解析 pandas 库中的 unique 函数。pandas.unique 是一个用于从一维数组型(array-like)对象中提取唯一值的高效工具。我们将从其核心功能、函数签名、参数详解、返回值类型,到关键行为特性(如顺序保留、缺失…

排序算法入门:直接插入排序详解

这里写目录标题介绍原理代码实现分析介绍 直接插入排序是一种简单直观的排序算法&#xff0c;适用于小规模数据或基本有序的数据集。其核心思想是构建有序序列&#xff0c;对于未排序数据&#xff0c;在已排序序列中从后向前扫描&#xff0c;找到相应位置并插入。 原理 我们…

ClickHouse MergeTree引擎:从核心架构到三级索引实战

摘要 MergeTree是ClickHouse最核心的存储引擎&#xff0c;采用列式存储LSM-Tree架构设计&#xff0c;支持高效的数据写入、合并和查询。本文将全面解析MergeTree引擎的基础概念、数据流、核心架构、索引系统以及常见问题。 基础篇&#xff1a; 一、MergeTree引擎基础概念 1. 定…

电脑手机热点方式通信(上)

电脑连接手机热点时的无线链路情况&#xff1a; 电脑上网时&#xff08;从服务器下载数据&#xff0c;或者上传指令、数据&#xff09;&#xff0c;首先电脑与手机之间基于WiFi协议在2.4G频段或者5G频段通信&#xff0c;然后手机与基站之间再基于4G LTE或者5G NR协议在2412MHz…

MySQL CPU占用过高排查指南

MySQL CPU 占用过高时&#xff0c;排查具体占用资源的表需结合系统监控、数据库分析工具和 SQL 诊断命令。&#x1f50d; ​一、快速定位问题根源​​确认 MySQL 进程占用 CPU​使用 top 或 htop 命令查看系统进程&#xff0c;确认是否为 mysqld 进程导致 CPU 飙升。若 MySQL 进…

软件交付终极闸口:验收测试全解析

验收测试&#xff1a;软件交付的关键环节 目录 验收测试&#xff1a;软件交付的关键环节 一、验收测试&#xff1a;软件交付的终极闸口 核心目标与作用 在 SDLC 中的位置 二、验收测试类型详解&#xff1a;精准匹配业务场景 三、验收测试全流程解析&#xff1a;从计划到…

深度学习核心:卷积神经网络 - 原理、实现及在医学影像领域的应用

&#x1f9d1; 博主简介&#xff1a;CSDN博客专家、CSDN平台优质创作者&#xff0c;高级开发工程师&#xff0c;数学专业&#xff0c;10年以上C/C, C#,Java等多种编程语言开发经验&#xff0c;拥有高级工程师证书&#xff1b;擅长C/C、C#等开发语言&#xff0c;熟悉Java常用开发…

多线程(二) ~ 线程核心属性与状态

文章目录一. 线程创建&#xff08;start&#xff09;&#xff08;一&#xff09;继承Thread类&#xff0c;重写run&#xff08;二&#xff09;继承Runnable类&#xff0c;重写run&#xff08;三&#xff09;Thread匿名内部类重写&#xff08;四&#xff09;Runnable匿名内部类重…

Linux---编辑器vim

一、vim的基本概念1.三种模式①命令模式控制屏幕光标的移动&#xff0c;字符、字或行的删除&#xff0c;移动复制某区段及进入插入模式或者进去底行模式②插入模式可进行文本输入&#xff0c;按Esc回到命令行模式③底行模式文件保存或退出&#xff0c;也可以进行文件替换&#…

如何在 Ubuntu 24.04 或 22.04 LTS Linux 上安装 Guake 终端应用程序

通过本教程的简单步骤,在 Ubuntu 24.04 或 22.04 LTS Jammy JellyFish 上安装 Guake 终端以运行命令。 Guake(基于 Quake)是一个基于 Python 的终端模拟器。Guake 的行为类似于 Quake 中的终端:通过某个按键(热键)按下时,窗口会从屏幕顶部滚下来,再次按下相同的按键时…

谷歌Gemini 2.5重磅应用:多模态研究助手Multi-Modal Researcher,实现全网自动研究与AI播客生成

在人工智能赋能科研与内容创作的浪潮中,谷歌基于其最新大模型 Gemini 2.5 推出了突破性工具 Multi-Modal Researcher。这一系统通过整合多模态数据(文本、视频、实时网络信息),实现了从自动研究到内容生成的全流程自动化。用户只需输入研究主题或YouTube视频链接,系统即可…

防御综合实验

一、实验拓补图二、实验需求及配置需求一设备接口VLAN接口类型SW2GE0/0/2VLAN 10AccessGE0/0/3VLAN 20AccessGE0/0/1VLAN List : 10 20Trunk[SW2]vlan 10 [SW2]vlan 20 [SW2]interface GigabitEthernet 0/0/2 [SW2-GigabitEthernet0/0/2]port link-type access [SW2-GigabitEt…

堆----2.前 K 个高频元素

347. 前 K 个高频元素 - 力扣&#xff08;LeetCode&#xff09; /** 桶排序: 首先遍历数组,使用HashMap统计每个元素出现的次数 创建一个大小为length 1的List数组,下标代表元素出现次数,出现次数一致的元素放在同一个数组中 倒数遍历List数组即可得得到前K个高频元素 细节注…

如何分析Linux内存性能问题

一、Linux中的buffer与cache的区别 Linux的内存管理与监控_linux服务器虚假内存和真实内存怎么区分-CSDN博客文章浏览阅读66次。本文主要是关于【Linux系统的物理内存与虚拟内存讲解】【重点对虚拟内存的作用与用法进行了讲解说明】【最后还对如何新增扩展、优化、删除内存交换…

二次型 线性代数

知识结构总览首先是我们的二次型的定义&#xff0c;就是说什么样的才算是一个二次型。然后就是如何把二次型化为标准型&#xff0c;最后就是正定二次型的定义和判断的一些条件。二次型的定义二次型其实是一种函数表达的方式&#xff0c;如上&#xff0c;含义其实就是每个项都是…

云原生三剑客:Kubernetes + Docker + Spring Cloud 实战指南与深度整合

在当今微服务架构主导的时代&#xff0c;容器化、编排与服务治理已成为构建弹性、可扩展应用的核心支柱。本文将深入探讨如何将 Docker&#xff08;容器化基石&#xff09;、Kubernetes&#xff08;编排引擎&#xff09;与 Spring Cloud&#xff08;微服务框架&#xff09; 无缝…