视觉语言导航（7）——VLN的数据集和评估方法 3.2

视觉语言导航（7）——VLN的数据集和评估方法 3.2

bicheng/2025/8/19 11:04:05/文章来源:https://blog.csdn.net/2301_80226956/article/details/150279997

这是课上做的笔记，因此很多记得比较急，之后会逐步完善，每节课的逻辑流程写在大纲部分。

成功率(SR)

导航误差(NE)

成功加权路径长度（SucceedPLength）

轨迹长度（TL）

先知成功率（OS）

评估环境

1. SEEN VS. UNSEEN ENVIRONMENTS

SEEN ENVIRONMENTS

定义：这些是用于训练和验证的场景。
目的：确保模型在熟悉的数据上能够很好地拟合和表现。
特点：模型在训练过程中已经见过这些环境，因此对它们有较好的理解和预测能力。

UNSEEN ENVIRONMENTS

定义：这些是模型在训练中从未见过的场景，用于评估其泛化能力。
目的：检验模型是否能够在未见过的新环境中保持良好的性能，这反映了模型的真实应用潜力。
特点：由于模型没有见过这些环境，因此可以更真实地反映其在实际应用中的表现。

2. TEST ENVIRONMENTS

定义：与UNSEEN ENVIRONMENTS类似，同样是完全未见过的环境，但它是最终的、最权威的评测标准。
目的：为了保证公平性和客观性，测试集的正确答案（路径）通常是不公开的，以防止研究者通过逆向工程等方式获取优势。
流程：
- 研究者需要将训练好的模型提交到官方的评测服务器上。
- 由服务器来计算并返回最终成绩，这样可以确保评估过程的公正性和准确性。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。
如若转载，请注明出处：http://www.pswp.cn/bicheng/93747.shtml
繁体地址，请注明出处：http://hk.pswp.cn/bicheng/93747.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

ElasticSearch不同环境同步索引数据

ElasticSearch不同环境同步索引数据

目的：在生产环境把一个索引的数据同步到测试环境中1、在生产环境导出json数据curl -u "adims_user:xkR%cHwR5I9g" -X GET "http://172.18.251.132:9200/unify_info_mb_sp_aggregatetb_0004/_search?scroll1m" -H Content-Type: applicatio…

阅读更多...

咨询进阶——解读咨询顾问技能模型

咨询进阶——解读咨询顾问技能模型

适应人群为咨询行业从业者、咨询团队管理者、想提升咨询技能的职场人士及咨询公司培训人员。主要内容围绕咨询顾问技能模型展开，核心包括五大核心能力（解决问题能力，涵盖洞察力、分析技巧、问题构建等，从识别问题实质到构建新分析方法分层次阐述；管理能力，涉及管理他人与…

阅读更多...

2025年- H98-Lc206--51.N皇后(回溯）--Java版

2025年- H98-Lc206--51.N皇后(回溯）--Java版

1.题目描述2.思路二维数组集合 (1）N皇后规则 1）不能同行（同一行不能出现2个皇后） 2）不能同列（同一列不能出现2个皇后） 3）不能说45度或135度（斜对角线不能出现2个皇后&am…

阅读更多...

5G + AI + 云：电信技术重塑游戏生态与未来体验

5G + AI + 云：电信技术重塑游戏生态与未来体验

在数字娱乐蓬勃发展的今天，游戏产业已然成为科技创新的前沿阵地。电信网络也经历了一场深刻的蜕变，从最初仅仅是 “内容传输管道”，摇身一变成为与游戏深度绑定的技术共生体。5G 不断刷新着体验的边界，AI 彻底颠覆传统的创作模式&…

阅读更多...

【React Hooks】封装的艺术：如何编写高质量的 React 自-定义 Hooks

【React Hooks】封装的艺术：如何编写高质量的 React 自-定义 Hooks

【React Hooks】封装的艺术：如何编写高质量的 React 自-定义 Hooks 所属专栏： 《前端小技巧集合：让你的代码更优雅高效》上一篇： 【React State】告别 useState 滥用：何时应该选择 useReducer 作者： 码力…

阅读更多...

华为GaussDB的前世今生：国产数据库崛起之路

华为GaussDB的前世今生：国产数据库崛起之路

在数据库领域，华为GaussDB已成为一颗耀眼的明星，为企业核心业务数字化转型提供坚实的数据底座。但这并非一蹴而就，其背后是长达二十余年的技术沉淀、战略投入与持续创新。本文将深入探寻华为GaussDB的历史沿革与核心技术细节，展现…

阅读更多...

数据结构初阶（16）排序算法——归并排序

数据结构初阶（16）排序算法——归并排序

2.4 归并排序归并排序（Merge Sort）是基于分治思想的经典排序算法。核心逻辑： 分而治之——把复杂排序问题拆分成简单子问题解决，再合并子问题的结果。联系链表的合并：两个有序链表l1、l2创建新链表l3（带头…

阅读更多...

MATLAB实现匈牙利算法求解二分图最大匹配

MATLAB实现匈牙利算法求解二分图最大匹配

MATLAB实现匈牙利算法求解二分图最大匹配匈牙利算法（也称为Kuhn-Munkres算法）是解决二分图最大匹配问题的经典算法。代码 function [matching, max_match] hungarian_algorithm(adjMatrix)% HUNGARIAN_ALGORITHM 实现匈牙利算法求解二分图最大匹配% 输…

阅读更多...

自定义table

自定义table

更好<!DOCTYPE html> <html lang"zh-CN"><head><meta charset"utf-8"><title>数据表格</title><style>* {margin: 0;padding: 0;box-sizing: border-box;font-size: 14px;}html,body {width: 100%;height: 100%…

阅读更多...

面向R语言用户的Highcharts

面向R语言用户的Highcharts

如果您喜欢使用 R 进行数据科学创建交互式数据可视化，那么请你收藏。今天，我们将使用折线图、柱状图和散点图来可视化资产回报。对于我们的数据，我们将使用以下 5 只 ETF 的 5 年月回报率。 SPY (S&P500 fund)EFA (a non-US equities fun…

阅读更多...

【测试工具】OnDo SIP Server--轻松搭建一个语音通话服务器

【测试工具】OnDo SIP Server--轻松搭建一个语音通话服务器

前言 Ondo SIP Server 是一款基于 SIP(Session Initiation Protocol)协议的服务器软件，主要用于实现 VoIP(Voice over IP)通信，支持语音通话、视频会议等多媒体会话管理，非常适合学习和测试VoIP的基本功能。本文介绍Ondo SIP Server的安装、…

阅读更多...

疯狂星期四文案网第42天运营日记

疯狂星期四文案网第42天运营日记

网站运营第42天，点击观站： 疯狂星期四 crazy-thursday.com 全网最全的疯狂星期四文案网站运营报告今日访问量今日搜索引擎收录情况网站优化点优化一些发现的seo错误增加颜文字栏目增加了一些tag

阅读更多...

使用空模型实例调用辅助函数，确定在量化过程中哪些层会被跳过（43）

使用空模型实例调用辅助函数，确定在量化过程中哪些层会被跳过（43）

在Facebook的OPT-350M中，模型的头部（lm_head）与解码器的嵌入标记层（decoder.embed_tokens）共享其权重。 print(model.model.decoder.embed_tokens) print(model.lm_head)输出结果 Embedding(50272, 512

阅读更多...

从0-1使用Fastmcp开发一个MCP服务，并部署到阿里云百炼 -持续更新中

从0-1使用Fastmcp开发一个MCP服务，并部署到阿里云百炼 -持续更新中

目的： 在本地使用fastmcp开发一个mcp,然后注册到阿里云的百炼里面。实现在百炼里面创建智能体的时候直接引用自己开发的MCP 已完成：本地环境安装待完成： 1.根据需求实现一个MCP中可以调用某应用的多个API即 mcp.tool()、mcp.prompt()、接入大…

阅读更多...

设计模式之汇总

设计模式之汇总

设计模式零、设计原则 0.1 单一职责 0.2 接口隔离 0.3 开闭原则 0.4 依赖倒置0.5 迪米特法则，最小知道原则用户关机只和朋友通信朋友条件： 1）当前对象本身（this） 2）以参量形式传入到当前对象方法中的对象…

阅读更多...

第6章 Decoder与Encoder核心组件

第6章 Decoder与Encoder核心组件

前言 Netty从底层Java通道读取ByteBuf二进制数据，传入Netty通道的流水线，随后开始入站处理。在入站处理过程中，需要将ByteBuf二进制类型解码成Java POJO对象。这个解码过程可以通过Netty的Decoder（解码器）去完成。在…

阅读更多...

[已解决]当启动 Spring Boot 应用时出现 Using generated security password xxx提示

[已解决]当启动 Spring Boot 应用时出现 Using generated security password xxx提示

当启动 Spring Boot 应用时出现 Using generated security password xxx提示当启动 Spring Boot 应用时出现 Using generated security password xxx提示，这是 Spring Security 自动配置的默认行为，通常发生在你未自定义安全配置但引入了 Spring…

阅读更多...

自动分析需求，PRD 生成只需 SOLO 一步！

自动分析需求，PRD 生成只需 SOLO 一步！

资料来源：火山引擎-开发者社区写不清需求？PRD 难产？开发总跑偏？这些痛点，SOLO 来解决。 TRAE SOLO 是行业首个 Context Engineer。它不止协助编码，更能基于精准上下文理解和工具调用，从构思、…

阅读更多...

物联网软件开发过程中，数据流图（DFD），用例图，类图，活动图，序列图，状态图，实体关系图（ERD），BPMN（业务流程建模）详解分析

物联网软件开发过程中，数据流图（DFD），用例图，类图，活动图，序列图，状态图，实体关系图（ERD），BPMN（业务流程建模）详解分析

概述软件开发过程中，特别是在物联网（IoT）场景中，数据流图（DFD）、UML图（包括用例图、类图、活动图、序列图、状态图）、实体关系图（ERD）和业务流程建模&#xf…

阅读更多...

Mac（一）常用的快捷键整理

Mac（一）常用的快捷键整理

目录1、系统操作与窗口管理2、应用与窗口切换3、常规编辑操作4、文本导航与光标控制✏️5、文本格式与文档功能（支持应用中）6、截图快捷键7、Safari 浏览器快捷键8、Finder 快捷键（文件管理）9、Fn / Globe 功能键（部分…

阅读更多...

最新文章