写一个算法对一组值进行归一化映射,使它们在视觉上有明显的区分度,尤其在数据集分布不均时仍能体现差异

问题:

有一批数据,都是随机值范围是不确定,我需要用这个值来绘制同样数量圆,不同值他们的圆半径不同,考虑到数据有时候大小偏差不大,这1000个值有可能是集中在10,20之间,也可能是分布广泛,需要写一个算法来充分表达他们的值大小不同,返回一个比例0~100%  是的明显能看出他们的差异

思路分析
我们需要将数据映射成一个“可视化感知上明显”的比例(0~100%),用于设置圆的半径:

常规 min-max 归一化(线性映射)在数据集中分布集中时(例如 10~20)表现不佳。 对数归一化(log
scale)可以有效地“拉开”分布较集中的数据。

分位数归一化(Quantile) 也可以作为备选方案。

我们采用一种混合策略:

先判断数据的极差(max - min)是否很小,如果小则采用 对数归一化; 如果分布广泛则使用 min-max 线性归一化; 最终值映射为
0~100,用于绘制大小。

using System;
using System.Collections.Generic;
using System.Linq;public class CircleScaler
{/// <summary>/// 对输入的值进行归一化处理,输出 0~100 之间的比例,用于绘制圆半径/// </summary>public static List<double> GetAdaptiveRadiusScales(List<double> values){if (values == null || values.Count == 0)return new List<double>();double min = values.Min();double max = values.Max();double range = max - min;double avg = values.Average();double stdDev = Math.Sqrt(values.Average(v => Math.Pow(v - avg, 2)));List<double> result;// 集中度判断(标准差小于极差的10%)bool isConcentrated = stdDev < range * 0.1;if (isConcentrated){// 使用对数归一化,适合差异较小的数据double logMin = Math.Log(min + 1);double logMax = Math.Log(max + 1);double logRange = logMax - logMin;result = values.Select(v =>{double logVal = Math.Log(v + 1);return ((logVal - logMin) / logRange) * 100.0;}).ToList();}else{// 使用线性归一化 + 差异增强(平方)result = values.Select(v =>{double norm = (v - min) / range;double enhanced = Math.Pow(norm, 1.2); // 可调指数,越大差异越明显return enhanced * 100.0;}).ToList();}return result;}public static void Main(){var set1 = new List<double> { 10, 12, 11, 13, 15 };  // 集中型var set2 = new List<double> { 3, 50, 300, 800, 1000 }; // 广泛型var set3 = new List<double> { 0, 100, 500, 600, 700, 10000 }; // 极端型Console.WriteLine("【集中型】");PrintScales(GetAdaptiveRadiusScales(set1));Console.WriteLine("\n【广泛型】");PrintScales(GetAdaptiveRadiusScales(set2));Console.WriteLine("\n【极端型】");PrintScales(GetAdaptiveRadiusScales(set3));}private static void PrintScales(List<double> scales){foreach (var s in scales){Console.Write($"{s:F2}%  ");}}
}

输出示例:

【集中型】
0.00% 57.54% 28.77% 83.56% 100.00%

【广泛型】
0.00% 2.35% 15.46% 58.64% 100.00%

【极端型】
0.00% 0.46% 4.35% 6.88% 9.14% 100.00%

策略说明
线性归一化标准分布适用,保持相对比例
对数归一化值集中、小范围有效
指数增强(pow)加强视觉对比度(1.2 ~ 2.0)
自动判断(集中 vs 广泛)通过标准差与极差比,自动选择策略

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/diannao/91108.shtml
繁体地址,请注明出处:http://hk.pswp.cn/diannao/91108.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

具身智能零碎知识点(五):VAE中对使用KL散度的理解

VAE中对使用KL散度的理解什么是 VAE (Variational AutoEncoder)&#xff1f;从自编码器 (AE) 说起VAE&#xff1a;让潜在空间变得“有意义”和“连续”KL 散度是如何用到的&#xff1f;通俗理解 KL 散度在 VAE 中的作用&#xff1a;带来的好处&#xff1a;KL 散度公式 (无需背诵…

理解:进程、线程、协程

线程、进程和协程是并发编程的重要组成部分。进程&#xff08;Process&#xff09;定义进程是操作系统分配资源的基本单位&#xff0c;表示一个正在执行的程序。一旦一个程序被加载到内存中&#xff0c;它就成为一个进程&#xff0c;而每个进程都有其独立的内存空间。特征进程之…

总结一下找素数的三种方法

目录 一试除法 二埃氏筛 三线性筛(欧拉筛) 一试除法 思想&#xff1a;就是判断某个数x是不是素数,就判断从2开始到小于根号x的范围内有没有能够取余不等于0的,这个说明当前值就是x的一个因子&#xff0c;所以不是素数。 代码&#xff1a; import java.util.Scanner;public…

基于Yolov8车辆检测及图像处理系统【有代码】

0 引言 随着城市化进程的加速和机动车保有量的快速增长,交通管理、智能监控和自动驾驶等领域对车辆目标检测技术的需求日益增长。车辆目标检测是计算机视觉领域的一个重要研究方向,其目标是从图像或视频序列中准确识别和定位车辆,为后续的车辆跟踪、行为分析和交通流量统计…

MySQL密码管理器“mysql_config_editor“

目录 核心能力 常用命令速查 为什么更安全&#xff1f; 典型场景 mysql_config_editor 是 MySQL 官方自带的一款命令行小工具&#xff0c;作用一句话&#xff1a;把账号、密码、主机、端口等连接信息加密存起来&#xff0c;下次连接时只敲一个名字即可&#xff0c;不用再写…

Kubernetes高级调度01

目录 第一章&#xff1a;初始化容器&#xff08;InitContainer&#xff09;—— 应用启动前的 “准备军” 1.1 InitContainer 的基本概念与核心特性 1.2 InitContainer 与普通容器的关键区别 1.3 InitContainer 的实战场景与示例解析 1.3.1 示例 1&#xff1a;延迟启动 —…

LSV负载均衡

什么是访问压力&#xff1f;--负载 两个客户同时访问一个服务器&#xff0c;会导致服务器崩溃调度---Cluster集群&#xff08;为了解决一个特定问题&#xff0c;多台服务器组合使用形成的一个系统&#xff09;LSV 1、集群Cluster LB&#xff1a;负载均衡&#xff0c;有多个主机…

复习笔记 38

绪论 其实没有一种安稳快乐&#xff0c;永远也不差 专题 2 知识点 继续学数学强化吧&#xff1f;可以。还有概率论要学。还有高数后半部分的数一专项要学。还有政治要学。要学的内容确实还是挺多的啊。加油。下载了一个阅读的软件&#xff0c;可以做一做真题的阅读理解。政治英…

GaussDB like 的用法

1 like 作用在 where 子句中使用 like 运算符来搜索列中的指定模式。 有两个通配符与 like 运算符一起使用&#xff1a;&#xff05; - 百分号表示零个&#xff0c;一个或多个字符 _ - 下划线表示单个字符注&#xff1a;也同时支持正则表达式。2 like 语法select column1, colu…

单例模式:确保全局唯一实例

单例模式确保一个类只有一个实例&#xff0c;并提供全局访问点。适用于需要全局唯一对象的场景&#xff08;如配置管理器、数据库连接池&#xff09;。代码示例&#xff1a;import java.util.stream.IntStream;public class ConfigManager {public static void main(String[] a…

深入理解 QSettings:Qt 中的应用程序配置管理

在开发 Qt 应用程序时&#xff0c;管理应用程序的配置信息是一个常见的需求。无论是保存用户的偏好设置、窗口大小&#xff0c;还是应用程序的运行时配置&#xff0c;都需要一种高效且灵活的方式来存储和检索这些信息。Qt 提供了一个强大的工具——QSettings&#xff0c;它能够…

基于SpringBoot+Vue的体育馆预约管理系统(支付宝沙盒支付、腾讯地图API、协同过滤算法、可视化配置、可视化预约)

“ &#x1f388;系统亮点&#xff1a;支付宝沙盒支付、腾讯地图API、协同过滤算法、可视化配置、可视化预约”01系统开发工具与环境搭建—前后端分离架构 项目架构&#xff1a;B/S架构 运行环境&#xff1a;win10/win11、jdk17前端&#xff1a; 技术&#xff1a;框架Vue.js&am…

<script>标签对HTML文件解析过程的影响以及async和defer属性的应用

在前端开发中&#xff0c;<script> 标签的 async 和 defer 属性会显著影响 JavaScript 脚本的加载和执行时机。下面结合示例代码&#xff0c;详细解析它们之间的区别&#xff1a; 1. 默认情况&#xff08;无 async/defer&#xff09; <script src"script.js"…

Vue.js:从 Web 到桌面的跨端实践与技术选型指南

一、Vue.js 的核心能力边界 作为渐进式 JavaScript 框架,Vue.js 的核心价值在于构建现代 Web 用户界面: ✅ 前端核心场景:单页应用(SPA)、动态交互界面、可复用组件开发 ❌ 架构限制:无法直接改造 B/S(浏览器/服务器)为 C/S(客户端/服务器)架构 关键差异:B/S 依赖浏…

SSRF11 各种限制绕过之DNS rebinding 绕过内网 ip 限制

ssrf漏洞在厂商的处理下可能进行一些特殊处理导致我们无法直接利用漏洞 有以下四种&#xff1a; 1.ip地址限制绕过 2.域名限制绕过 3.30x跳转绕过域名限制 4.DNS rebinding绕过内网ip限制 本章我们讲DNS rebinding 绕过内网 ip 限制 DNS rebinding 绕过内网 ip 限制 假…

FreeRTOS之链表操作相关接口

FreeRTOS之链表操作相关接口1 FreeRTOS源码下载地址2 任务控制块TCB2.1 任务控制块TCB2.1.1 任务控制块的关键成员2.1.2 TCB 的核心作用2.2 ListItem_t2.3 List_t3 函数接口3.1 vListInitialise3.2 vListInitialiseItem1 FreeRTOS源码下载地址 https://www.freertos.org/ 2 …

项目一第一天

目录 总结MySQL&#xff1a; 最终还是得按照SQL的语法来实施。 1、MySQL的数据类型&#xff1a;指业务数据按照什么格式存储在数据库中的。 任何数据类型最常见的三种&#xff1a;字符串、整型和小数型。 如&#xff1a;宝贝计划这种存在视频的项目&#xff0c;你们的视频是存放…

STM32第二十天 ESP8266-01S和电脑实现串口通信(3)

1&#xff1a;透传透传&#xff08;又称透明传输&#xff09;是一种通信模式&#xff0c;其核心特点是&#xff1a;通信设备对传输的数据不做任何解析或处理&#xff0c;仅作为“管道”原封不动地转发数据&#xff0c;仿佛数据“透明”地穿过设备。透传的本质关键特征说明无协议…

微服务引擎 MSE 及云原生 API 网关 2025 年 3 月产品动态

点击此处&#xff0c;了解微服务引擎 MSE 产品详情。

在 Docker 上安装和配置 Kafka、选择用于部署 Kafka 的操作系统

消息代理是一种软件&#xff0c;充当在不同应用程序之间发送消息的中介。它的功能类似于服务器&#xff0c;从一个应用程序&#xff08;称为生产者&#xff09;接收消息&#xff0c;并将其路由到一个或多个其他应用程序&#xff08;称为消费者&#xff09;。消息代理的主要目的…