解码 Red Stuff:Walrus 高效可靠存储的引擎

  • Red Stuff 是 Walrus 所采用的二维(2D)纠删码协议,定义了数据如何被编码和存储。它是实现高效、安全、且高可用的去中心化存储的关键。
  • 通过 Red Stuff,Walrus 成功解决了去中心化存储系统常见的三大难题:安全性复制效率和数据恢复速度。
  • 其矩阵编码机制可生成主切片和副切片,实现轻量级“自我修复”,从而在使用极少网络带宽的同时实现快速恢复。
  • 对开发者而言,Red Stuff 带来的创新意味着:一个更具性价比更高性能更强弹性更易扩展的存储网络。

Walrus 的 Red Stuff 编码协议定义了数据如何转换为可存储的格式,是 Walrus 实现大规模 blob 数据高可用性与完整性的核心所在。

传统的中心化云存储虽然性能强大,但也带来了单点故障、审查风险和激励机制失衡等问题。去中心化存储网络旨在通过构建一个可信中立的持久数据系统来改善这一现状,但在实现过程中往往面临一系列基本的权衡挑战。

Red Stuff 让 Walrus 能够直接应对这些去中心化存储的传统难题,实现高安全性和高效、不中断的数据可用性,即使在节点频繁变动或部分宕机的情况下也能稳定运行。这种突破使 Walrus 在保留去中心化优势的同时,其性能也能媲美中心化云存储解决方案。

理解去中心化存储的权衡取舍

与由单一服务商基础设施管理的中心化云存储不同,去中心化存储系统将数据分布在多个独立节点上。这种架构增强了系统的弹性与抗审查能力。

然而,由于存储节点可能随时离线或故障(形成“高波动”环境),去中心化也带来了新的挑战:如何确保数据始终可用并持久保存。通常可通过在网络多个节点间复制数据来提升可用性 — — 当某个节点宕机或离线时,其存储的数据可从其他节点的冗余副本中恢复。

正因为这种高节点波动与复制的特殊挑战,去中心化存储网络在设计时必须在以下几个核心目标之间做出权衡:

  • 成本效率:通过减少冗余复制来降低存储开销;
  • 数据持久性与可用性:需具备高效的数据恢复机制,以及在部分节点失效时仍能正常运行的容错能力;
  • 性能表现:包括数据检索延迟与恢复速度;
  • 安全性与信任保障:例如确保节点分布足够去中心化,并能对存储行为进行可验证。

一个去中心化存储网络在高节点变动(high-churn)环境下实现数据持久性的方式,会直接影响其在各项核心指标之间的权衡。当前常见的两种方法是:全量复制(Full Replication)和一维纠删码(1D Erasure Coding)

  • 全量复制:全量复制是指将数据的完整副本存储在多个节点上。这种方式的优点是数据恢复简单 — — 新节点只需从任一存有完整副本的节点下载一份即可。但缺点也十分明显:为了实现足够的数据安全性,网络中必须保存大量副本,导致存储成本极高。对于大规模数据,这种方式变得不具备成本效益。
  • 一维纠删码(如 Reed-Solomon,RS 编码):1D 纠删码是一种空间效率更高的替代方案。其原理是将一个文件拆分为多个数据片段,然后再基于这些原始片段生成冗余的“奇偶校验片段”(parity fragments)。只需一部切片段即可还原整个数据文件,因此相比全量复制,所需的副本数量显著减少,节省了存储资源然而,1D 纠删码也有严重局限:若某一片段丢失或损坏,节点需下载近乎整个文件的数据量才能恢复该片段。在节点频繁上下线的动态网络环境中,这种“高带宽修复”流程成为性能瓶颈,不利于网络扩展,且提高了运行成本。

因此,大多数去中心化存储网络在这两种常规方案之间必须权衡:要么承担高昂的复制成本,要么接受低效的数据恢复机制

Blob 与去中心化存储

Walrus 专为支持二进制大型对象(Blob,Binary Large Object)存储而设计,使开发者能够存储、读取、管理并编程操作大型数据与多媒体文件。Blob 存储因其灵活性、可扩展性,以及对传统上难以处理的非结构化数据的支持而备受青睐。

Blob 尤其适合处理大型数据文件 — — “大对象”正是它的命名由来。在存储与检索这类数据时,使用全量复制会带来极高的存储开销,而传统纠删码方式的恢复效率低下,也可能成为严重的性能瓶颈。主流的去中心化存储复制方案,在大规模 Blob 存储需求下都难以满足实际要求。

Red Stuff:高效且不牺牲数据恢复能力

Red Stuff 是 Walrus 的核心技术创新之一,它是一种二维纠删码(2D Erasure Coding)协议。Red Stuff 是 Walrus 能够实现高冗余、高安全的去中心化 Blob 存储的关键,同时还能保证在存储节点波动或故障的情况下实现高效的数据恢复。

Red Stuff 继承了纠删码的存储效率优势 — — 在只需极少冗余的前提下,提供与全量复制相同级别的数据耐久性。同时,它也解决了一维纠删码(如 RS 编码)在恢复数据时所面临的高带宽开销问题,引入了高效的“自我修复”机制。

如需深入了解 Red Stuff 的二维纠删码原理,可阅读 Walrus 白皮书。简要来说,传统的一维纠删码仅在一个维度上对数据进行切片,而二维纠删码则在两个维度上切片,使得数据恢复更加精细化、效率更高。

Red Stuff 编码一个数据 blob 的流程如下,这也有助于理解其核心机制:

  1. 矩阵构建(Matrix formation):原始数据 blob 首先被组织成一个由若干行与列构成的矩阵,这一二维结构为后续的编码操作打下基础。
  2. 主编码(Primary Encoding):初始矩阵中的每一列被视为一个独立的数据块,分别进行纠删码处理。这些编码操作生成一个更大的中间矩阵,该矩阵每一行中的原始符号构成了一个主切片(primary sliver)。
  3. 副编码(Secondary Encoding):与主编码并行,初始矩阵中的每一行也作为独立数据块进行纠删码处理,生成另一个更大的中间矩阵。该矩阵每一列中的原始符号则构成了一个副切片(secondary sliver)。
  4. 切片配对与分发(Sliver pair distribution):编码完成后,协议会为 Walrus 当前活跃委员会中的每个存储节点分配一对唯一切片 — — 一个主切片和一个副切片。

这种二维结构是 Red Stuff 实现高效率的关键所在:每个节点的主切片包含来自原始矩阵所有列的编码数据,而副切片则包含所有行的编码数据。这种横向和纵向双重冗余,使得 Red Stuff 的自我修复系统(Self-healing)得以实现,与传统一维纠删码方案相比,其数据恢复过程更加高效、资源占用更低。

自我修复机制(Self-healing)

Red Stuff 的一大优势在于其高效的“自我修复”能力,这也是 Walrus 网络能在节点频繁变动(node churn)时依然保持高可用性的关键。

借助二维纠删码结构,Red Stuff 极大地减少了数据重建所需的带宽,从根本上解决了一维纠删码在数据恢复时需传输大量数据的问题:在传统的一维纠删码系统中,恢复一个文件通常需要下载接近整个文件大小的数据;而在二维纠删码中,节点只需下载一个切片(sliver)大小的数据即可完成恢复,这使得重建过程更加轻量且具可扩展性。

Walrus 中每个节点存储的是一对切片(主切片 + 副切片),这两个切片的恢复方式略有不同:

  • 副切片恢复(Secondary Sliver Recovery):当一个节点崩溃并重新上线,或新节点加入活跃委员会时,会优先恢复其对应的副切片。该节点只需从约 1/3 个其他节点 处请求数据即可。由于每个 blob 的副切片被 2/3 的节点所持有,因此该节点必然能从网络中获取足够数据来重建副切片。
  • 主切片恢复(Primary Sliver Recovery):主切片的恢复对响应节点的数量要求更高,需要 2/3 的节点回应。但总体流程与副切片类似。

这一轻量级的恢复机制使得 Walrus 网络在面对节点上线、掉线或更换时仍能保持数据稳定性和可用性,同时也使新节点的接入变得更为高效、不会对网络造成拥堵。

Red Stuff 的其他优势:数据完整性与容错性

作为 Walrus 的编码协议,Red Stuff 所带来的好处不仅仅是解决去中心化存储中在安全性、复制效率与数据恢复效率之间的权衡问题,它还在数据完整性与容错性方面提供了强大保障。

数据完整性(Data Integrity)

为了确保数据未被篡改,并防止恶意节点返回损坏或编码不一致的数据,Red Stuff 采用向量承诺(vector commitment)机制对数据结构进行加密验证,主要包括:

  • 切片承诺(Sliver Commitments)在编码过程中,对每一个生成的主切片和副切片,都会计算一个加密的向量承诺(cryptographic vector commitment)。该承诺可用于之后验证某个具体数据是否存在于某个切片的特定位置,无需下载整个切片,即可实现无信任验证
  • Blob 承诺(Blob Commitment):在生成所有切片的承诺后,系统会对这些切片承诺的列表生成一个最终的 Blob 承诺。这个顶层承诺可视为该 blob 的加密“指纹”,用于标识整个编码状态的唯一性和完整性。
  • Blob ID 生成:最终,该 Blob 的全球唯一标识符(Blob ID)通过对 Blob 承诺及相关元数据进行加密哈希计算得出。

Red Stuff 的这些机制,不仅提升了 Walrus 存储协议的安全性与可靠性,也为构建具备强一致性与抗篡改能力的数据存储系统提供了坚实基础。这一承诺过程为 Walrus 上的数据生命周期提供了端到端的可验证性。当一个存储节点接收到其一对切片(sliver pair)时,它可以验证这些切片是否与公开的承诺一致。同样地,当读取者从网络中检索切片时,也可以在重建数据前,对切片进行与承诺匹配的真实性验证。

这有效防止了恶意节点提供无效数据的攻击行为,因为这些无效数据在与最初写入者的承诺进行验证时会直接失败。

容错机制(Fault Tolerance)

Red Stuff 协议的另一大特色在于,它对诚实且活跃的存储节点设置了不同的法定人数(quorum)阈值,从而支撑 Walrus 的安全性、可用性与容错能力

为了将数据 blob 写入 Walrus,Walrus 活跃集中 2/3 的存储节点必须确认已接收 blob 的切片对,并验证其切片承诺。但是,在读取和检索 blob 时,客户端只需从 1/3 的仲裁节点收集和验证切片。

与 Red Stuff 写入所需的 2/3 节点仲裁相比,Red Stuff 较低的 1/3 读取仲裁使 Walrus 上的读取具有极强的弹性。 Red Stuff 的自愈过程也采用了不同的法定人数,需要 1/3 的法定人数才能恢复次级分片,而需要 2/3 的法定人数才能重建主分片。

通过定义不同的法定人数,Red Stuff 允许 Walrus 在诚实节点之间进行高效的恢复操作,因为它需要更少的参与者。它为关键操作(例如数据重建和存储证明)设定了更高的标准,确保任何成功的操作都经过足够数量的诚实参与者的验证。

您可以在此处的文章中了解生成承诺、创建 Blob ID 以及在 Walrus 上读写 Blob 的过程,它们各自位于 Walrus Blob 存储生命周期的各个阶段。

开始体验 Walrus!

Red Stuff 协议是 Walrus 能够突破传统去中心化存储权衡难题的关键。对开发者而言,Red Stuff 的创新让 Walrus 成为一个更加:

  • 具性价比:以极低的存储冗余换取高度安全性,远优于传统的完全复制模型。
  • 高性能:在大规模数据存储场景中,实现高可用性与完整性,使 Walrus 成为真正可替代传统云存储的去中心化解决方案。
  • 强韧且可扩展:轻量级自我修复机制帮助网络灵活应对节点波动,避免高带宽成本,确保数据始终可用。

再加上 Walrus 其他核心技术创新(如数据可编程性),它已成为面向 Web3 应用的新一代数据存储平台。通过将 Walrus 存储的 blob 表示为 Sui 上的对象,开发者可利用 Move 智能合约以全新方式管理和交互数据,例如:自动化 blob 生命周期管理、构建链上与链下数据的动态交互、实现链上数据验证。

想要了解更多 Walrus?现在就查看 Walrus 文档 开始构建你的去中心化应用!也可以探索开发者精选工具集与项目资源 👉 Awesome Walrus GitHub 仓库。


关于 Sui Network

Sui是基于第一原理重新设计和构建而成的L1公有链,旨在为创作者和开发者提供能够承载Web3中下一个十亿用户的开发平台。Sui上的应用基于Move智能合约语言,并具有水平可扩展性,让开发者能够快速且低成本支持广泛的应用开发。获取更多信息:https://linktr.ee/sui_apac

官网|英文Twitter|中文Twitter|Discord|英文电报群|中文电报群

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/diannao/89809.shtml
繁体地址,请注明出处:http://hk.pswp.cn/diannao/89809.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【ACP】阿里云云计算高级运维工程师--ACP

文章目录1、简要介绍2、核心特点3、考试相关信息4、适合人群1、简要介绍 阿里云云计算认证ACP(Alibaba Cloud Certified Professional)是面向云计算技术与应用从业者的专业级认证,旨在评估考生对阿里云云计算产品的理解、部署、运维及最佳实…

快速掌握Python编程基础

干货分享,感谢您的阅读!备注:本博客将自己初步学习Python的总结进行分享,希望大家通过本博客可以在短时间内快速掌握Python的基本程序编码能力,如有错误请留言指正,谢谢!(持续更新&a…

「Java案例」鸡兔同笼问题

案例解析 鸡兔同笼求解 《孙子算经》是中国古代重要的数学著作,成书于南北朝时期,其中就记载了一个有趣的问题:鸡和兔在同一个笼子里,鸡和兔共有n条腿, m个头,问鸡和兔各有多少只?编写一个程序…

BLDC电机-运动控制---stm32时钟树定时器SYSTICKRTC的学习

一、时钟树 二、基本定时器 三、通用定时器 四、高级定时器 五、SYSTICK 六、RTC

Implementing a User-Defined Preconditioner in PETSc

文章目录Implementing a User-Defined Preconditioner in PETScBasic ApproachExample ImplementationUsing Your PreconditionerAdvanced OptionsImportant NotesUsing PCShell to Implement User-Defined Preconditioners in PETScBasic Implementation StepsAdvanced Featur…

DotNetBrowser 3.3.0 版本发布啦!

#Chromium 137 安全修复一次调用即可下载 URL更新了 Widevine APIDOM 元素绝对边界 🔗 点击此处了解更多详情。 🆓 获取 30 天免费试用。

Android-自定义View的实战学习总结

一、自定义View歌词界面LrcView 类-->自定义的歌词视图1. 构造函数和属性初始化自定义 View 通常需要提供多个构造函数以支持不同的初始化方式。在 LrcView 中,提供了四个构造函数,最终调用 super 父类构造函数完成初始化, context.obtain…

Maven 在 Eclipse 中的使用指南

Maven 在 Eclipse 中的使用指南 概述 Maven 是一个强大的构建自动化工具,用于项目管理和构建。它简化了项目构建、依赖管理和项目报告等任务。Eclipse 是一个流行的集成开发环境(IDE),支持多种编程语言,包括 Java。本文将详细介绍如何在 Eclipse 中使用 Maven 进行项目管…

zxing去白边

2025年了,可能干不了几年了,还能写这种文章还是有点可笑。 背景 zxing库生成的二维码自带白边 分析 生产二维码主要分两步: 1.用QRCodeWriter生成BitMatrix信息 2.根据信息生成bitmap 问题在1。 生成二维码的尺寸实际是有一些规格的&a…

Linux操作系统之文件(三):缓冲区

前言: 上节课我们讲授重定向的概念时,曾提到了一点缓冲区的概念。本文将会为大家更详细的带来缓冲区的有关内容:用户级缓冲区是什么,以及其与内核级缓冲区的关系,最后,我会为大家模拟实现一下stdio.h的关于…

Linux云计算基础篇(7)

一、< 输入重定向 wc -l < filelist .txt 统计数据&#xff0c;从file这个文件拿结果。 二、tr 转换字符命令 $ tr A-Za-z<.bash_profile 将bash_profile文件中的大写字符全部转成小写字符 三、管道符&#xff08;|&#xff09; com…

【学习笔记】Lean4基础 ing

文章目录 概述参考文档运行程序elan 命令行工具lean 命令行工具lake 命令行工具运行单文件程序Hello, world!验证 Lean4 证明 运行多文件项目 Lean4 基础语法注释表达式求值变量和定义定义类型变量 定义函数命名规则命名空间数据类型结构体构造子模式匹配多态List 列表Option 可…

FPGA实现40G网卡NIC,基于PCIE4C+40G/50G Ethernet subsystem架构,提供工程源码和技术支持

目录 1、前言工程概述免责声明 3、相关方案推荐我已有的所有工程源码总目录----方便你快速找到自己喜欢的项目我这里已有的以太网方案 4、工程详细设计方案工程设计原理框图测试用电脑PClE4CDMA40G/50G Ethernet subsystem工程源码架构驱动和测试文件 5、Vivado工程详解1详解&a…

SAP从入门到放弃系列之流程管理概述

文章目录前言1.Process Management&#xff08;过程管理&#xff09;2.关键术语2.1Control recipe destination2.2 Process instruction characteristic2.3 Process message characteristic2.4 Process instruction category2.5 Process message category2.6 PI sheet3.关键配置…

RCLAMP0554S.TCT升特Semtech 5通道TVS二极管,0.5pF+20kV防护,超高速接口!

RCLAMP0554S.TCT&#xff08;Semtech&#xff09;产品解析与推广文案 一、产品定位 RCLAMP0554S.TCT是Semtech&#xff08;升特半导体&#xff09;推出的5通道超低电容TVS二极管阵列&#xff0c;专为超高速数据接口&#xff08;USB4/雷电4/HDMI 2.1&#xff09;提供静电放电&a…

【人工智能】DeepSeek的AI实验室:解锁大语言模型的未来

《Python OpenCV从菜鸟到高手》带你进入图像处理与计算机视觉的大门! 解锁Python编程的无限可能:《奇妙的Python》带你漫游代码世界 DeepSeek作为中国AI领域的先锋,以其开源大语言模型(LLM)DeepSeek-V3和DeepSeek-R1在全球AI研究中掀起波澜。本文深入探讨DeepSeek AI实验…

nacos+nginx动态配置大文件上传限制

前言 今天还要跟大家分享的一个点就是微服务网关gateway用webflux响应式不用servlet后&#xff0c;引发的一个忽略点差点在演示的时候炸锅&#xff0c;也不多讲废话&#xff0c;说说现象&#xff0c;说说处理就了事。 一、上传超过20MB的视频报错 配置在nacos里&#xff0c;读…

mr 任务运行及jar

mainclass如下&#xff1a;LoggingDriver

Python 数据分析:numpy,抽提,整数数组索引与基本索引扩展(元组传参)。听故事学知识点怎么这么容易?

目录1 代码示例2 欢迎纠错3 论文写作/Python 学习智能体------以下关于 Markdown 编辑器新的改变功能快捷键合理的创建标题&#xff0c;有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右Sm…

ECU开发工具链1.10版:更强大的测量、校准与数据分析体验.

汽车电子开发与测试领域&#xff0c;高效、精准且安全的工具是成功的基石。DiagRA X 作为一款广受认可的 Windows 平台综合解决方案&#xff0c;持续引领行业标准。其最新发布的 1.10 版本带来了显著的功能增强与用户体验优化&#xff0c;进一步巩固了其在 ECU 测量、校准、刷写…