纯前端实现图片伪3D视差效果

作者:vivo 互联网前端团队- Su Ning

本文通过depth-anything获取图片的深度图,同时基于pixi.js,通过着色器编程,实现了通过深度图驱动的伪3D效果。该方案支持鼠标/手势与手机陀螺仪双模式交互,在保证性能的同时,为不同终端用户提供沉浸式的视觉体验。

本文提供配套演示代码,可下载体验:

Github | vivo-parallax

一、引言

在当今的网页设计与交互中,3D 效果能极大地提升用户的视觉体验和沉浸感。但是3D的物料设计成本依然很高,不仅需要专门的设计师掌握专业的建模工具,而且高精度模型带来的渲染压力也使移动端适配变得困难。

在这样的背景下,利用2D图片实现伪3D的效果,就展现出独特的价值。开发者能以极低的资源消耗,在常规图片素材上构建出具有空间纵深的交互效果。这种技术路径不仅规避了传统3D内容生产的复杂性,同时实现了视觉效果与性能消耗的平衡。

二、实现思路

相比二维平面,三维物体多了一个 z 轴作为深度信息。要让 2D 平面呈现 3D 纵深感,关键在于随着视角偏移时,画面中的物体产生不同程度的位移,从而营造前后视差,实现伪 3D 效果。

为此,我们可以通过深度图来获取图片的深度信息,根据这些信息对图片进行分层。当视角改变时,通过调整不同层的偏移来实现视差效果。

三、获取深度图

在前端获取深度图可以借助现有的预训练模型。例如使用 @huggingface/transformers 库,指定任务类型为 ‘depth-estimation’,并选择合适的预训练模型,目前的深度图推理模型尺寸普遍比较大,综合效果和模型尺寸最终选择了 ‘Xenova/depth-anything-small-hf’,量化后的模型尺寸为27.5mb。

import { pipeline } from '@huggingface/transformers';
export async function depthEstimator(url) {const depth_estimator = await pipeline('depth-estimation', 'Xenova/depth-anything-small-hf');const output = await depth_estimator(url);const blob=await output.depth.toBlob()return URL.createObjectURL(blob)
}

四、视差效果的实现

若想借助深度图实现图片分层,可依据深度区间进行划分。假设深度图中纯白的色值为 0,纯黑色值为 1,若将图片切分为两层,那么第一层的色值范围为 0 - 0.5,第二层则是 0.5 - 1。为使画面过渡更自然,可适当增加分层的数量。当镜头偏移时,层数越小的图片位移幅度越大,层数越大的图片位移幅度越小,借此便能实现视差效果。

然而,简单的分层会引发一个问题:不同层的位移可能导致上层的部分区域遮挡背景图案,而另一侧则会出现空白。

图片

针对空白部分,可采用光线步进算法进行颜色采样。

在此,我们选用 Pixi.js 来实现这一效果。作为一款轻量级的 2D 渲染引擎,Pixi.js 在跨平台 2D 动画、游戏及图形界面开发领域表现出色。其精灵支持自定义渲染管线,通过定制图片片段着色器,能够轻松实现视差效果。

4.1 光线步进算法(Ray Marching)

首先我们获取到需要采样颜色的坐标ray_origin,并根据用户的交互事件(鼠标,触摸,陀螺仪)增加镜头偏移offset。得到光线发射的起始坐标。

设置采样步数step,设置光线的偏移向量ray_direction,每一步将光线增加ray_direction/step的坐标。获取到当前深度图坐标的深度信息,由于颜色越浅数值越大,要对深度值进行反转,比对此时光线的z轴是否大于深度的反转值,如果满足条件则挑出循环,取此时光线坐标图片的颜色。

由于每一步增加的偏移值可能跨度比较大,即使满足z轴大于深度反转值的条件,但是二者值的差距依然过大,我们还需要做一个二分搜索来优化采样结果。即偏移值大于深度值,但二者的差值大于阈值的时候,回退一步光线,并将步进值再除以2,可以显著提升采样的精度。

图片

代码实现

varying vec2 vTextureCoord;
uniform sampler2D depthMap;
uniform sampler2D uSampler;
uniform vec3 offset;
const float enlarge = 1.06;vec3 perspective(vec2 uv) {const int step_count = 5;vec3 ray_origin = vec3(uv - 0.5, 0);ray_origin.xy -= offset.xy;vec3 ray_direction = vec3(0, 0, 1);ray_direction.xy += offset.xy;ray_direction /= float(step_count);const float hit_threshold = 0.01;vec4 color = vec4(0.0);for (int i = 0; i < step_count; i++) {ray_origin += ray_direction;float scene_z = 1.0 - texture2D(depthMap, ray_origin.xy + 0.5).x;if (ray_origin.z > scene_z) {if (ray_origin.z - scene_z < hit_threshold) {break;}ray_origin -= ray_direction;ray_direction /= 2.0;}}color = texture2D(uSampler, ray_origin.xy + 0.5);return color.rgb;
}void main(void ) {vec2 uv = (vTextureCoord - vec2(0.5)) / vec2(enlarge) + vec2(0.5);gl_FragColor = vec4(perspective(uv),1.0);
}

五、深度图膨胀

边缘膨胀操作主要用于处理深度图,通过对每个像素邻域内的深度值进行分析和处理,增强图像的边缘,可以使视差图的边缘更加平滑。这里使用一个简单的膨胀函数实现。

图片

varying vec2 vFilterCoord;
varying vec2 vTextureCoord;
uniform float widthPx;
uniform float heightPx;
uniform float dilation;
uniform sampler2D uSampler;
const int MAX_RADIUS = 10;float dilate(vec2 uv, vec2 px) {float maxValue = 0.0;float minValue = 1.0;for (int x = -MAX\_RADIUS; x <= +MAX_RADIUS; x++) {for (int y = -MAX\_RADIUS; y <= +MAX_RADIUS; y++) {vec2 offset = vec2(float(x), float(y));if (length(offset) > float(MAX_RADIUS)) continue;offset *= px;vec2 uv2 = uv + offset;float val = texture2D(uSampler, uv2).x;maxValue = max(val, maxValue);minValue = min(val, minValue);}}return dilation < 0.0? minValue: maxValue;
}void main(void ) {const float dilationScale = 1.26;float dilationStep = abs(dilationScale * dilation) / float(MAX_RADIUS);float aspect = widthPx / heightPx;vec2 px =widthPx > heightPx? vec2(dilationStep / aspect, dilationStep): vec2(dilationStep, dilationStep * aspect);gl_FragColor = vec4(vec3(dilate(vTextureCoord, px)), 1.0);}

六、总结

综上所述,我们先利用预训练模型生成图片的深度图,再借助 Pixi.js 与光线步进算法达成视差效果,最终通过对深度图进行膨胀处理,实现边缘的平滑过渡。

通过上面的操作,我们成功实现了图片的伪 3D 效果,为用户带来了更具沉浸感的视觉体验。

在实际应用过程中,我们观察到,当视角偏移幅度过大时画面会出现采样失真现象。为解决这一问题,后续可考虑采用动态调整光线步进参数的方法,根据视角变化实时优化光线传播路径,从而减少采样误差;或者引入屏幕空间遮挡关系,通过精准模拟物体间的遮挡效果,增强画面的真实感与层次感。随着 WebGPU 技术的逐步普及,这一方案还有极大的优化空间。我们可借助计算着色器强大的并行计算能力,对复杂的 3D 计算任务进行高效处理,进一步提升计算性能,为网页端 3D 交互开辟更多可能性,打造更加流畅、逼真的 3D 交互场景。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.pswp.cn/diannao/85321.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

英语写作中“专注于”focus on、concentrate的用法

Focus on在论文写作中常用&#xff0c;指出研究点&#xff0c;例如&#xff1a; There are three approaches to achieving ID authentication. Our study will focus on ……&#xff08;有三种途径实现身份认证&#xff0c;我们的研究专注于……&#xff09; concentrate &…

go环境配置

下载对应版本的 go 版本 https://go.dev/dl/ 配置 vim ~/.zshrc export GOROOT/usr/local/go export PATH$PATH:$GOROOT/binsource ~/.zshrc >>>>>> go versiongoland 配置&#xff1a; &#x1f50d; 一、什么是GOPATH&#xff1f; GOPATH 是旧的项目结…

AI Agent智能体:底层逻辑、原理与大模型关系深度解析·优雅草卓伊凡

AI Agent智能体&#xff1a;底层逻辑、原理与大模型关系深度解析优雅草卓伊凡 一、AI Agent的底层架构与核心原理 1.1 AI Agent的基本构成要素 AI Agent&#xff08;人工智能代理&#xff09;是一种能够感知环境、自主决策并执行行动的智能系统。其核心架构包含以下关键组件…

【手搓一个原生全局loading组件解决页面闪烁问题】

页面闪烁效果1 页面闪烁效果2 封装一个全局loading组件 class GlobalLoading extends HTMLElement {constructor() {super();this.attachShadow({ mode: open });}connectedCallback() {this.render();this.init();}render() {this.shadowRoot.innerHTML <style>.load…

unix/linux source 命令,其高级使用

就像在物理学中,掌握了基本定律后,我们可以开始研究更复杂的系统和现象,source 的高级用法也是建立在对其基本行为深刻理解之上的。 让我们一起探索 source 的高级应用领域: 1. 条件化加载 (Conditional Sourcing) 根据某些条件来决定是否 source 一个文件,或者 source…

DexGarmentLab 论文翻译

单个 专家 演示 装扮 15 任务 场景 2500+ 服装 手套 棒球帽 裤子 围巾 碗 帽子 上衣 外套 服装-手部交互 捕捉 摇篮 夹紧 平滑 任务 ...... 投掷 悬挂 折叠 ... 多样化位置 ... 多样化 变形 ... 多样化服装形状 类别级 一般化 类别级(有或没有变形) 服装具有相同结构 变形 生…

WPF-Prism学习笔记之 “导航功能和依赖注入“

新建空白模板(Prism) 新建好后会有自动创建ViewModels和Views 在"MainWindow.xaml"文件里面标题去绑定了一个属性"Title"&#xff0c;而"MainWindowViewModel.cs"里面继承一个非常重要的"BindbleBase"(prism框架里面非常重要的)。所以…

《C++初阶之入门基础》【C++的前世今生】

【C的前世今生】目录 前言&#xff1a;---------------起源---------------一、历史背景二、横空出世---------------发展---------------三、标准立世C98&#xff1a;首个国际标准版本C03&#xff1a;小修订版本 四、现代进化C11&#xff1a;现代C的开端C14&#xff1a;对C11的…

YOLOv5-入门篇笔记

1.创建环境 conda create -n yolvo5 python3.8 去pytorch.org下载1.8.2的版本。 pip --default-timeout1688 install torch1.8.2 torchvision0.9.2 torchaudio0.8.2 --extra-index-url https://download.pytorch.org/whl/lts/1.8/cu111 github上下载yolov5的zip pip --def…

【PostgreSQL 03】PostGIS空间数据深度实战:从地图服务到智慧城市

PostGIS空间数据深度实战&#xff1a;从地图服务到智慧城市 关键词 PostGIS, 空间数据库, 地理信息系统, GIS, 空间查询, 地理分析, 位置服务, 智慧城市, 空间索引, 坐标系统 摘要 PostGIS是PostgreSQL的空间数据扩展&#xff0c;它将普通的关系数据库转变为强大的地理信息系统…

科技修真的解决方案

“科技修真”是一个结合现代科技与修真&#xff08;玄幻&#xff09;元素的创新概念&#xff0c;通常出现在科幻或玄幻文学作品中&#xff0c;但也可能指代现实中的科技与传统文化、超自然理念的融合探索。以下是几种可能的“科技修真”方案&#xff0c;涵盖技术实现、文化融合…

STM32的HAL编码流程总结(上部)

目录 一、GPIO二、中断系统三、USART串口通信四、I2C通信五、定时器 一、GPIO 1.选择调试类型 在SYS中Debug选择Serial Wire模式 2.选择时钟源 在RCC中将HSE和LSH都选择为内部晶振 3.时钟树配置 4.GPIO配置 在芯片图上选择开启的引脚和其功能 配置引脚的各自属性 5.工…

java直接获取MyBatis将要执行的动态sql命令(不是拦截器方式)

目录 前言 一. 准备数据 1. 传输过来的json条件数据 2. mybatis 配置的动态sql 3. 想要的最终会执行的sql并返回给页面展示 二. 实现方式 三. 最终代码 前言 1.在平常开发过程中,MyBatis使用时非常多的,一般情况下我们只需要在控制台看看MyBatis输出的日志,要不就是实…

机器学习算法-决策树

今天我们用一个 「相亲决策」 的例子来讲解决策树算法&#xff0c;保证你轻松理解原理和实现&#xff01; &#x1f333; 决策树是什么&#xff1f; 决策树就像玩 「20个问题」猜谜游戏&#xff1a; 你心里想一个东西&#xff08;比如「苹果」&#xff09; 朋友通过一系列问题…

2025——》VSCode Windows 最新安装指南/VSCode安装完成后如何验证是否成功?2025最新VSCode安装配置全攻略

1.VSCode Windows 最新安装指南: 以下是 2025 年 Windows 系统下安装 Visual Studio Code(VSCode)的最新指南,结合官方文档与实际操作经验整理而成: 一、下载官方安装包: 1.访问官网: 打开浏览器,进入 VSCode 官方下载页面https://code.visualstudio.com/Download 2…

【Elasticsearch】suggest

在Elasticsearch中&#xff0c;suggest 是一个非常强大的功能&#xff0c;用于实现自动补全、拼写纠错和模糊搜索等功能。它可以帮助用户更快地找到他们想要的内容&#xff0c;同时提升搜索体验。以下是关于 suggest 的详细使用方法和常见场景。 1\. Suggest 的基本概念 sugges…

[SAP] 如何查询当前屏幕的Tcode?

事务代码Tcode是SAP中到达特定屏幕的快捷路径 如何查询以下屏幕的事务码Tcode&#xff1f; 要浏览当前所使用的屏幕的事务码&#xff0c;可以选择System | Status 这里的事务代码是[VA22]&#xff0c;它是Change Quotation的事务代码

PostgreSQL的扩展 dblink

PostgreSQL的扩展 dblink dblink 是 PostgreSQL 的一个核心扩展&#xff0c;允许在当前数据库中访问其他 PostgreSQL 数据库的数据&#xff0c;实现跨数据库查询功能。 一、dblink 扩展安装与启用 1. 安装扩展 -- 使用超级用户安装 CREATE EXTENSION dblink;2. 验证安装 -…

ADB推送文件到指定路径解析

您执行的命令 adb push ota.zip /sdcard/Download 中&#xff0c;目标路径 /sdcard/Download 是您显式指定的&#xff0c;因此 ADB 会直接将文件推送到此位置。具体过程如下&#xff1a; 1. 命令结构解析 adb push&#xff1a;ADB 的推送指令。ota.zip&#xff1a;本地计算机上…

Linux 内核中 skb_orphan 的深度解析:从版本差异到核心机制

引言 在 Linux 内核网络子系统中,struct sk_buff(简称 skb)是管理网络数据包的核心数据结构。skb_orphan 作为其生命周期管理的关键函数,负责切断 skb 与所属 socket 的关联,确保数据包在复杂处理流程中的独立性。本文将从代码实现、版本差异、使用场景等多个维度,深入解…