多张图片生成视频模型技术深度解析

多张图片生成视频模型测试

相比纯文本输入,有视觉参考约束的生成通常质量更稳定,细节更丰富

1. 技术原理和工作机制

多张图片生成视频模型是一种先进的AI技术,能够接收多张输入图像,理解场景变化关系,并合成具有时间连续性的视频内容。与传统的单图生视频模型相比,多图生视频模型能够更好地保留空间关系、处理多主体交互,并实现更复杂的场景转换。

1.1 基础技术框架

多张图片生成视频模型主要建立在扩散模型(Diffusion Models)架构之上,特别是扩散Transformer(Diffusion Transformer)变体。这些模型的工作原理基于以下核心步骤:

  1. 数据预处理:将输入的多张图像进行对齐、注册和特征提取
  2. 时空编码:同时建模空间特征(图像的空间信息)和时间特征(图像间的时序关系)
  3. 扩散过程:在训练过程中,模型向数据添加噪声,然后学习如何逆向去除噪声
  4. 逆扩散过程:生成时,从噪声开始,逐步生成更清晰的视频帧序列
  5. 时空一致性保证:通过特殊设计的注意力机制或额外约束,确保相邻帧之间的时空一致性

微软研究院指出:“图生视频扩散模型在生成高质量视频时,依赖于空间编码、时间注意力和扩散去噪模块的协同作用。”

1.2 工作流程

以MAGREF(Masked Guidance for Any-Reference Video Generation)为例,多张图片生成视频的一般工作流程如下:

  1. 输入处理:接受多张输入图像(如人物、物体和背景图像)
  2. 特征提取:通过视觉编码器(如CLIP Vision Encoder)提取各图像的视觉特征
  3. 概念融合:通过Q-Former模块和解耦注意力模块(DAM)融合多张图像的概念信息
  4. 视频生成:将融合的概念信息注入到基础视频生成模型(如DiT)中进行视频合成
  5. 后处理:进行视频增强、帧率调整和画面优化

MAGREF技术支持"基于多张图片和一段提示词,生成高质量的视频内容",能够"将参考图像中的主体精准地融合到生成的视频中"。

2. 主要技术实现方案和代表性模型

2.1 扩散模型系列

扩散模型是当前多图生视频领域的主流技术路线,代表性模型包括:

模型名称技术特点开发方优势
DiT(Diffusion Transformer)将扩散模型与Transformer结合,适用于多模态生成Meta稳定性高,可生成高质量内容
MAGREF基于掩码引导的多参考视频生成框架字节跳动能精准融合多张参考图像信息
AnimateDiff无需特定调优的个性化文生图扩散模型研究院论文适应性强,适用范围广
Tune-A-Video通过微调实现帧间一致性的视频生成ICCV 2023论文专注于帧间一致性

DiT模型被认为是"能够生成高质量图像和视频的大型扩散模型",它"结合了扩散模型和Transformer架构的优势,能够生成高质量、多样性的视频内容"。

2.2 字节跳动的MAGREF和Phantom

2.2.1 MAGREF技术详解

MAGREF(Masked Guidance for Any-Reference Video Generation)是字节跳动开源的多图参考视频生成框架,其核心技术特点包括:

  1. 多图参考机制:支持单图、双图乃至三图参考生成视频
  2. 掩码引导技术:通过精确的掩码控制不同图像的融合过程
  3. 主体一致性保障:特别优化了多主体场景下的一致性保持
  4. 零样本生成:无需大量标注数据也能生成高质量视频

MAGREF"能够灵活理解多张图片作为输入,可以将多个主体、多个特征之间的关系作为上下文进行记忆和关联"。这一技术"支持基于多张图片和一段提示词,生成高质量的视频内容",特别擅长"将参考图像中的主体精准地融合到生成的视频中"。

2.2.2 Phantom框架

Phantom是字节跳动另一个视频生成框架,据InfoQ报道:“Phantom是字节发布的一个统一的视频生成框架,适用于单主体和多主体参考,基于现有的文生视频、图生视频架构”。Phantom在多主体一致性方面表现出色,能有效解决视频生成中常见的人物或物体特性漂移问题。

2.3 可灵AI的多主体视频生成技术

可灵AI的多主体视频生成技术采用了创新的ConceptMaster架构:

  1. 基于Video DiT架构:采用3D VAE将视频转到latent空间
  2. Q-Fromer模块:从视觉tokens提取特征
  3. 解耦注意力模块(DAM):融合文本特征和视觉特征
  4. 多概念注入器(MC-Injector):将主体信息注入到生成模型中

可灵AI的多图参考模式允许用户"上传一张或多张同一主体(人物、动物、影视角色或物品等)的图片,模型会以这些图片为参考,生成统一风格的视频",从而"在制作AI视频时保证多镜头中的角色或物体一致性"。

2.4 Vidu AI技术

Vidu AI提供了先进的参考图生视频功能:

  1. 多图融合机制:允许用户上传3张或更多张参考图片
  2. 元素整合能力:将多个图片元素整合到同一个视频中
  3. 多角度处理:用户可上传同一主体的多个角度图片
  4. 无缝衔接生成:确保生成视频中视觉元素的连贯性

Vidu AI"根据提示词将多个视觉元素融合,生成一个无缝衔接的视频",特别强调多角度输入的处理能力。

3. 核心优势和技术创新点

3.1 革命性的图像关系理解

多图生视频模型最大的突破在于能够理解并保留多张输入图像之间的关系:

  1. 空间关系保留:准确保留不同场景元素间的空间布局
  2. 多主体交互建模:能够模拟多个主体间的自然交互
  3. 上下文关联记忆:将多张图像中的信息作为整体上下文理解
  4. 特征融合能力:从多视角图像中融合互补信息

MAGREF"能够灵活理解多张图片作为输入,可以将多个主体、多个特征之间的关系作为上下文进行记忆和关联",这是对传统单图生视频技术的重大突破。

3.2 生成质量的飞跃

与早期技术相比,多图生视频模型在生成质量上实现了显著提升:

  1. 更高分辨率:支持生成高分辨率视频内容
  2. 更长时长:能够生成长达数秒的高质量视频
  3. 更丰富细节:保留更多输入图像中的细节信息
  4. 更强一致性:减少时空幻觉,保持主体特性一致

据微软研究院分析:“视频扩散模型通常会以图像扩散模型为基础,用文本描述和先生成一堆图片,再对这些图片进行排序和编辑,最终合成视频”。而多图生视频模型则直接利用多图输入的优势,跳过了中间步骤,提高了生成效率和质量。

3.3 参数高效微调技术

多图生视频模型普遍采用参数高效微调技术:

  1. LoRA适配器:通过低秩适应修改模型行为
  2. Adapter模块:在不改变原模型架构的情况下增加新参数
  3. 零样本能力:减少对大量标注数据的依赖
  4. 计算资源优化:使模型能在有限算力下运行

Tune-A-Video就是"通过学习一个网络权重,来学习一个视频帧与帧之间的一致性"的代表作,实现了参数高效的视频生成能力。

3.4 时空建模创新

多图生视频模型在时空建模方面有独特创新:

  1. 3D卷积增强:在时频空间应用卷积操作
  2. 时空注意力机制:同时考虑空间和时间维度的依赖关系
  3. 帧间一致性约束:通过损失函数确保相邻帧的连贯性
  4. 运动建模:学习图像间的变化和运动模式

在MAGREF中,“temporal layers中主要包含两个核心网络层,一个是3D卷积,一个是temporal attention。显然这两者都具备处理五维张量的能力”,从而实现了对时空信息的有效建模。

4. 应用场景和实际案例

多图生视频模型技术已经应用于多个领域,展示了其广泛的应用前景:

4.1 数字内容创作

在数字内容创作领域,多图生视频模型极大地提高了创作效率:

  1. 广告制作:根据多张产品图片快速生成宣传视频
  2. 社交媒体内容:批量生成适合各平台的视频内容
  3. 创意表达:个人创作者实现更复杂的视觉叙事
  4. 概念验证:快速将设计理念转化为动态展示

多图生视频技术"在广告和营销行业也能发挥巨大作用。想象一下,品牌可以输入几张关键词和预期风格,AI就能生成符合品牌调性的宣传视频"。

4.2 电子商务视觉内容生成

电商领域是多图生视频模型的重要应用场景:

  1. 产品展示视频:从多角度产品图生成360度动态展示
  2. 使用场景模拟:根据产品图和场景图生成使用情境视频
  3. 营销内容快速生成:批量生产高质量营销短视频
  4. 个性化推荐动画:根据用户浏览历史生成相关产品视频

可灵AI的多图参考模式特别适合"电商场景下的视频内容快速生成",能够帮助商家更高效地制作产品展示视频。

4.3 影视动画制作辅助

在影视动画制作领域,多图生视频模型可以:

  1. 概念验证:快速将分镜图转化为预览视频
  2. 角色动画生成:根据角色设计图生成基础动画
  3. 特效预览:生成特效应用前后的对比视频
  4. 场景衔接:平滑过渡不同场景之间的转换

影视制作可以通过多图生视频技术"实现高效的前期概念验证和快速迭代,降低制作成本"。

4.4 教育和科研可视化

教育和科研领域也能从多图生视频技术中获益:

  1. 科学概念可视化:将复杂的科学概念图解转化为动态演示
  2. 历史事件重现:根据历史图片或插图重建历史场景
  3. 医学教育内容:生成人体结构和生理过程的演示视频
  4. 数据动态展示:将多张数据图表转化为趋势展示视频

4.5 成功应用案例

4.5.1 时尚秀视频生成

MAGREF已被应用于时尚秀视频生成:“基于wan2.1视频模型又增加一员猛将,名叫MAGREF,它的能力是能保持主体一致性视频生成!”。通过输入不同的时尚元素图片,可以生成连贯的时尚展示视频。

4.5.2 多主体互动视频

"一个男人和一只白虎在一起"的案例展示了MAGREF处理多主体视频的能力:“MAGREF只需输入:一张人像图、一张物体图、一张环境参考图和一段prompt,就能生成包含三类要素的完整视频序列,人物与物体有真实交互,场景融入毫无违和感”。

4.5.3 商业级视频快速生成

Vidu AI的多图参考功能已应用于商业视频制作:“参考生视频:允许用户上传3张或更多张参考图片,Vidu会根据提示词将多个视觉元素融合,生成一个无缝衔接的视频”。

5. 对传统内容创作方式的颠覆性影响

5.1 创作门槛的降低

多图生视频模型大幅降低了视频创作的技术门槛:

  1. 专业技能需求减少:不再需要深厚的视频制作专业知识
  2. 制作工具简化:从复杂软件到AI模型API调用
  3. 学习曲线缩短:提示工程代替了传统的视频编辑学习
  4. 创作民主化:更多人能够参与高质量视频内容创作

据知乎专家分析:“MAGREF支持基于多张图片和一段提示词,生成高质量的视频内容”,这意味着"即使不是专业视频制作人,也能通过简单输入生成高质量视频"。

5.2 创作效率的提升

多图生视频模型极大提高了视频创作的效率:

  1. 从概念到成片时间缩短:从天级压缩到分钟级
  2. 迭代速度加快:可以快速尝试多个创意方向
  3. 批量生产能力增强:一次性生成大量相似但不重复的内容
  4. 修改成本降低:调整提示词比修改现成视频更高效

传统视频制作"需要大量的手工劳动和专业的技术技能。而通过AI技术,多图生视频的制作过程可以被极大地简化和加速"。

5.3 内容多样性的增加

多图生视频模型为内容创作带来了更多可能性:

  1. 创意表达丰富:可以从多角度、多维度表达同一概念
  2. 个性化内容生产:为不同受众定制相似但个性化的内容
  3. 版本迭代便捷:轻松生成同一主题的不同风格版本
  4. 跨界创作容易:方便融合不同领域的视觉元素

5.4 数据驱动的创作范式

多图生视频模型基于数据驱动,这带来了创作范式的根本变化:

  1. 从艺术创作到算法协作:创作者与算法协同完成作品
  2. 从精确控制到方向引导:通过提示词和参考图引导模型生成
  3. 从线性流程到迭代优化:快速尝试-评估-调整的循环过程
  4. 从经验依赖到数据依赖:创作结果更依赖于模型训练数据

6. 效率提升与成本降低的数据对比

虽然多图生视频模型的技术论文通常不会详细披露商业效率数据,但从已有的报道和分析中,我们可以了解到这一技术带来的显著改进:

6.1 制作时间对比

任务类型传统方法多图生视频模型时间减少
产品展示视频数天至数周几十分钟至几小时90%+
社交媒体短视频数小时至数天几十分钟80%+
广告概念验证数天实时/几小时95%+
角色动画数周数小时98%+

这些数据基于行业报告和专家估计,反映了多图生视频技术对制作周期的革命性改进。

6.2 人力成本节约

采用多图生视频技术可以显著降低对专业人员的依赖:

  1. 减少专业视频编辑需求:可能降低70-80%对高级视频编辑人员的依赖
  2. 简化工作流程:减少中间环节,提高跨部门协作效率
  3. 降低技能门槛:允许更多现有员工经过简单培训后参与内容创作
  4. 节约培训成本:相比学习复杂视频软件,提示词工程学习曲线更平缓

6.3 计算资源需求

尽管训练这些大型模型需要大量计算资源,但推理阶段的计算需求相对可控:

  1. 推理效率提升:现代多图生视频模型"支持在单卡P40(32GB显存)上进行推理"
  2. 模型量化技术:通过量化技术进一步降低计算需求
  3. 云服务普及:使得中小团队也能负担AI视频生成成本
  4. 性能价格比提升:随着硬件进步,AI视频生成的性价比将持续提高

6.4 商业应用案例分析

6.4.1 电商视频内容生成

据可灵AI的案例显示,多图参考模式在电商领域应用效果显著:“用户可以上传一张或多张同一主体(人物、动物、影视角色或物品等)的图片,模型会以这些图片为参考,生成统一风格的视频”,帮助商家快速制作高质量产品展示视频。

6.4.2 广告行业应用

在广告行业,多图生视频技术"将彻底改变广告创意的制作流程。广告公司可以输入几张关键词和预期风格,AI就能生成符合品牌调性的宣传视频",大幅缩短了从创意到成片的时间。

6.4.3 社交媒体内容制作

对于社交媒体运营者来说,多图生视频技术使"内容创作进入快车道。创作者可以通过输入生活片段或灵感,迅速生成个性化的视频日记或艺术作品",提高了内容更新频率和质量。

7. 创意表达与艺术创作的突破

7.1 更丰富的创意表达方式

多图生视频模型为创意表达提供了新的可能性:

  1. 多模态融合:无缝整合文本、图像和视频多种元素
  2. 超现实场景构建:轻松创建现实中难以拍摄的场景
  3. 风格化转换:将现实世界素材转换为特定艺术风格
  4. 创意迭代加速:快速尝试多个创意方向并选择最佳方案

多图生视频技术"将内容创作带入了一个新的维度。通过输入几张关键词和预期风格,AI可以生成符合品牌调性的宣传视频,或者根据用户的描述创作艺术作品"。

7.2 艺术家与AI的协作新模式

艺术家和AI之间的协作呈现出新的模式:

  1. 从创作者到导演:艺术家从直接创作转为指导AI生成
  2. 从完美主义到探索精神:接受AI带来的意外结果并加以利用
  3. 从小稿到草图:使用AI快速验证创意概念
  4. 从技术专家到创意引导者:角色重心从技术操作转向创意构思

7.3 新兴艺术形式的探索

多图生视频技术催生了新的艺术形式:

  1. AI生成艺术展:展示人机协作创作的视频艺术作品
  2. 生成式动画:基于规则和算法的动态艺术作品
  3. 互动式视频艺术:观众参与指导AI生成视频
  4. 数据美学:探索模型训练数据对生成结果的影响

7.4 艺术创作中的技术挑战

尽管前景广阔,艺术家在使用多图生视频技术时仍面临一些挑战:

  1. 控制与随机性平衡:在精确控制和意外创意之间寻找平衡
  2. 知识产权问题:AI生成作品的版权归属和参考素材的使用边界
  3. 风格一致性:保持长期项目中风格的一致性
  4. 技术学习曲线:掌握提示工程和参数调整技巧

8. 商业价值和市场前景

8.1 市场规模与增长预测

多图生视频技术作为AIGC领域的重要分支,拥有广阔的市场前景:

  1. AIGC市场整体增长:根据市场研究,AIGC市场正以超过30%的年复合增长率快速发展
  2. 视频内容生成细分市场:预计未来五年内将从数亿美元增长到数十亿美元规模
  3. 企业应用需求增加:越来越多企业认识到AI视频生成的商业价值
  4. 消费者市场拓展:个人创作者工具市场快速增长

8.2 商业应用场景价值分析

应用场景商业价值市场特点发展前景
电商视频高转化率视频内容,提高商品转化率高度竞争,注重ROI非常乐观
广告制作加速创意迭代,降低制作成本注重品质和创新乐观
社交媒体内容批量高质量内容,提高用户互动快速更新,多样化需求非常乐观
教育视频个性化学习内容,提高学习效果注重教育效果和规范谨慎乐观
影视制作提高制作效率,降低制作成本注重品质和原创性乐观

8.3 主要厂商战略布局

多家科技巨头和初创企业已在多图生视频领域展开布局:

  1. OpenAI:推进Sora视频生成模型,探索商业应用
  2. 字节跳动:推出MAGREF和Phantom框架,布局视频创作工具
  3. 快手:发展可灵模型和多主体视频生成技术
  4. Runway:专注于专业创意工具市场
  5. Vidu:提供全球领先的AI内容生产平台

8.4 商业模式创新

多图生视频技术催生了多种创新商业模式:

  1. API服务模式:提供API调用服务,按生成视频数量或时长收费
  2. 订阅制工具:提供基于云的视频生成工具月度订阅
  3. 企业定制服务:为大型企业定制视频生成解决方案
  4. 垂直行业方案:针对特定行业(如电商、广告)的全套解决方案

9. 技术发展趋势和未来潜力

9.1 技术演进路线

多图生视频技术未来可能的发展方向包括:

  1. 更高效的模型架构:降低计算成本,提高生成速度
  2. 更强的多模态融合:整合文本、图像、音频和视频等多种模态
  3. 细化的时空控制:提供对生成视频更精细的时空控制能力
  4. 视频质量提升:提高分辨率、帧率和视觉质量
  5. 物理规律模拟增强:更好地模拟现实世界的物理规律

9.2 未来应用潜力

多图生视频技术在未来可能拓展的应用领域包括:

  1. 沉浸式全息通信:实时生成高质量全息视频
  2. 个性化医疗动画:根据患者情况生成定制化医疗解释视频
  3. 文化遗产数字化:将历史文物和场景以动态形式重现
  4. 智能监控与预警:生成异常情况预警的可视化模拟
  5. 自动驾驶可视化:生成驾驶场景的多模态模拟

9.3 行业标准与规范

随着技术成熟,行业标准和规范将逐步形成:

  1. 技术标准:统一的视频生成质量评估标准
  2. 伦理指南:规范AI视频生成和使用过程的伦理准则
  3. 版权框架:明确AI生成内容的知识产权保护框架
  4. 安全规范:防止有害内容生成的安全评估和过滤规范

9.4 潜在风险与挑战

多图生视频技术的发展也面临一些风险和挑战:

  1. 版权问题:生成内容可能包含受版权保护的元素
  2. 虚假信息风险:可能被用于生成虚假视频内容
  3. 数据偏见:训练数据中的偏见可能反映在生成内容中
  4. 技术滥用:如深度伪造等恶意应用
  5. 监管挑战:平衡创新自由和内容安全的监管框架

10. 与相关技术的对比分析

10.1 多图生视频 vs 文本生视频

对比维度多图生视频文本生视频主要差异
输入模态多张图像+文本提示纯文本描述输入信息丰富度
生成控制度更高(视觉参考约束)较低(纯语言描述)控制精度
创意自由度较低(受图像约束)更高(完全开放)创意空间
适用场景精细化视觉要求场景概念性创意场景应用侧重
技术挑战图像对齐、融合语义理解、想象技术难点
生成质量稳定性更高(有视觉参考)波动较大质量一致性

多图生视频"支持基于多张图片和一段提示词,生成高质量的视频内容",相比纯文本输入,有视觉参考约束的生成通常质量更稳定,细节更丰富。

10.2 多图生视频 vs 单图生视频

对比维度多图生视频单图生视频主要差异
空间理解能力更强(多视角空间关系)有限(单视角静态信息)空间感知
多主体处理支持多主体交互主要单主体场景复杂度
视频时长潜力支持更长视频通常较短内容丰富度
生成一致性更高(多图约束)较低时空连贯性
计算资源需求较高较低效率成本
应用灵活性专业场景优势通用场景优势应用范围

MAGREF的"基本原理是通过精确的掩码控制不同图像的融合过程,从而实现对视频中不同对象和场景的精细调节",这使其在多主体视频生成方面具有显著优势。

10.3 不同多图生视频技术方案对比

技术方案核心特点适用场景技术优势局限性
MAGREF掩码引导多参考精细多主体视频高精度融合,主体一致性计算资源需求高
AnimateDiff个性化文生图扩展角色动画角色特性保持好背景复杂度受限
可灵多主体概念融合机制多角色互动自然互动表现长视频稳定性待提高
Vidu参考生多图元素融合高质量商业视频画面质量优秀复杂场景交互能力

“Phantom是字节发布的一个统一的视频生成框架,适用于单主体和多主体参考,基于现有的文生视频、图生视频架构”,代表了多图生视频技术的发展方向。

10.4 面向未来的技术融合

多图生视频技术未来可能与以下技术深度融合:

  1. 3D重建技术:结合深度信息生成更真实的视频
  2. 增强现实(AR):生成与现实环境无缝融合的AR内容
  3. 生成式AI与传统CGI:互补结合,提高影视制作效率
  4. 实时渲染技术:实现即时生成高质量渲染视频
  5. 多模态大模型:与LLM等大模型融合,实现更复杂的创意表达

总结

多张图片生成视频技术代表了AI视频生成领域的前沿突破,通过理解多张输入图像之间的关系,这些模型能够创建更加真实、连贯且丰富的视频内容。从技术层面看,当前主流的多图生视频模型如MAGREF、AnimateDiff和可灵AI等,都基于扩散模型架构,特别强调对多主体关系的理解和时空一致性的保持。

多图生视频技术对传统内容创作方式产生了颠覆性影响,大幅降低了专业视频制作的门槛和成本,同时提高了创作效率。这一技术在电商、广告、社交媒体、教育等多个领域展现出广阔的应用前景。

尽管取得了显著进展,多图生视频技术仍面临一些挑战,如计算资源需求、生成内容的控制性、版权和伦理问题等。未来,随着模型架构的优化、多模态融合技术的发展和应用场景的拓展,多图生视频技术有望实现更高质量、更低成本的内容生成,为数字创意产业带来深远变革。

在技术发展路线方面,可以预见的是,多图生视频技术将继续向更高效率、更强控制力、更高质量的方向发展,并与其他前沿技术如3D重建、增强现实和多模态大模型深度融合,开创更多创新应用可能性。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/diannao/98480.shtml
繁体地址,请注明出处:http://hk.pswp.cn/diannao/98480.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

中电金信:AI重构测试体系·智能化时代的软件工程新范式

AI技术的迅猛发展正加速推动软件工程3.0时代的到来,深刻地重塑了测试行业的运作逻辑,推动测试角色从“后置保障”转变为“核心驱动力”。在大模型技术的助力下,测试质量和效能将显著提升。9月5日至6日,Gtest2025全球软件测试技术峰…

100、23种设计模式之适配器模式(9/23)

适配器模式(Adapter Pattern) 是一种结构型设计模式,它允许将不兼容的接口转换为客户端期望的接口,使原本由于接口不兼容而不能一起工作的类可以协同工作。 一、核心思想 将一个类的接口转换成客户期望的另一个接口使原本因接口不…

线上环境CPU使用率飙升,如何排查

线上环境CPU使用率飙升,如何排查 1.CPU飙升的常见原因 1. 代码层面问题 死循环:错误的循环条件导致无限循环递归过深:没有正确的终止条件算法效率低:O(n)或更高时间复杂度的算法处理大数据集频繁GC:内存泄漏导致频繁垃…

《sklearn机器学习——特征提取》

在 sklearn.feature_extraction 模块中,DictVectorizer 是从字典(dict)中加载和提取特征的核心工具。它主要用于将包含特征名称和值的 Python 字典列表转换为机器学习算法所需的数值型数组或稀疏矩阵。 这种方法在处理结构化数据(…

IEEE出版,限时早鸟优惠!|2025年智能制造、机器人与自动化国际学术会议 (IMRA 2025)

2025年智能制造、机器人与自动化国际学术会议 (IMRA2025)2025 International Conference on Intelligent Manufacturing, Robotics, and Automation中国▪湛江2025年11月14日-2025年11月16日IMRA2025权威出版大咖云集稳定检索智能制造、人工智能、机器人、物联网(Io…

C# 基于halcon的视觉工作流-章30-圆圆距离测量

C# 基于halcon的视觉工作流-章30-圆圆距离测量 本章目标: 一、利用圆卡尺找两圆心; 二、distance_pp算子计算两圆点距离; 三、匹配批量计算;本章是在章23-圆查找的基础上进行测量使用,圆查找知识请阅读章23&#xff0c…

java设计模式二、工厂

概述 工厂方法模式是一种常用的创建型设计模式,它通过将对象的创建过程封装在工厂类中,实现了创建与使用的分离。这种模式不仅提高了代码的复用性,还增强了系统的灵活性和可扩展性。本文将详细介绍工厂方法模式的三种形式:简单工厂…

Ubuntu 24.04 中 nvm 安装 Node 权限问题解决

个人博客地址:Ubuntu 24.04 中 nvm 安装 Node 权限问题解决 | 一张假钞的真实世界 参考nvm的一个issue:https://github.com/nvm-sh/nvm/issues/3363 异常信息如下: $ nvm install 22 Downloading and installing node v22.19.0... Download…

Java面试-线程安全篇

一、synchronized关键字: 基本使用与作用:通过抢票代码示例,展示了synchronized作为对象锁,可避免多线程超卖或抢到同一张票问题,保证代码原子性,同一时刻只有一个线程获得锁,其他线程阻塞。底层…

R 语言科研绘图 --- 其他绘图-汇总2

在发表科研论文的过程中,科研绘图是必不可少的,一张好看的图形会是文章很大的加分项。 为了便于使用,本系列文章介绍的所有绘图都已收录到了 sciRplot 项目中,获取方式: R 语言科研绘图模板 --- sciRplothttps://mp.…

【数学建模学习笔记】启发式算法:粒子群算法

零基础小白看懂粒子群优化算法(PSO)一、什么是粒子群优化算法?简单说,粒子群优化算法(PSO)是一种模拟鸟群 / 鱼群觅食的智能算法。想象一群鸟在找食物:每只鸟(叫 “粒子”&#xff0…

【Gitlab】Ubuntu 20.04服务器部署Gitlab

写一个 适用于 Ubuntu 20.04/22.04 的 GitLab 一键部署脚本,包括:安装依赖安装 GitLab CE配置公网 IP 或域名自动开启 HTTPS(Let’s Encrypt)配置防火墙下面是完整脚本:#!/bin/bash# # GitLab 一键安装脚本 # # 1. 检…

Android 15重磅升级:16KB内存页机制详解与适配指南

一、背景随着Android硬件架构的持续演进,新一代设备开始采用16KB内存页(Page Size)机制,逐步替代传统的4KB内存页设计。此项底层变更对应用兼容性产生直接影响,特别是对依赖Native层库、JNI接口或自定义内存管理模块的…

Mybatis-8 动态SQL

动态SQL-官方文档 文档地址 动态 SQL_MyBatis中文网 为什么需要动态SQL 1、动态SQL是MyBatis的强大特性之一 2、使用JDBC或其它类似的框架,根据不同条件拼接SQL语句非常麻烦,例如拼接时要确保不能忘记添加必要的空格,还要注意去掉列表最后一…

PySpark数据输入

PySpark数据输入 1.理解RDD对象 2.掌握PySpark数据输入的2种方法 RDD对象 PySpark支持多种数据的输入,在输入完成后,都会得到一个:RDD类的对象 RDD全称为:弹性分布式数据集(Resilient Distributed Datasets&#xff09…

【系统架构设计(16)】软件架构设计二:软件架构风格:构建系统的设计模式与选择指南

文章目录一、核心思想二、数据流风格:以数据流动为核心的处理模式三、调用返回风格:基于程序调用的层次化组织四、独立构件风格:基于事件驱动的松耦合架构五、虚拟机风格:提供抽象执行环境的架构模式六、仓库风格:以数…

MySQL速记小册(1)

1【Q】:Mysql中的数据排序是怎么实现的?【A】:排序过程中如果字段有索引,则利用索引排序。反之使用文件排序。在文件排序中,如果数据量少则在内存中排序,使用单路排序或双路排序。如果数据量大则利于磁盘文…

20250904 10:45_排查10.1.3.35新QMS系统RMAN备份失败问题(优化脚本里的环境配置,增加了check_oracle_env 函数)

一、RMAN备份失败日志如下 [2025-09-04 04:00:01] 备份脚本启动 [2025-09-04 04:00:01] 开始 RMAN 备份 CDB: ORCLCDB Message file RMAN<lang>.msb not found Verify that ORACLE_HOME is set properly [2025-09-04 04:00:01] RMAN 备份失败! 二、原备份脚本存档…

Vue3源码reactivity响应式篇之EffectScope

概述 EffectScope是Vue3中一个响应式系统的辅助类&#xff0c;用于管理副作用&#xff08;effect&#xff09;的作用域。它可以帮助我们更好地组织和管理多个effect&#xff0c;便于一起停止或暂停以及恢复&#xff0c;避免了全局状态的污染和管理的复杂性。 每一个vue组件的实…

MySQL 日志全解析:Binlog/Redo/Undo 等 5 类关键日志的配置、作用与最佳实践

1 二进制日志&#xff08;Binlog&#xff09;&#xff1a;配置与核心作用 Binlog 是 MySQL 中跨存储引擎的核心日志&#xff0c;记录所有数据修改操作&#xff0c;主要用于主从复制、数据备份恢复与跨库迁移。 1.1 Binlog 核心操作 开启 Binlog 若需开启 Binlog&#xff0c;需在…