2505C++,32位转64位

原文
假设有个想要将一个32位值传递给一个带64位值的函数的函数.你不关心高32位的内容,因为该值是传递给回调函数的直通值,回调函数会把它截断为32位值.

因此,你都担心编译器一般生成的将32位值扩展到64位值的那条指令的性能影响.
我怀疑这条指令不是程序中的性能瓶颈.

我想出的是说:可不执行任何指令32位值生成64位值"的gcc/clang内联汇编.

int64_t int32_to_64_garbage(int32_t i32)
{int64_t i64;__asm__("" ://闲着"=r"(i64) ://在`寄存器`中生成结果"0"(i32));//从此最后的输入return i64;
}

__asm__内联指令第一个参数是要生成的代码.传递一个空串,所以实际上未生成任何代码!想要的所有效果都在输入输出的声明中.

接着是只有一个的输出."=r"(i64)表示内联汇编会在编译器选择的r寄存器中,放入i64覆盖(=)值,内联汇编器%0引用的.输出从0开始编号.
最后,有这里只有一个的输入."0"(i32)表示输入应在输出0数字位置放置.

所有工作都是根据输入和输出的约束来完成的.没有实际的代码.告诉编译器,在一个寄存器中放入i32,然后遮住眼睛,睁开时,在同一个寄存器中变成i64!
3级优化中运行gcc,显示完全省略了该值.

void somewhere(int64_t);
void sample1(int32_t v)
{somewhere(v);
}
void sample2(int32_t v)
{somewhere(int32_to_64_garbage(v));
}

结果是:

    //x86-64
sample1(int):movsx   rdi, edijmp     somewhere(long)
sample2(int):jmp     somewhere(long)//ARM32
sample1(int):asrs    r1, r0, #31b       somewhere(long long)
sample2(int):b       somewhere(long long)//ARM64
sample1(int):sxtw    x0, w0b       somewhere(long)
sample2(int):b       somewhere(long)

第一个版本在调用之前,包含显式符号扩展指令.第二个版本是直接尾调用,在rdi,寄存器32位中使用任意垃圾.
另一个支持gcc扩展内联语法的编译器icc,该技巧似乎也有效.

    //x86-64
sample1(int):movsxd    rdi, edijmp       somewhere(long)
sample2(int):jmp       somewhere(long)

clang``编译器还支持gcc扩展内联汇编语法.但是,它不仅会生成转换,而且还会丢失尾调用.

    //x86-64
sample1(int):movsxd  edi, edijmp     somewhere(long)@PLT
sample2(int):push    raxmov     edi, edicall    somewhere(long)@PLTpop     raxret//ARM32
sample1(int):asr     r1, r0, #31b       somewhere(long long)
sample2(int):push    {r11, lr}sub     sp, sp, #8mov     r1, #0bl      somewhere(long long)add     sp, sp, #8pop     {r11, pc}//ARM64
sample1(int):sxtw    x0, w0b       somewhere(long)
sample2(int):sub     sp, sp, #32stp     x29, x30, [sp, #16]add     x29, sp, #16mov     w0, w0bl      somewhere(long)ldp     x29, x30, [sp, #16]add     sp, sp, #32ret

更新:似乎当前版本的clang(当前时)恢复了尾调用,尽管它仍执行3264正转换,因此成本基本相同.

    //x86-64
sample1(int):movsxd  edi, edijmp     somewhere(long)@PLT
sample2(int):mov     edi, edijmp     somewhere(long)@PLT//ARM32
sample1(int):asr     r1, r0, #31b       somewhere(long long)
sample2(int):mov     r1, #0b       somewhere(long long)//ARM64
sample1(int):sxtw    x0, w0b       somewhere(long)
sample2(int):mov     w0, w0b       somewhere(long)

VC++``编译器不支持gcc扩展内联语法,因此无法检查.

因为msvc完全不管用,并且对clang没有任何好处,因此我只会在使用gccicc``编译时允许此优化,并在其他地方使用额外指令.

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.pswp.cn/bicheng/82440.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

光伏电站及时巡检:守护清洁能源的“生命线”

在“双碳”目标驱动下,光伏电站作为清洁能源的主力军,正以年均20%以上的装机增速重塑全球能源格局。然而,这些遍布荒漠、屋顶的“光伏矩阵”并非一劳永逸的能源提款机,其稳定运行高度依赖精细化的巡检维护。山东枣庄触电事故、衢州…

C++初阶-list的使用2

目录 1.std::list::splice的使用 2.std::list::remove和std::list::remove_if的使用 2.1remove_if函数的简单介绍 基本用法 函数原型 使用函数对象作为谓词 使用普通函数作为谓词 注意事项 复杂对象示例 2.2remove与remove_if的简单使用 3.std::list::unique的使用 …

OpenHarmony平台驱动使用(一),ADC

OpenHarmony平台驱动使用(一) ADC 概述 功能简介 ADC(Analog to Digital Converter),即模拟-数字转换器,可将模拟信号转换成对应的数字信号,便于存储与计算等操作。除电源线和地线之外&#…

CSS【详解】弹性布局 flex

适用场景 一维(行或列)布局 基本概念 包裹所有被布局元素的父元素为容器 所有被布局的元素为项目 项目的排列方向(垂直/水平)为主轴 与主轴垂直的方向交交叉轴 容器上启用 flex 布局 将容器的 display 样式设置为 flex 或 i…

基于MATLAB实现传统谱减法以及两种改进的谱减法(增益函数谱减法、多带谱减法)的语音增强

基于MATLAB实现传统谱减法以及两种改进的谱减法(增益函数谱减法、多带谱减法)的语音增强代码示例: 传统谱减法 function enhanced traditional_spectral_subtraction(noisy, fs, wlen, inc, NIS, a, b)% 参数说明:% noisy - 带…

symbol【ES6】

你一闭眼世界就黑了,你不是主角是什么? 目录 什么是Symbol?‌Symbol特点‌:创建方法:注意点:不能进行运算:显示调用toString() --没有意义隐式转换boolean 如果属性名冲突了怎么办?o…

LeetCode 649. Dota2 参议院 java题解

https://leetcode.cn/problems/dota2-senate/description/ 贪心。不会写。 class Solution {public String predictPartyVictory(String senate) {boolean rtrue,dtrue;int flag0;//flag>0,d前面有r;flag<0,r前面有dchar[] senatessenate.toCharArray();//每一轮while(r…

机器学习第二十二讲:感知机 → 模仿大脑神经元的开关系统

机器学习第二十二讲&#xff1a;感知机 → 模仿大脑神经元的开关系统 资料取自《零基础学机器学习》。 查看总目录&#xff1a;学习大纲 关于DeepSeek本地部署指南可以看下我之前写的文章&#xff1a;DeepSeek R1本地与线上满血版部署&#xff1a;超详细手把手指南 感知机详解…

maven快速上手

之前我们项目如果要用到其他额外的jar包&#xff0c;需要自己去官网下载并且导入。但是有maven后&#xff0c;直接在maven的pom.xml文件里用代码配置即可&#xff0c;配置好后maven会自动帮我们联网下载并且会自动导入该jar包 在右边的maven中&#xff0c;我们可以看到下载安装…

科学养生指南:解锁健康生活密码

健康是人生最宝贵的财富&#xff0c;在快节奏的现代生活中&#xff0c;科学养生成为保持良好状态的关键。遵循现代医学与营养学的研究成果&#xff0c;无需依赖传统中医理论&#xff0c;我们也能找到适合自己的养生之道。​ 均衡饮食是健康的基石。现代营养学强调 “食物多样&…

Qt状态机QStateMachine

QStateMachine QState 提供了一种强大且灵活的方式来表示状态机中的状态&#xff0c;通过与状态机类(QStateMachine)和转换类(QSignalTransition&#xff0c; QEventTransition)结合&#xff0c;可以实现复杂的状态逻辑和用户交互。合理使用嵌套状态机、信号转换、动作与动画、…

C++八股 —— 原子操作

文章目录 1. 什么是原子操作2. 原子操作的特点3. 原子操作的底层原理4. 内存序内存屏障 5. 原子操作和互斥锁的对比6. 常用的原子操作7. 相关问题讨论 参考&#xff1a; C atomic 原子操作_c 原子操作-CSDN博客DeepSeek 1. 什么是原子操作 原子操作&#xff08;Atomic Opera…

双紫擒龙紫紫红指标源码学习,2025升级版紫紫红指标公式-重点技术

VAR1:MA((LOWHIGHCLOSE)/3,5); VAR2:CLOSEHHV(C,4) AND REF(C,1)LLV(C,4); 双紫擒龙:REF(C,1)LLV(C,4) AND C>REF(C,2) OR REF(C,2)LLV(C,4) AND REF(C,1)<REF(C,3) AND REF(C,2)<REF(C,4) AND C>REF(C,1); VAR4:VAR1>REF(VAR1,1) AND REF(VAR1,1)<REF(VAR1,…

NeuralRecon技术详解:从单目视频中实现三维重建

引言 三维重建是计算机视觉领域中的一项关键技术&#xff0c;它能够从二维图像中恢复出三维形状和结构。随着深度学习的发展&#xff0c;基于学习的方法已经成为三维重建的主流。NeuralRecon是一种先进的三维重建方法&#xff0c;它能够从单目视频中实时生成高质量的三维模型。…

Ubuntu 上开启 SSH 服务、禁用密码登录并仅允许密钥认证

1. 安装 OpenSSH 服务 如果尚未安装 SSH 服务&#xff0c;运行以下命令&#xff1a; sudo apt update sudo apt install openssh-server2. 启动 SSH 服务并设置开机自启 sudo systemctl start ssh sudo systemctl enable ssh3. 生成 SSH 密钥对&#xff08;本地机器&#xf…

MySQL 索引的增删改查

MySQL 索引的增删改查 1 建表时创建索引 [UNIQUE|FULLTEXT|SPATIAL] INDEX|KEY [别名] (字段名 [(长度)] [ASC|DESC] )主键直接写&#xff1a; PRIMARY KEY (Id)例如&#xff1a; CREATE TABLE people (id int NOT NULL PRIMARY KEY AUTO_INCREMENT,last_name varchar(10)…

为什么现代CSS应该选择OKLCH:从颜色科学到设计系统革新

在数字界面中&#xff0c;颜色不仅是美学的载体&#xff0c;更是信息传递的重要工具。CSS Color Level 4 标准引入了 OKLCH 颜色空间, 提供​​感知均匀性​​&#xff08;颜色差异与实际视觉感受一致&#xff09;&#xff0c;解决传统HSL/HSV在调整颜色时的不自然问题。文本帮…

【java】小练习--零钱通

文章目录 前言一、项目开发流程说明二、功能实现2.1 菜单2.2 零钱通明细2.3 零钱通收益2.4 零钱通消费2.5 零钱通退出确认2.6 零钱通金额校验2.7 完整代码 三、零钱通OOP版 前言 本文是我跟着B站韩顺平老师的 Java 教程学习时动手实现“零钱通”项目的学习笔记&#xff0c;主要…

人工智能数学基础实验(四):最大似然估计的-AI 模型训练与参数优化

一、实验目的 理解最大似然估计&#xff08;MLE&#xff09;原理&#xff1a;掌握通过最大化数据出现概率估计模型参数的核心思想。实现 MLE 与 AI 模型结合&#xff1a;使用 MLE 手动估计朴素贝叶斯模型参数&#xff0c;并与 Scikit-learn 内置模型对比&#xff0c;深入理解参…

我的第1个爬虫程序——豆瓣Top250爬虫的详细步骤指南

我的第1个爬虫程序——豆瓣Top250爬虫的详细步骤指南 一、创建隔离开发环境 1. 使用虚拟环境&#xff08;推荐venv&#xff09; # 在项目目录打开终端执行 python -m venv douban_env # 创建虚拟环境 source douban_env/bin/activate # Linux/macOS激活 douban_env\Scri…