【ARMv8 SIMD和浮点指令编程】编程基础

TYYJ-洪伟

已于 2023-06-10 07:30:13 修改

阅读量1.4k

点赞数

CC 4.0 BY-SA版权

分类专栏： NEON 文章标签： neon A64 simd armv8 AArch64

于 2023-02-14 08:05:12 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/tyyj90/article/details/129020265

NEON 专栏收录该内容

34 篇文章 ¥9.90 ¥99.00

订阅专栏

本文详细介绍了ARMv8的AArch64架构下的NEON和浮点指令特性，包括浮点和NEON的新功能、架构、指令格式等。在AArch64中，NEON寄存器数量翻倍，浮点和SIMD成为必需，支持双精度浮点和完整的IEEE 754操作。文章还探讨了浮点数和NEON的并行处理能力，以及浮点参数在函数调用中的传递方式。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

ARM 高级 SIMD 架构、相关的实现和支持软件通常被称为 NEON 技术。AArch32（相当于 ARMv7 的 NEON 指令）和 AArch64 都有 NEON 指令集。两者都可以显著加速在大型数据集上的重复操作。这在媒体编解码器等应用中很有用。AArch64 的 NEON 架构使用 32 × 128 位寄存器，是 ARMv7 的两倍。这些寄存器与浮点指令使用的寄存器相同。

浮点和 NEON 在所有标准 ARMv8 实现中都是必需的。然而，针对特定市场的实现可能支持以下组合：

没有 NEON 和浮点数。
完整的浮点和 SIMD，支持异常捕获。
完整的浮点和 SIMD，不支持异常捕获。

一、AArch64 NEON 和浮点新特性

AArch64 NEON 基于现有的 AArch32 NEON，并进行了以下更改：

现在有 32 个 128 位寄存器，而 ARMv7 只有 16 个。
较小的寄存器不再打包到较大的寄存器中，而是一对一地映射到 128 位寄存器的低阶位。单精度浮点数使用低 32 位，而双精度浮点数使用 128 位寄存器的低 64 位。
ARMv7-A 中的 NEON 指令中的 V 前缀已经被删除。
向向量寄存器写入 64 位或更少的数据会导致更高的位被置零。
在 AArch64 中，没有在通用寄存器上操作的 S

了解本专栏

博客等级

码龄13年

博客专家认证

231
原创

763
点赞

2132
收藏

1万+
粉丝

关注

私信

热门文章

分类专栏

NEON 付费 34篇
Vulkan 11篇
Flutter 11篇
音视频 20篇
Rust 11篇
ARMv8 14篇
Linux 5篇
Android源码 71篇
工具 3篇
Wi-Fi 2篇
音视频#OpenGL ES 4篇
RaspberryPi 3篇
杂 1篇
NanoPC-T4 4篇
程序人生
JNI编程 11篇
Java集合源码 3篇
Android 26篇
Python 2篇
kotlin 1篇
java 3篇

展开全部收起

上一篇：: FFmpeg 集成 x265 编译及解码

下一篇：: 【ARMv8 编程】ARMv8 指令集介绍

最新评论

MediaCodec 硬编解码的哪些坑-基于 rk3399
汤姆耶 Tom Yea: 那我在rk3588上调用mediacodec，理论上说就是在调用rkmpp，但实测下来，出了H.265速度和cpu占用率有比较明显的差距外，其它2个 h264 和 mpeg4 差距和软解码相差不多，不知道这个是否正常？
MediaCodec 硬编解码的哪些坑-基于 rk3399
汤姆耶 Tom Yea: 博主，你好，我理解为瑞星微的板子如果在安卓下，mediacodec默认已经和rkmpp绑定了对吗，也就是在安卓下调用mediacodec后底层会调用rkmpp的硬件加速库？
Rust 程序设计语言学习——结构体
TYYJ-洪伟: 单元结构体的作用包括但不限于以下几点：作为枚举的变体：单元结构体可以作为枚举的变体，用来表示没有数据的状态或者作为一个标记。作为函数的返回类型：单元结构体可以用作函数的返回类型，当函数不需要返回任何有用的数据时。作为空的容器：单元结构体可以作为空的容器，用于泛型编程或者接口设计中，表示一个类型占位符。作为类型安全的标记：单元结构体可以作为类型安全的标记，用来区分不同的操作或者状态，而不需要携带任何数据。实现特定行为：尽管单元结构体本身不包含数据，但可以为它们实现方法，从而为不同的单元结构体提供不同的行为。用于模式匹配：在 Rust 的模式匹配中，单元结构体可以作为不同的分支，帮助区分不同的逻辑路径。用于类型系统：单元结构体可以用于类型系统的设计，比如在实现 trait 时，可以为不同的单元结构体实现不同的 trait 方法。
【Android 10 源码】深入理解构建 MediaCodec 列表：buildMediaCodecList
月光骆驼: 一般的厂商是不是都不自己定义rank，看了华为，小米的手机都没找到rank相关的信息
Rust 程序设计语言学习——结构体
清风亦可追: 请问这个单元结构体有什么作用？能够在那些应用场景使用

大家在看

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

TYYJ-洪伟 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。