海思 35xx - RGB2RGBA(arm64指令集带来的性能飞跃)

在海思平台进行位图叠加的过程中,我们面临着一个关键需求,那就是需要使用 RGBA888 格式的数据。然而,海思的 ive 模块只能将 YUV 数据转换为 RGB888,这就使得剩下的从 RGB888 转换为 RGBA888 的步骤变得至关重要。

在寻找解决方案的过程中,我们尝试了很多不同的版本,但性能都不尽如人意。于是,我们决定尝试使用指令集来优化这个关键步骤。令人惊喜的是,通过使用指令集,我们成功地将性能提高了 11 倍!

下面是具体的使用方法:

一、编写指令集代码(部分代码,完整代码见附件资料)

//rgb2rgba_arm64.s

.global rgb2rgba_arm64
.type rgb2rgba_arm64, %function

rgb2rgba_arm64:
    // 参数:
    // x0 - rgbData (输入 RGB 数据地址)
    // x1 - rgbaData (输出 RGBA 数据地址)
    // x2 - width (图像宽度)
    // x3 - height (图像高度)

这一步需要我们深入了解目标平台的指令集架构,并根据具体的需求精心编写高效的指令集代码。在这个过程中,需要对数据的处理流程进行细致的规划,以充分发挥指令集的优势。

二、引用指令集函数

在主程序中,我们需要正确地引用编写好的指令集函数。确保函数的参数传递和调用方式符合指令集函数的要求,以实现无缝的集成。

//导出函数
extern "C" void rgb2rgba_arm64(unsigned char* rgb_data, unsigned char* rgba_data, int width, int height);

//函数调用
rgb2rgba_arm64(rgbData, rgbaData, frame->video_frame.width, frame->video_frame.height);

三、编译运行

最后,进行编译并运行程序。在这个阶段,我们可以观察到指令集带来的显著性能提升,见证高效的位图叠加过程在海思平台上顺利实现。

SRCS_S		+= $(wildcard src/Instruction/*.s)

%.o:%.s
	@mkdir -p $(OBJ_SUB_PATH)
	$(CC) $(CFLAGS) $(LIBS_CFLAGS) -march=armv8-a  -Wl,--start-group -c $< -o $(OBJ_PATH)$@

通过这个方法,我们成功地解决了海思平台上位图叠加中的关键性能问题,为后续的应用开发提供了有力的支持。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值