概述
机器学习 (ML) 软件库
作为 Arm Kleidi 的关键组件,Arm Compute Library (ACL) 汇集了新型开发支持技术和重要的开发资源,旨在加速 AI 开发,同时提高基于 Arm 架构的平台性能。ACL 提供一套全面的底层机器学习 (ML) 函数,针对 Arm Cortex-A CPU、 Arm Neoverse 平台和 Arm Mali GPU 架构进行了优化,助力实现优异的 ML 性能。该库为开源软件,基于宽松的 MIT 技术授权许可提供。
相较于其他开源替代方案,Arm Compute Library (ACL) 具有显著的性能优势,并直接支持新的 Arm 技术和架构特性,包括 SVE2 和 SME2。
主要特性:
- 超过 100 种适用于 CPU 和 GPU 的机器学习 (ML) 功能
- 多种卷积算法(GEMM、Winograd、FFT 和 Direct)
- 支持多种数据类型:FP32、FP16、int8、uint8、BFloat16
- 针对关键 ML 原语的微架构优化
- 高度可配置的构建选项,支持轻量级二进制文件
- 先进的优化技术,如内核融合、快速数学启用和纹理利用
- 使用 Open CL 调优工具和 GEMM 优化启发式方法,针对设备和工作负载进行针对性调优
特性与优势
性能与能效
Arm Compute Library (ACL) 已部署于超过 10 亿台设备,并通过 OneDNN 与 PyTorch AI 框架集成,深受全球 Arm 开发者信赖,可提供默认加速支持并缩短产品上市时间。
独立于操作系统 (OS)
Arm Compute Library (ACL) 库完全独立于操作系统,可移植到 Android、Linux 和“裸机”系统,目前已广泛应用于智能手机、DTV、智能相机、汽车应用等众多领域。
针对基于 Arm 的处理器优化
Arm Compute Library (ACL) 包含一套综合性软件功能,并专门针对 Arm Cortex-A CPU 和 Arm Mali GPU 进行了优化升级。
资源


