ONNXRuntime、TensorRT扫盲

ONNXRuntime是微软开源的高性能推理引擎,支持ONNX格式的模型在多种硬件上运行,包括CPU、GPU和MAC。ONNX作为统一的模型格式,促进了不同深度学习框架之间的互操作性。而TensorRT是NVIDIA的优化库,用于在GPU上加速深度学习推理,提供低延迟和高吞吐量。两者都致力于模型部署的效率和性能优化。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

onnxruntime

  1. 官方介绍:https://baijiahao.baidu.com/s?id=1619064549798705268&wfr=spider&for=pc

个人笔记/理解:
当地时间12月4日,微软在GitHub上宣布ONNX Runtime开源 。

ONNX Runtime是适用于Linux,Windows和Mac上ONNX格式的机器学习模型的高性能推理引擎。

也就是onnxruntime是一套可以推理onnx格式模型的推理引擎(代码),可以运行在CPU、GPU以及MAC上面,可以兼容python、C#、C接口等。

ONNX 是微软FacebookAWS共同开发的深度学习和传统机器学习模型的开放格式

也就是ONNX是一种规范定义的模型格式。因为深度学习框架实在很多,tf、pytorch、paddlepaddle、keras、caffe等,无法统一,那只能先统一格式,然后使用一套高效代码进行推理。这个统一格式就是ONNX格式,这一套高效代码就是ONNXRUNTIME。

很多业界领先的企业都在积极将自己的技术与ONNX Runtime实现集成和整合,使自己的服务能够完整支持ONNX规范,同时实现性能的最优化。比如英特尔(CPU加速)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值