Posts by Chenhan Yu
对话式人工智能
2024年 9月 10日
使用 NVIDIA NeMo 和 NVIDIA TensorRT 模型优化器对 LLM 进行训练后量化
随着大语言模型(LLMs)的规模不断扩大,提供易于使用且高效的部署路径变得越来越重要,因为为此类 LLMs 提供服务的成本越来越高。
3 MIN READ