Chenhan Yu

Chenhan Yu 是 NVIDIA 的工程经理,从事生成式 AI 和自动驾驶的推理和部署系统软件优化。他拥有德克萨斯大学奥斯汀分校计算机科学博士学位。

Posts by Chenhan Yu

对话式人工智能

使用 NVIDIA NeMo 和 NVIDIA TensorRT 模型优化器对 LLM 进行训练后量化

随着大语言模型(LLMs)的规模不断扩大,提供易于使用且高效的部署路径变得越来越重要,因为为此类 LLMs 提供服务的成本越来越高。 3 MIN READ