NVIDIA TensorRT-LLM 登陆 Windows

动态 编辑:
导读 NVIDIA宣布TensorRT-LLM 即将登陆 Windows,将为运行 RTX GPU 的 PC 带来巨大的 AI 提升。NVIDIA RTX GPU 驱动的 PC 将在 W...

NVIDIA宣布TensorRT-LLM 即将登陆 Windows,将为运行 RTX GPU 的 PC 带来巨大的 AI 提升。

NVIDIA RTX GPU 驱动的 PC 将在 Windows 中通过即将推出的 TensorRT-LLM 支持获得免费的 AI 性能提升

早在 9 月份,NVIDIA就发布了适用于数据中心的 TensoRT-LLM 模型,该模型比 Hopper H100 和 Ampere A100 等业界顶级 AI GPU 性能提升了 8 倍。充分利用 NVIDIA GeForce RTX 和 RTX Pro GPU 上的张量核心加速功能,最新型号将在 LLM 推理工作负载中提供高达 4 倍的性能提升。

NVIDIA TensorRT-LLM 即将登陆 Windows,为运行 GeForce RTX 和 RTX Pro GPU 的消费类 PC 带来巨大的 AI 提升 2

之前,我们解释过 TensorRT-LLM 带来的最大更新之一是一种称为“飞行批处理”的新调度程序,它允许工作独立于其他任务进入和退出 GPU。它允许动态处理多个较小的查询,同时在同一 GPU 中处理大型计算密集型请求。TensorRT-LLM 利用优化的开源模型,可以在增加批量大小时实现更高的加速。

标签:
免责声明:本文由用户上传,如有侵权请联系删除!