Titan AI

TensorRT-Model-Optimizer

Name: TensorRT-Model-Optimizer
Rating: 1.7635 (1527 reviews)
Author: Open Source Community

1,527

193

Python

A unified library of state-of-the-art model optimization techniques like quantization, pruning, distillation, speculative decoding, etc. It compresses deep learning models for downstream deployment frameworks like TensorRT-LLM or TensorRT to optimize inference speed.

Project Information

Created on 4/23/2024

Updated on 11/11/2025

TensorRT-Model-Optimizer

Project Description

Project Information