本文介绍了RT-DETR,一种实时的端到端目标检测Transformer模型。该模型通过高效的混合编码器和不确定性最小查询选择方法,在保持高精度的同时实现了实时性能。RT-DETR在COCO数据集上实现了53.1%/54.3%的AP,在T4 GPU上达到了108/74 FPS,超过了现有的YOLO系列模型。