- 23, Oct 2024
- #1
Я пытаюсь оптимизировать передачу геометрии для игры, используя dx11 и отложенный рендеринг. (Все тесты проводятся на Nvidia GTX 1060 с фиксированной тактовой частотой)
После профилирования с помощью NSight выяснилось, что графический процессор используется очень плохо. Максимальный процент SOL составляет SM: 36%.
Я решил провести расследование и попытался удалить всю выборку текстур и создать проход, который бы записывал только константы в GBuffer и получал совсем другое профилирование в NSight, но с небольшой разницей во времени.
Я ожидал гораздо большей пропускной способности от шейдера, который в основном пишет константы.
Я попытался уменьшить макет GBuffer, который изначально был (FP16 + 2x ARGB32, ARGB32) до 3x ARGB32, без абсолютно никакой разницы.
Поэтому я хотел бы знать, есть ли у кого-нибудь идеи, что можно сделать, чтобы улучшить этот проход. Особенно, если мне не хватает чего-то, что тормозит. Более точный вопрос: ЧТО ТАКОЕ, К ЧЕРТУ, Столл Короткое Табло???
Единственная информация, которую я нашел об этом счетчике, заключалась в том, что
Warp застопорился в ожидании зависимости табло от