Настоящее оружие графических процессоров серии Nvidia GeForce RTX 50 — DLSS 4

Главная страница » Компьютеры » Комплектующие » Настоящее оружие графических процессоров серии Nvidia GeForce RTX 50 — DLSS 4

23 января, 2025

Время чтения: 10 мин.

За исключением откровенно нелепого RTX 5090, бесстыдно расширяющего господство GPU с высоты, три других GPU серии Nvidia GeForce RTX 50, анонсированных на CES 2025, не являются Big Deal™ в традиционном смысле аппаратного обеспечения. Обычно скрытые за разговорами о смелых спецификациях, настоящая звезда шоу — это то, что Nvidia сделала с программным обеспечением, и как всеобъемлющие улучшения приносят пользу миллионам геймеров.

Не поймите нас неправильно, заметьте. Независимо от того, в какую игру мы играем, мы бы предпочели RTX 5080 вместо RTX 4080 (Super) и RTX 5070 вместо RTX 4070 (Super) каждый день недели и дважды по воскресеньям.

Судите меня по количеству ядер CUDA, не так ли?

Но мы намеренно умеряем ожидания энтузиастов, зная, что собственное тестирование Nvidia показывает, что скачок растеризации между поколениями карт меньше, чем когда-либо. Конечно, нам придется провести собственные расчеты, но, если взглянуть на базовые аппаратные характеристики RTX 5080 и RTX 4080 Super, обе стоили $999 на момент запуска с разницей в год, то можно увидеть консервативные различия.

ГПУ	RTX5080	RTX 4080 Super
Архитектура	Blackwell	Ada Lovelace
Процесс	TSMC 4N	TSMC 4N
Кодовое имя Die	GB203	AD103
Размер матрицы	378мм²	378,6 мм²
Транзисторы	45,6 млрд.	45,9 млрд.
Ядра CUDA	10,752	10,240
Базовые часы	2.30ГГц	2.29ГГц
Увеличить тактовую частоту	2.62ГГц	2.55ГГц
CUDA- FP32	56,34 терафлопс	52,22 терафлопс
Память	16 ГБ	16 ГБ
Тип памяти	GDDR7	GDDR6
Шина памяти	256-бит	256-бит
Скорость памяти	30Гбит/с	23Гбит/с
Пропускная способность памяти	960ГБ/с	736ГБ/с
Трассировка лучей	171 терафлопс	121 терафлопс
Тензорное ядро	1,801 TOPS	836 TOPS
Общая графическая мощность	360 Вт	320 Вт
Системные требования	850 Вт	750 Вт
Цена	999$	999$
Доступность	Январь 2025 г.	Январь 2024 г.

Переваривание цифр дает паузу для размышлений. Не ожидайте многого от традиционной пропускной способности, поскольку обе карты пугающе похожи по площади кремния, размеру кристалла и старым FP32 TFLOPS — расчет пропускной способности, который исторически во многом определял игровую производительность в тандеме с пропускной способностью памяти. В этом отделе есть хороший 30%-ный рост за счет использования GDDR7, работающей на скорости 30 Гбит/с, в то время как Nvidia усилила возможности трассировки лучей в большей степени. Ключевым выбросом является крайне важный AI TOPS, о котором мы расскажем позже. Вы узнаете, почему это число так важно для этого поколения и следующего.

Возможно, мы слишком суровы к архитектуре Blackwell серии RTX 50 и блокам SM. При увеличении одного из них видны те же 128 шейдерных ядер, хотя и расположенных по-другому. Ранее серия RTX 40, также известная как Ada, разделяла ядра на 64 FP32 (темно-зеленые) и еще 64, способных к FP32 и INT32. Теперь у нас по-прежнему то же общее количество, но все 128 способны обрабатывать числа с плавающей точкой или целые числа. Различие важно, поскольку игры действительно используют INT32, поэтому гибкость всех ядер для его запуска полезна. Нам будет сложно выделить реальные преимущества, учтите.

Другим ключевым изменением является добавление нейронного затенения, которое добавляет нейронные сети к программируемым шейдерам. Подобно тому, как работает DLSS, технология создает более реалистичные текстуры из высокосжимаемых данных. Нам показали демо, где RTX Neural Faces создает модель ИИ в реальном времени из простого растеризованного лица, делая его гораздо более естественным. Подумайте об этом так, как DLSS берет входные данные с низким разрешением и создает более качественный вывод. Демо ниже показывает, что улучшенные ИИ нейронные материалы выглядят более реалистично и занимают меньше ценного пространства VRAM. Поймите, что, как и многие новые способы делать что-то, разработчикам нужно будет интегрировать нейронное затенение в свои движки.

Тем не менее, возвращаясь к сути, мы достаточно долго занимались этой игрой с анализом GPU, чтобы перевести таблицу выше в вероятную производительность в 4K со всеми включенными визуальными наворотами. Мы предполагаем, что вы увидите 10-15% улучшение растеризованной частоты кадров между RTX 5080 и RTX 4080 Super. Конечно, я могу оказаться неправ, когда появятся обзоры, но мы уверены, что вы не увидите 30-40% улучшений, не прибегнув к новым методам обработки изображений.

Серия RTX 50 никогда не фокусировалась на растеризации

И в этом суть вопроса. Nvidia прекрасно понимает, что растущие цены на транзисторы и инвестиции в передовые производственные процессы — это не тот путь, по которому нужно идти при создании лучших видеокарт. Инновации обязательно должны происходить за пределами кремния, и именно поэтому за последние шесть лет были сделаны инвестиции, меняющие правила игры, если вы извините за вопиющий каламбур, в технологии RTX и DLSS.

Серия GeForce RTX 50 с гордостью выступает в качестве примера того, как извлечь значимые улучшения производительности поколения без неоправданного инвестирования в дорогие вещи, такие как больше ядер CUDA. Это единственная серия с полным набором технологий DLSS 4, включая Multi-Frame Generation (MFG), которая добавляет три дополнительных кадра между каждым традиционно отрисованным кадром. И, как всем известно, больше кадров равно большему количеству фрагментов.

На бумаге звучит достаточно просто, поскольку графические процессоры серии GeForce RTX 40 также имеют возможности генерации кадров, но это не одно и то же. Размещение второго или третьего кадра, скажем, на RTX 4080, становится все более сложным по чисто временным причинам. Каждый последующий кадр требует генерации новой информации оптического потока вместе с моделью искусственного интеллекта, полученной из DLSS. За кулисами многое происходит для создания вставленного кадра. Это практически невозможно сделать за короткое время между традиционно отрисованными кадрами. Nvidia некоторое время боролась с этой проблемой и поняла, что, хотя MFG — отличная идея на бумаге, для нее требуется новый подход.

Шаг вперед, Blackwell. Графические процессоры серии RTX 50 делают несколько вещей по-другому. MFG теперь работает, потому что аппаратный оптический ускоритель потока заменен на модель ИИ с однократным развертыванием, способную генерировать несколько кадров. Она на 40% быстрее и также требует на 30% меньше видеопамяти. Решая вторую часть проблемы MFG, а именно генерацию визуально высококачественных изображений, необходимых для нескольких кадров, Nvidia использует возможности ИИ серии RTX 50. DLSS лучше всего работает с невероятной мощностью AI TOPS, и именно эти TOPS, помимо последнего поколения, помогают генерировать и вставлять кадры два и три, относящиеся к MFG. Без обилия TOPS вы получите изображение, которое провалится.

На данный момент RTX 5080 имеет более чем 2-кратную производительность RTX 4080 Super. На самом деле, это еще не все, поскольку серия RTX 50 изначально поддерживает более быстрый формат FP4, распространенный в задачах ИИ — серия RTX 40 работает с ним гораздо медленнее из-за отсутствия специального оборудования — но вы поняли. Занимайтесь ИИ или идите домой. Другого разумного способа обеспечить умопомрачительную частоту кадров не существует.

Последняя часть головоломки — как дополнительные кадры доставляются на ваш дисплей. Даже если RTX 40 Series может генерировать несколько кадров быстро, как RTX 50, есть вопрос их равномерного распределения, чтобы производительность казалась плавной. Вот почему бремя распределения кадров переходит от CPU к выделенному движку в RTX 50 Series. В двух словах, распределение кадров GPU, генерация кадров, сгенерированных AI, и несколько кадров DLSS объединяются, чтобы предоставить DLSS 4 в его наиболее полной форме.

Результаты, честно говоря, впечатляют. Вы смотрите на Cyberpunk 2077 с качеством изображения, установленным на 11. Вот почему даже RTX 5090 спотыкается на всего лишь 27 кадров в секунду на 4K. Увеличение до DLSS 4 MFG увеличивает частоту кадров в восемь раз, одновременно уменьшая задержку. Конечно, вы можете легко изменить собственные настройки DLSS Off, чтобы достичь 60 кадров в секунду, но Nvidia иллюстрирует угловой случай с RT, установленным на трассировку пути.

Недавно довелось поиграть в эту самую игру во время Дня редакторов. Подключенные к 4K240 OLED, интеллектуалы DLSS 4 предлагают самый плавный опыт, который мы когда-либо испытывали в Найт-Сити. На самом деле странно видеть стратосферную частоту кадров в том, что на бумаге является смехотворно обременительной обстановкой.

Этот опыт научил кое-чему о графике. Давно прошли те времена, когда итеративное увеличение производительности достигалось путем грубой атаки на ядра CUDA. Хотели запустить Crysis в два раза быстрее? Вы терпеливо ждали, пока Nvidia или AMD не сделают GPU в два раза больше и в два раза более прожорливые. Если бы эта тенденция продолжалась до сегодняшнего дня, то для перехода с 27 кадров в секунду на 243 кадра в секунду потребовался бы GPU стоимостью более 10 тыс. долларов и мощностью в тысячи ватт. Короче говоря, этого просто не произойдет.

Не волнуйтесь, пуристы, вы никогда не избавитесь от традиционной растеризации, потому что DLSS требует базовой основы для работы. Руководитель Nvidia Дженсен Хуанг намекнул на это в пресс-конференции Q+A, но споры между растром и DLSS, несомненно, будут продолжаться. Для нас вся компьютерная графика — это попытки воссоздать реальный мир наилучшим образом, поэтому, будь то одна техника или другая, мне все равно. Важно только, чтобы она работала. Уверены что DLSS теперь является обязательной функцией на видеокартах RTX.

Стремление к лучшей производительности и более качественному изображению является краеугольным камнем эволюции DLSS. Если говорить прямо, первые несколько итераций были в лучшем случае средними. Конечно, были более высокие частоты кадров, хотя визуальные издержки иногда были высокими. Случаи двоения, мерцания и того, что выглядело не совсем правильно, преследовали зарождающиеся реализации. Следуя за траекторией с момента запуска, я бы предпочел сейчас поиграть с качеством DLSS, чем понизить собственное разрешение.

Повышение частоты кадров и качества изображения

До сегодняшнего дня DLSS использовала методологию генерации пикселей на основе сверточных нейронных сетей (CNN). Оптимизированная за предыдущие шесть лет, она усовершенствована настолько, насколько позволяет технология. Однако теперь на помощь DLSS приходит более современная технология, известная как Transformer Model. Разработанная Google в 2017 году, эта модель глубокого обучения является золотым стандартом для ИИ, принятым в популярных приложениях, таких как ChatGPT.

DLSS 4 Transformer требует больше собственной мощности для работы, поскольку он более сложен. Nvidia приводит в два раза больше параметров и в четыре раза больше вычислений по сравнению с CNN. На фоне компьютерной графики новая модель имеет заметные преимущества в качестве изображения для DLSS Ray Reconstruction, Super Resolution и DLAA.

Вот иллюстрация того, как Ray Reconstruction улучшает временную стабильность и увеличивает детализацию. Эффект едва уловим, и вы не замечаете его, пока на него не укажут. Но как только он есть, вы сразу видите недостатки даже в хорошо оптимизированной модели CNN.

Самое интересное, что Nvidia не связывает прирост IQ Transformer Model только с серией RTX 50. Компания, конечно, могла бы это сделать, стимулируя обновления до новейшего и лучшего оборудования, но при этом она будет доступна для всех карт RTX. Я знаю, что она будет хорошо работать на последних GeForce, таких как RTX 4080 Super, но мне искренне любопытно посмотреть, как она поведет себя на старых картах, таких как RTX 2060. Честная игра для Nvidia за то, что она сделала ее доступной миллионам геймеров. Прилив поднимает все корабли и все такое.

Конечно, DLSS-доработки, такие как MFG и Transformer, должны быть реализованы разработчиком для каждой игры. Их просто невозможно запустить в каждой игре. Ключ к успеху — это то, как быстро Nvidia удается внедрить свои технологии во все ведущие игры.

Nvidia сообщает, что Alan Wake 2, Cyberpunk 2077, Indiana Jones and the Great Circle и Star Wars Outlaws получат встроенную поддержку DLSS MFG в играх, когда в конце этого месяца выйдут графические процессоры серии GeForce RTX 50. Black Myth: Wukong, Naraka: Bladepoint, Marvel Rivals и Microsoft Flight Simulator 2024 также последуют этому примеру в ближайшем будущем.

Мы надеемся увидеть еще больше игр как можно скорее. На самом деле, мы хотим, чтобы каждая игра ААА-класса поддерживала RT и DLSS 4 с первого дня. Это сложная задача, но мы чувствуем, что у Nvidia достаточно мощи и инерции в отрасли, чтобы сделать это быстрее, чем у AMD или Intel.

Садитесь в поезд ИИ или останетесь позади

Те из вас, кто сравнивает графические процессоры по таблицам спецификаций, вероятно, будут несколько озадачены очевидным отсутствием прогресса в области кремния от серии RTX 40 Super до серии RTX 50. За исключением ошеломляющего лидера RTX 5090, я ожидаю, что прирост только растеризации между поколениями составит 10–20%. Мелочь по большому счету и один из наименее впечатляющих приростов поколения за поколение, которые я могу вспомнить. Это цена, которую вы платите, в буквальном смысле, за рост стоимости кремния и памяти.

Серия RTX 50 обходит это неприятное препятствие, полностью полагаясь на технологии повышения частоты кадров и IQ, такие как DLSS 4. Работая в оптимальной форме с двойным залпом MFG в сочетании с моделью Transformer, Nvidia обещает многократное увеличение частоты кадров в секунду наряду с непревзойденным качеством изображения.

Предупреждение: Настоящий материал содержит ссылки на ресурсы YouTube и/или Facebook (Meta Platforms Inc.), деятельность которых запрещена на территории Российской Федерации.

Количество просмотров: 550

Редактор: AndreyEx

Рейтинг: 0 (0 голосов)

Если статья понравилась, то поделитесь ей в социальных сетях:

DLSS, geforce, RTX, видеокарта, графический процессор

CES, Nvidia, Комплектующие, Компьютеры, Новости

Кол-во комментариев: 0

Задержка Radeon RX 9070 помогает AMD включить FSR 4 в большем количестве игр

Microsoft запускает Windows 11 24H2 на большем количестве ПК, но вы, возможно, захотите этого избежать

Настоящее оружие графических процессоров серии Nvidia GeForce RTX 50 — DLSS 4

Судите меня по количеству ядер CUDA, не так ли?

Серия RTX 50 никогда не фокусировалась на растеризации

Повышение частоты кадров и качества изображения

Садитесь в поезд ИИ или останетесь позади

Если статья понравилась, то поделитесь ей в социальных сетях:

Оставить комментарий Отменить ответ

Это может быть вам интересно

AMD незаметно публикует, а затем удаляет FSR 4.1, но геймеры уже тестируют апскейлер

Будущее видеокарт: ИИ может ускорить трассировку лучей в миллион раз

Китайская GPU Lisuan: новая попытка конкурировать с NVIDIA и AMD

NVIDIA GeForce на GDC 2026: все ключевые анонсы и технологические новинки

Сообщить об опечатке

Текст, который будет отправлен нашим редакторам: