За исключением откровенно нелепого RTX 5090, бесстыдно расширяющего господство GPU с высоты, три других GPU серии Nvidia GeForce RTX 50, анонсированных на CES 2025, не являются Big Deal™ в традиционном смысле аппаратного обеспечения. Обычно скрытые за разговорами о смелых спецификациях, настоящая звезда шоу — это то, что Nvidia сделала с программным обеспечением, и как всеобъемлющие улучшения приносят пользу миллионам геймеров.
Не поймите нас неправильно, заметьте. Независимо от того, в какую игру мы играем, мы бы предпочели RTX 5080 вместо RTX 4080 (Super) и RTX 5070 вместо RTX 4070 (Super) каждый день недели и дважды по воскресеньям.
Но мы намеренно умеряем ожидания энтузиастов, зная, что собственное тестирование Nvidia показывает, что скачок растеризации между поколениями карт меньше, чем когда-либо. Конечно, нам придется провести собственные расчеты, но, если взглянуть на базовые аппаратные характеристики RTX 5080 и RTX 4080 Super, обе стоили $999 на момент запуска с разницей в год, то можно увидеть консервативные различия.
ГПУ | RTX5080 | RTX 4080 Super |
---|---|---|
Архитектура | Blackwell | Ada Lovelace |
Процесс | TSMC 4N | TSMC 4N |
Кодовое имя Die | GB203 | AD103 |
Размер матрицы | 378мм² | 378,6 мм² |
Транзисторы | 45,6 млрд. | 45,9 млрд. |
Ядра CUDA | 10,752 | 10,240 |
Базовые часы | 2.30ГГц | 2.29ГГц |
Увеличить тактовую частоту | 2.62ГГц | 2.55ГГц |
CUDA- FP32 | 56,34 терафлопс | 52,22 терафлопс |
Память | 16 ГБ | 16 ГБ |
Тип памяти | GDDR7 | GDDR6 |
Шина памяти | 256-бит | 256-бит |
Скорость памяти | 30Гбит/с | 23Гбит/с |
Пропускная способность памяти | 960ГБ/с | 736ГБ/с |
Трассировка лучей | 171 терафлопс | 121 терафлопс |
Тензорное ядро | 1,801 TOPS | 836 TOPS |
Общая графическая мощность | 360 Вт | 320 Вт |
Системные требования | 850 Вт | 750 Вт |
Цена | 999$ | 999$ |
Доступность | Январь 2025 г. | Январь 2024 г. |
Переваривание цифр дает паузу для размышлений. Не ожидайте многого от традиционной пропускной способности, поскольку обе карты пугающе похожи по площади кремния, размеру кристалла и старым FP32 TFLOPS — расчет пропускной способности, который исторически во многом определял игровую производительность в тандеме с пропускной способностью памяти. В этом отделе есть хороший 30%-ный рост за счет использования GDDR7, работающей на скорости 30 Гбит/с, в то время как Nvidia усилила возможности трассировки лучей в большей степени. Ключевым выбросом является крайне важный AI TOPS, о котором мы расскажем позже. Вы узнаете, почему это число так важно для этого поколения и следующего.
Возможно, мы слишком суровы к архитектуре Blackwell серии RTX 50 и блокам SM. При увеличении одного из них видны те же 128 шейдерных ядер, хотя и расположенных по-другому. Ранее серия RTX 40, также известная как Ada, разделяла ядра на 64 FP32 (темно-зеленые) и еще 64, способных к FP32 и INT32. Теперь у нас по-прежнему то же общее количество, но все 128 способны обрабатывать числа с плавающей точкой или целые числа. Различие важно, поскольку игры действительно используют INT32, поэтому гибкость всех ядер для его запуска полезна. Нам будет сложно выделить реальные преимущества, учтите.
Другим ключевым изменением является добавление нейронного затенения, которое добавляет нейронные сети к программируемым шейдерам. Подобно тому, как работает DLSS, технология создает более реалистичные текстуры из высокосжимаемых данных. Нам показали демо, где RTX Neural Faces создает модель ИИ в реальном времени из простого растеризованного лица, делая его гораздо более естественным. Подумайте об этом так, как DLSS берет входные данные с низким разрешением и создает более качественный вывод. Демо ниже показывает, что улучшенные ИИ нейронные материалы выглядят более реалистично и занимают меньше ценного пространства VRAM. Поймите, что, как и многие новые способы делать что-то, разработчикам нужно будет интегрировать нейронное затенение в свои движки.
Тем не менее, возвращаясь к сути, мы достаточно долго занимались этой игрой с анализом GPU, чтобы перевести таблицу выше в вероятную производительность в 4K со всеми включенными визуальными наворотами. Мы предполагаем, что вы увидите 10-15% улучшение растеризованной частоты кадров между RTX 5080 и RTX 4080 Super. Конечно, я могу оказаться неправ, когда появятся обзоры, но мы уверены, что вы не увидите 30-40% улучшений, не прибегнув к новым методам обработки изображений.
И в этом суть вопроса. Nvidia прекрасно понимает, что растущие цены на транзисторы и инвестиции в передовые производственные процессы — это не тот путь, по которому нужно идти при создании лучших видеокарт. Инновации обязательно должны происходить за пределами кремния, и именно поэтому за последние шесть лет были сделаны инвестиции, меняющие правила игры, если вы извините за вопиющий каламбур, в технологии RTX и DLSS.
Серия GeForce RTX 50 с гордостью выступает в качестве примера того, как извлечь значимые улучшения производительности поколения без неоправданного инвестирования в дорогие вещи, такие как больше ядер CUDA. Это единственная серия с полным набором технологий DLSS 4, включая Multi-Frame Generation (MFG), которая добавляет три дополнительных кадра между каждым традиционно отрисованным кадром. И, как всем известно, больше кадров равно большему количеству фрагментов.
На бумаге звучит достаточно просто, поскольку графические процессоры серии GeForce RTX 40 также имеют возможности генерации кадров, но это не одно и то же. Размещение второго или третьего кадра, скажем, на RTX 4080, становится все более сложным по чисто временным причинам. Каждый последующий кадр требует генерации новой информации оптического потока вместе с моделью искусственного интеллекта, полученной из DLSS. За кулисами многое происходит для создания вставленного кадра. Это практически невозможно сделать за короткое время между традиционно отрисованными кадрами. Nvidia некоторое время боролась с этой проблемой и поняла, что, хотя MFG — отличная идея на бумаге, для нее требуется новый подход.
Шаг вперед, Blackwell. Графические процессоры серии RTX 50 делают несколько вещей по-другому. MFG теперь работает, потому что аппаратный оптический ускоритель потока заменен на модель ИИ с однократным развертыванием, способную генерировать несколько кадров. Она на 40% быстрее и также требует на 30% меньше видеопамяти. Решая вторую часть проблемы MFG, а именно генерацию визуально высококачественных изображений, необходимых для нескольких кадров, Nvidia использует возможности ИИ серии RTX 50. DLSS лучше всего работает с невероятной мощностью AI TOPS, и именно эти TOPS, помимо последнего поколения, помогают генерировать и вставлять кадры два и три, относящиеся к MFG. Без обилия TOPS вы получите изображение, которое провалится.
На данный момент RTX 5080 имеет более чем 2-кратную производительность RTX 4080 Super. На самом деле, это еще не все, поскольку серия RTX 50 изначально поддерживает более быстрый формат FP4, распространенный в задачах ИИ — серия RTX 40 работает с ним гораздо медленнее из-за отсутствия специального оборудования — но вы поняли. Занимайтесь ИИ или идите домой. Другого разумного способа обеспечить умопомрачительную частоту кадров не существует.
Последняя часть головоломки — как дополнительные кадры доставляются на ваш дисплей. Даже если RTX 40 Series может генерировать несколько кадров быстро, как RTX 50, есть вопрос их равномерного распределения, чтобы производительность казалась плавной. Вот почему бремя распределения кадров переходит от CPU к выделенному движку в RTX 50 Series. В двух словах, распределение кадров GPU, генерация кадров, сгенерированных AI, и несколько кадров DLSS объединяются, чтобы предоставить DLSS 4 в его наиболее полной форме.
Результаты, честно говоря, впечатляют. Вы смотрите на Cyberpunk 2077 с качеством изображения, установленным на 11. Вот почему даже RTX 5090 спотыкается на всего лишь 27 кадров в секунду на 4K. Увеличение до DLSS 4 MFG увеличивает частоту кадров в восемь раз, одновременно уменьшая задержку. Конечно, вы можете легко изменить собственные настройки DLSS Off, чтобы достичь 60 кадров в секунду, но Nvidia иллюстрирует угловой случай с RT, установленным на трассировку пути.
Недавно довелось поиграть в эту самую игру во время Дня редакторов. Подключенные к 4K240 OLED, интеллектуалы DLSS 4 предлагают самый плавный опыт, который мы когда-либо испытывали в Найт-Сити. На самом деле странно видеть стратосферную частоту кадров в том, что на бумаге является смехотворно обременительной обстановкой.
Этот опыт научил кое-чему о графике. Давно прошли те времена, когда итеративное увеличение производительности достигалось путем грубой атаки на ядра CUDA. Хотели запустить Crysis в два раза быстрее? Вы терпеливо ждали, пока Nvidia или AMD не сделают GPU в два раза больше и в два раза более прожорливые. Если бы эта тенденция продолжалась до сегодняшнего дня, то для перехода с 27 кадров в секунду на 243 кадра в секунду потребовался бы GPU стоимостью более 10 тыс. долларов и мощностью в тысячи ватт. Короче говоря, этого просто не произойдет.
Не волнуйтесь, пуристы, вы никогда не избавитесь от традиционной растеризации, потому что DLSS требует базовой основы для работы. Руководитель Nvidia Дженсен Хуанг намекнул на это в пресс-конференции Q+A, но споры между растром и DLSS, несомненно, будут продолжаться. Для нас вся компьютерная графика — это попытки воссоздать реальный мир наилучшим образом, поэтому, будь то одна техника или другая, мне все равно. Важно только, чтобы она работала. Уверены что DLSS теперь является обязательной функцией на видеокартах RTX.
Стремление к лучшей производительности и более качественному изображению является краеугольным камнем эволюции DLSS. Если говорить прямо, первые несколько итераций были в лучшем случае средними. Конечно, были более высокие частоты кадров, хотя визуальные издержки иногда были высокими. Случаи двоения, мерцания и того, что выглядело не совсем правильно, преследовали зарождающиеся реализации. Следуя за траекторией с момента запуска, я бы предпочел сейчас поиграть с качеством DLSS, чем понизить собственное разрешение.
До сегодняшнего дня DLSS использовала методологию генерации пикселей на основе сверточных нейронных сетей (CNN). Оптимизированная за предыдущие шесть лет, она усовершенствована настолько, насколько позволяет технология. Однако теперь на помощь DLSS приходит более современная технология, известная как Transformer Model. Разработанная Google в 2017 году, эта модель глубокого обучения является золотым стандартом для ИИ, принятым в популярных приложениях, таких как ChatGPT.
DLSS 4 Transformer требует больше собственной мощности для работы, поскольку он более сложен. Nvidia приводит в два раза больше параметров и в четыре раза больше вычислений по сравнению с CNN. На фоне компьютерной графики новая модель имеет заметные преимущества в качестве изображения для DLSS Ray Reconstruction, Super Resolution и DLAA.
Вот иллюстрация того, как Ray Reconstruction улучшает временную стабильность и увеличивает детализацию. Эффект едва уловим, и вы не замечаете его, пока на него не укажут. Но как только он есть, вы сразу видите недостатки даже в хорошо оптимизированной модели CNN.
Самое интересное, что Nvidia не связывает прирост IQ Transformer Model только с серией RTX 50. Компания, конечно, могла бы это сделать, стимулируя обновления до новейшего и лучшего оборудования, но при этом она будет доступна для всех карт RTX. Я знаю, что она будет хорошо работать на последних GeForce, таких как RTX 4080 Super, но мне искренне любопытно посмотреть, как она поведет себя на старых картах, таких как RTX 2060. Честная игра для Nvidia за то, что она сделала ее доступной миллионам геймеров. Прилив поднимает все корабли и все такое.
Конечно, DLSS-доработки, такие как MFG и Transformer, должны быть реализованы разработчиком для каждой игры. Их просто невозможно запустить в каждой игре. Ключ к успеху — это то, как быстро Nvidia удается внедрить свои технологии во все ведущие игры.
Nvidia сообщает, что Alan Wake 2, Cyberpunk 2077, Indiana Jones and the Great Circle и Star Wars Outlaws получат встроенную поддержку DLSS MFG в играх, когда в конце этого месяца выйдут графические процессоры серии GeForce RTX 50. Black Myth: Wukong, Naraka: Bladepoint, Marvel Rivals и Microsoft Flight Simulator 2024 также последуют этому примеру в ближайшем будущем.
Мы надеемся увидеть еще больше игр как можно скорее. На самом деле, мы хотим, чтобы каждая игра ААА-класса поддерживала RT и DLSS 4 с первого дня. Это сложная задача, но мы чувствуем, что у Nvidia достаточно мощи и инерции в отрасли, чтобы сделать это быстрее, чем у AMD или Intel.
Те из вас, кто сравнивает графические процессоры по таблицам спецификаций, вероятно, будут несколько озадачены очевидным отсутствием прогресса в области кремния от серии RTX 40 Super до серии RTX 50. За исключением ошеломляющего лидера RTX 5090, я ожидаю, что прирост только растеризации между поколениями составит 10–20%. Мелочь по большому счету и один из наименее впечатляющих приростов поколения за поколение, которые я могу вспомнить. Это цена, которую вы платите, в буквальном смысле, за рост стоимости кремния и памяти.
Серия RTX 50 обходит это неприятное препятствие, полностью полагаясь на технологии повышения частоты кадров и IQ, такие как DLSS 4. Работая в оптимальной форме с двойным залпом MFG в сочетании с моделью Transformer, Nvidia обещает многократное увеличение частоты кадров в секунду наряду с непревзойденным качеством изображения.
Заполните форму и наш менеджер перезвонит Вам в самое ближайшее время!
Спасибо! Ваша заявка принята
Спасибо! Ваша заявка принята