Поиск по сайту:

Много книг составлять — конца не будет, а много читать утомительно для плоти (Соломон).

Изучение возможностей искусственного интеллекта графических процессоров Nvidia GeForce RTX

23 января, 2025
Изучение возможностей искусственного интеллекта графических процессоров Nvidia GeForce RTX

Искусственный интеллект доминирует практически во всех областях технологий, включая программную речь генерального директора Nvidia Дженсена Хуанга на выставке CES 2025. Эта технология станет неотъемлемой частью серии GeForce RTX 50 компании , в большей степени, чем в любом поколении видеокарт до этого. Это не должно вызывать удивления, учитывая, насколько существующие запасы улучшают приложения с помощью машинного обучения, как творческие, так и игровые.

Поскольку ожидание того, как GeForce RTX 50 Series будет расширять границы производительности, становится все короче, я считаю важным оценить, как обстоят дела в настоящее время. Легко забыть, но видеокарты GeForce, составляющие почти 90% рынка, способны на большее, чем просто рендеринг красивых пикселей и кадров. На самом деле, существует множество способов, которыми они могут улучшить творческие и продуктивные рабочие процессы, используя свои значительные возможности ИИ.

 

Тензорные ядра RTX AI

Сначала небольшой урок истории с капелькой математики. В 2018 году серия GeForce RTX 20 стала первым семейством потребительских видеокарт, оснащенным специализированными аппаратными ускорителями для трассировки лучей и искусственного интеллекта. Возможно, вы лучше знаете их по «ядрам трассировки лучей» и «тензорным ядрам» соответственно, работающим в тандеме с давно известными ядрами CUDA и шейдерами от Nvidia.

Ядра тензора получили свое название от своей способности обрабатывать их тезку: тензорную математику. Не вдаваясь в подробности того, что такое тензор, все, что вам нужно знать, это то, что они играют первостепенную роль в применении машинного обучения. Без них обработка бесчисленных переменных нейронных сетей была бы практически невозможна.

Изучение возможностей искусственного интеллекта графических процессоров Nvidia GeForce RTX

Именно по этой причине тензорные ядра являются движущей силой большей части технологии DLSS от Nvidia. Эти ядра выполняют большую часть тяжелой математической работы, необходимой для масштабирования изображений и увеличения частоты кадров, зачастую с выходом, который на самом деле лучше, чем собственное разрешение, благодаря интеллектуальному способу, которым DLSS улучшает визуальную точность посредством машинного обучения. Это не магия, но близко к этому.

Предстоящая видеокарта GeForce RTX 5090 поднимает планку до 3352 TOPS — невообразимый прирост в 9211% по сравнению с процессорами типа NPU.

 

Однако, критически важные для растущей армии создателей контента, эти ядра Tensor также способны предоставлять улучшенные ИИ-возможности за пределами игр. В последней области можно измерить их производительность в AI TOPS (триллион операций в секунду). Те же TOPS доступны и для других распространенных ускорителей, таких как CPU или GPU, хотя и с пропускной способностью, которая на порядок ниже. Именно эта относительная медлительность делает эти ускорители непригодными для игровых сред, где вся требуемая работа должна быть выполнена за миллисекунды.

Чтобы поместить гегемонию GeForce TOPS в контекст и использовать лучшие процессоры в качестве эталона, Tensor Core NPU в последнем настольном Intel Core Ultra 9 285K достигает пика в 36 INT8 TOPS, в то время как Intel Core Ultra 9 288V лидирует в ноутбучном сегменте с 120 TOPS, достигнутыми его комбинацией CPU, GPU и NPU. Для сравнения, Nvidia значительно опережает своих конкурентов, а предстоящая GeForce RTX 5090 поднимает планку до 3352 TOPS — непостижимый рост на 9211% по сравнению с сопутствующими процессорами типа NPU.

Изучение возможностей искусственного интеллекта графических процессоров Nvidia GeForce RTX

Это не новая история, поскольку унифицированный архитектурный подход Nvidia ставит ее потребительские карты в один ряд с корпоративными альтернативами. Команда Green победила своих нынешних соперников в 2020 году с ее GeForce RTX 3070 на базе Ampere, работающей на 166 TOPS. Между тем, ее флагманы убегают с монументальными подъемами, поскольку RTX 4090 раздвигает границы до 1321 TOPS AI благодаря 512 ядрам Tensor, а RTX 5090 имеет еще 2,5-кратный прирост сверх этого.

…мы можем извлечь огромную производительность из тензорных ядер в наших видеокартах GeForce RTX.

 

Достаточно сказать, что из тензорных ядер в наших видеокартах GeForce RTX можно извлечь огромную производительность. Это не осталось незамеченным поставщиками программного обеспечения, и такие гиганты, как Adobe и другие, обновляют свои приложения функциями, которые специально требуют ускорения ИИ, что стало возможным благодаря хорошо оптимизированным, быстрым тензорным ядрам.

Ядра Tensor Cores являются основой для работы быстрого, точного генеративного ИИ и обработки больших языковых моделей, таких как ChatGPT. Не будет преувеличением сказать, что без них многие из вызывающих восторг приложений, которые вы воспринимаете как должное сегодня, просто не существовали бы. Конечно, Nvidia также разработала несколько инструментов в своей лаборатории, которые стоит проверить и которые могут стать отличной отправной точкой.

 

Улучшение качества жизни

Вам не нужно быть креативным профессионалом, чтобы воспользоваться преимуществами GeForce RTX AI. Фактически, Nvidia предлагает несколько приложений, которые вы можете бесплатно проверить на ее веб-сайте с минимальными усилиями.

 

ChatRTX

Скорее всего, вы знакомы с чат-ботами вроде ChatGPT или другими облачными моделями Large Language Models (LLM), такими как Microsoft Copilot. Однако можно запустить персонализированную LLM на вашем ПК, используя мощь вашей видеокарты. В качестве примера можно привести ChatRTX.

 

Используя ChatRTX, вы можете запросить локальный набор данных, например, проектное задание или личную коллекцию фотографий, чтобы помочь с обобщением и поиском. Для этого не нужно подключение к Интернету, так как все происходит прямо в вашей системе благодаря совместимому графическому процессору GeForce RTX.

Запуск ChatRTX вместо облачного LLM дает преимущества в плане безопасности и задержки. Любые материалы, загруженные в ChatRTX, никогда не выходят за пределы вашего ПК, что сокращает время ожидания и минимизирует риски безопасности, присущие передаче данных на внешний сервер.

ChatRTX пока находится на ранних стадиях разработки без v1.0 в названии. Однако даже эти «демо» версии весьма полезны и многообещающи.

 

RTX-Video

Как человек с дисплеем 4K HDR, я использую функцию «RTX Video» почти каждый день. Вы найдете ее готовой к использованию в разделе «System» приложения Nvidia на вкладке «Video». Эта функция на самом деле представляет собой два в одном, состоящих из «Video Super Resolution» и «High Dynamic Range». Первая использует ИИ для повышения разрешения видеоконтента, а также для уменьшения артефактов сжатия. Между тем, последняя преобразует SDR-видео в цветовое пространство HDR, как игровой фильтр RTX HDR, который я настоятельно рекомендую проверить.

 

Вы можете практически установить и забыть Video Super Resolution, но оно не активируется, если вы не смотрите контент через VLC Media Player или поддерживаемый веб-браузер, такой как Google Chrome или Microsoft Edge. Лично я считаю, что настройка качества «Авто» работает просто отлично, но есть четыре предустановки, если вы хотите лучше контролировать, насколько она использует ваш графический процессор в сравнении с точностью конечного вывода.

High Dynamic Range требует некоторого пробного и ошибочного тестирования, чтобы попасть в эту приятную для глаз точку. Однако после того, как вы зафиксируете свои настройки, он может преобразовать SDR-контент таким образом, что это буквально зрелище. Чтобы быть точным, результаты никогда не заменят настоящий опыт HDR, но он достаточно близок, чтобы быть действительно приятным.

 

Nvidia Broadcast

Графические процессоры GeForce RTX уже отлично подходят для потоковой передачи благодаря поддержке видеокодера NVENC AV1, но они также могут улучшить качество настройки камеры и микрофона через Nvidia Broadcast. Благодаря улучшениям AI это приложение обеспечивает функции эхо- и шумоподавления для вашего микрофона и может разблокировать новые функции для вашей веб-камеры.

Как человек, который делит офисное пространство, я ценю конфиденциальность, когда дело касается видеозвонков. Через Nvidia Broadcast я могу быстро применить размытие фона или полностью заменить свой фон изображением или видео по своему выбору.

Другие эффекты включают «Auto Frame», который гарантирует, что ваше лицо останется впереди и в центре камеры, позволяя вам ерзать и двигаться так, как душе угодно. Вы можете запустить эту и несколько других опций одновременно и легко настроить их через Nvidia Broadcast.

 

Nvidia Broadcast получит большое обновление ближе к запуску серии GeForce RTX 50. Эта новая версия будет включать в себя эффект микрофона «Studio Voice», виртуальную подсветку клавиш и даже потокового помощника ИИ.

 

Ускорение креативности

Число приложений, использующих аппаратное обеспечение GeForce RTX, растет с каждым днем. Ниже я расскажу о некоторых наиболее популярных примерах, но Nvidia предоставляет полный список другого программного обеспечения, которое извлекает выгоду из таких ядер, как CUDA, Tensor и трассировка лучей.

Поскольку все эти функции локальны для вашего ПК, это не только делает ваши данные более защищенными, поскольку они никогда не покидают вашу систему, но и сокращает время и расходы. В отличие от облачного ИИ, нет ожидания в цифровой очереди для загрузки вашего контента, зависимости от скорости широкополосного доступа и мощности соединения или риска для вашей конфиденциальности, поскольку вы доверяете третьей стороне обработку вашей информации. В конце концов, кто хочет терпеть изнурительное время ожидания для крупных проектов, не говоря уже о том, чтобы платить за пропускную способность для этого?

 

Adobe Creative Cloud

Видеокарты GeForce RTX способны улучшить производительность пакета Adobe Creative Cloud множеством способов, используя мощь своих ядер CUDA и Tensor.

 

Поскольку для Premiere Pro важна как чистая графическая мощность, так и плавный монтаж и финальный рендеринг, запуск приложения с графическим процессором Nvidia имеет ряд преимуществ. Например, с GeForce RTX на буксире у вас теперь есть доступ к кодированию NVENC и декодированию NVDEC, что соответственно ускоряет экспорт и предварительный просмотр контента высокого разрешения.

Ядра Tensor Cores идут в комплекте, чтобы ускорить процесс редактирования, с такими функциями, как «Обнаружение редактирования сцены», которая быстро обнаружит вырезки в исходном файле и разделит их соответствующим образом на отдельные клипы. Другие полезные инструменты ИИ включают сопоставление цветов, улучшение речи и «Автоматическое перекадрирование», последний из которых значительно упрощает отслеживание объекта в горизонтальных и вертикальных соотношениях сторон.

 

Photoshop предлагает более 30 функций с ускорением на базе графического процессора, которые видеокарты GeForce RTX могут заставить работать более плавно и быстро.

Естественно, ИИ может помочь и здесь. Борясь с трудностями, связанными с активами низкого разрешения, «Суперразрешение» может обеспечить более высокое качество изображений, чем стандартные методы масштабирования. «Нейронные фильтры» могут давать столь же впечатляющие результаты. Такие примеры, как «Восстановление фотографий», могут значительно ускорить процесс восстановления старых фотографий до их былого великолепия.

 

Ядра CUDA и Tensor видеокарт GeForce RTX также приносят пользу другим приложениям в пакете, таким как After Effects, Illustrator, Lightroom и другим.

 

Blender

3D-моделирование может оказаться крайне затратным для вашей видеокарты, но у видеокарт GeForce RTX есть несколько трюков в рукаве, которые помогут облегчить нагрузку и сэкономить время.

 

Размытие движения с ускорением на GPU не только намного быстрее в применении, чем ручные обходные пути, но и приводит к более точным, высококачественным конечным результатам. Ядра CUDA ускоряют экспорт финальных проектов.

Рендеринг с трассировкой лучей через CPU возможен, но он утомительно медленный по сравнению с GPU. Видеокарты GeForce RTX еще быстрее благодаря встроенным ядрам RT, которые предлагают расширенные функции трассировки лучей и производительность. Что еще лучше, они могут работать с ядрами Tensor для обеспечения ‘OptiX Denoising’ на базе ИИ для более чистого конечного изображения.

 

DaVinci Resolve

DaVinci Resolve — один из самых универсальных и мощных наборов для редактирования на рынке. Естественно, производительные графические карты, такие как GeForce RTX Series GPU, необходимы для раскрытия его полного потенциала.

 

Помимо поддержки кодирования NVENC AV1 и декодирования NVDEC, DaVinci Resolve включает в себя несколько инструментов, которые улучшают проекты с помощью ИИ.

«RTX Video Super Resolution» удаляет видеоартефакты и может масштабировать исходный контент с более низким разрешением, например, с 1080p до 4K. Между тем, «RTX Video HDR» может придать дополнительную яркость контенту SDR, переводя цвета в более широкую гамму.

Более продвинутые функции включают распознавание лиц и автоматическую маркировку клипов, в дополнение к таким функциям, как «SpeedWarp» для плавного замедленного движения. Благодаря этим нескольким инструментам и многим другим нет никаких сомнений в том, что видеокарты GeForce RTX делают редактирование более эффективным.

 

Тестирование ИИ

Хорошо и полезно понимать, что такое тензорные ядра и как они могут помочь, но получение мяса производительности на костях иллюстрирует их истинную полезность в повышении производительности в приложениях, обсуждаемых выше. С этой целью я провел сравнительный анализ ИИ-нарезок и соответствующих приложений на двух последних картах Nvidia: GeForce RTX 4090 и GeForce RTX 3070, а также некоторые сравнения с выполнением тех же рабочих нагрузок на одном ведущем ЦП.

Изучение возможностей искусственного интеллекта графических процессоров Nvidia GeForce RTX

 

Эти оценки подчеркивают разительную разницу в производительности между запуском мультимедийных приложений на CPU и GeForce GPU. Например, RTX 3070 обеспечивает в 6,6 раза большую производительность, в то время как RTX 4090 на целых 22 раза быстрее.

Если рассматривать это во временном контексте, то проект рендеринга, который занимает час на 16-ядерном 32-поточном процессоре AMD Ryzen 9 7950X, должен занять менее трех минут на RTX 4090. Когда время — деньги и проекты нужно выпустить, есть только один явный победитель.

Изучение возможностей искусственного интеллекта графических процессоров Nvidia GeForce RTX

 

Тест Geekbench вычисляет возможности ИИ ускорителей. Используя популярную настройку половинной точности — также известную как 16-бит — мы видим похожую историю с первой. Здесь ускорение составляет почти 30x от Ryzen 9 7950X до RTX 4090.

Изучение возможностей искусственного интеллекта графических процессоров Nvidia GeForce RTX

 

Этот бенчмарк проходит через многочисленные модели нейронных сетей — визуальное распознавание, классификация изображений, обнаружение объектов, суперразрешение и т. д. — и оценивает производительность. Чем быстрее эти сети могут выполнять задачи, тем быстрее вы получите значимые результаты.

Рассматривая широкий спектр вариантов использования, мы видим 50-кратное улучшение производительности RTX 4090 по сравнению с Ryzen 9 7950X, тогда как RTX 3070 в 34 раза быстрее.

Конечно, можно ожидать, что графические процессоры и тензорные ядра будут лучше справляться с этими распараллеливаемыми задачами, но остается открытым вопрос, насколько быстрее они способны предоставлять результаты, обеспечивающие хороший опыт.

Хотите генерацию изображения в текст, которая занимает секунды, а не минуты? Запустите ее на ведущем в своем классе RTX. Нужна модель большого языка для предоставления практически мгновенного ответа на любой запрос, который вы можете придумать? Не используйте ЦП.

Зная, что карты RTX просто лучше, чем CPU, во многих задачах ИИ, хороший вопрос, на который стоит ответить, — как разные решения работают по сравнению друг с другом, если смотреть на ускорение, встроенное в приложения. Мы можем сделать это, изучив RTX 3070 и RTX 4090 в последних тестах ИИ DaVinci Resolve, которые полезны для таких задач, как стабилизация видео, уточнение лиц, аудиоперевод, интеллектуальное обновление и т. д.

DaVinci ResolveRTX 3070 кадров в секундуRTX 4090 кадров в секунду
Супер масштаб30.6284,91
Улучшение лица17.6730.62
Пересвет8.916.01
Отслеживание магической маски28.7759.03
Оптический поток6.1115.07
Переосмысление времени выполнения13912707

 

Выбор шести переменных показывает ускорение от 1,8x до 2,77x. Вы могли бы ожидать этого, на самом деле, учитывая внутреннюю мощь RTX 4090, но все же приятно знать, что есть настоящее масштабирование между графическими процессорами RTX для приложений, которые важны для создателей.

Еще одним ключевым преимуществом мощных графических процессоров в вашей системе является локальная обработка бенчмарков генерации текста, полученных из больших языковых моделей. Подумайте об этом как о сокращенном ChatGPT, работающем на вашем ПК, а не в облаке. Более быстрая карта RTX помогает, но здесь я скажу вам, насколько.

Procyon LLMОценка RTX 3070Оценка RTX 4090
Phi 3.52,5574,793
Mistral 7B2,1985,011
Llama 3.12,0054,745
Llama 204,963

 

Сначала о главном. Llama 2 не работает на RTX 3070 из-за недостаточного объема оперативной памяти; 8 ГБ карты просто недостаточно для хранения всех необходимых параметров. Тем не менее, глядя на другие модели, можно ожидать от 1,9x до 2,4x большей производительности при замене гиганта RTX 4090.

Между тем, скромный процессор настолько слаб в этих задачах, что выдает практически бессмысленные результаты в DaVinci Resolve — то, что занимает секунды, занимает несколько минут — и просто не может выполнять LLM-программы среднего размера, не спотыкаясь настолько, что становится практически непригодным к использованию.

 

Заключение

Выпущенная в 2018 году серия графических процессоров GeForce RTX 20, Nvidia выделила значительное пространство на кристалле для новомодных тензорных ядер. Преобладающей мыслью геймеров в то время было недоумение, почему фокусируется на технологии без немедленной отдачи. Конечно, кристалл тензорных ядер должен быть сохранен для традиционных шейдерных блоков для большей производительности растеризации, верно?

Перемотка на семь лет вперед дает свежий взгляд. То, что когда-то было молодой инициативой, превратилось в, пожалуй, самый важный компонент современных карт RTX. Позвольте мне напомнить, что без дальновидных тензорных ядер они не были бы DLSS — улучшением базовой частоты кадров в 5 и более раз в некоторых играх — или врожденной способностью фундаментально ускорять растущие рабочие нагрузки ИИ, которые становятся все более распространенными в повседневных приложениях.

Изучение возможностей искусственного интеллекта графических процессоров Nvidia GeForce RTX

 

Ядра Nvidia GeForce RTX Tensor Cores являются благом для многих рабочих процессов и обеспечивают улучшение качества жизни при повседневном использовании ПК. Популярные творческие приложения, такие как Adobe Photoshop, Premier Pro и DaVinci Resolve, теперь включают опции использования графических процессоров RTX для ресурсоемких задач, что в некоторых случаях сокращает время выполнения с часов до минут. Тем временем такие приложения, как Nvidia RTX Video и Broadcast, протягивают руку помощи для улучшения видео и подавления шума.

Если рассматривать производительность в контексте, запуск приложений на ведущих в своем классе графических процессорах в 10 раз быстрее, чем на премиальном ЦП. Преимущество увеличивается до более чем 30 раз в крайних случаях, что подчеркивает, что если выбранное вами приложение может использовать ускорение графического процессора, вам действительно следует его включить.

Более того, возможности искусственного интеллекта, встроенные в видеокарты RTX, позволяют им локально запускать крупноязыковые модели, устраняя необходимость использования облачного рендеринга и решения проблем с задержками и безопасностью.

Видеокарты Nvidia GeForce RTX — это больше, чем просто художники красивых пикселей. Их надежные возможности прокладывают путь к радикальному сокращению времени, необходимого для сложных творческих и новых рабочих процессов ИИ, при этом предоставляя функции качества жизни, о которых вы даже не знали, что они вам нужны.

Если вы нашли ошибку, пожалуйста, выделите фрагмент текста и нажмите Ctrl+Enter.

Поделиться в соц. сетях:
0 0 голоса
Рейтинг статьи
Подписаться
Уведомить о
guest

0 комментариев
Старые
Новые Популярные
Межтекстовые Отзывы
Посмотреть все комментарии

Читайте также

0
Оставьте комментарий! Напишите, что думаете по поводу статьи.x

Сообщить об опечатке

Текст, который будет отправлен нашим редакторам:

Заполните форму и наш менеджер перезвонит Вам в самое ближайшее время!

badge
Обратный звонок 1
Отправить
galka

Спасибо! Ваша заявка принята

close
galka

Спасибо! Ваша заявка принята

close