В AMD Radeon следующего поколения может использоваться модульная конструкция

Графические процессоры с модульной конструкцией уже много лет используются в профессиональном секторе, но еще не вышли на потребительский рынок. AMD Radeon RX 7900 XTX была первой в своем классе, которая сделала шаг в этом направлении, но не смогла реализовать действительно модульную конструкцию, потому что графическое ядро оставалось монолитным, и единственное, что было передано на аутсорсинг, — это кэш L3.
Уже давно ходят слухи, что AMD собирается объединить архитектуры RDNA (потребительская) и CDNA (профессиональная) под единой архитектурой, UDNA, и это вызвало слухи о том, что, как следствие, мы можем увидеть появление первых Radeon с модульной конструкцией на общем потребительском рынке в рамках этой будущей архитектуры.
Эти слухи были подкреплены появлением патента на технологию, которая теоретически позволила бы преодолеть наиболее серьезные проблемы, возникающие при разработке такого типа видеокарт, если мы говорим о графических картах общего пользования, хотя патент предназначен в первую очередь для процессоров, поэтому, насколько он может быть перенесен на видеокарту общего назначения, пока неясно. Графические процессоры ни на что не гарантируют.
Какая проблема может возникнуть у Radeon с модульной конструкцией
У него будет несколько проблем, таких как правильная координация чиплетов графического процессора и пропускная способность, которой они располагают, но, несомненно, наиболее важной из них будет задержка. Распараллеливание работы, связанной с запуском игры между двумя или более графическими ядрами, включает разделение данных и операций между двумя или более блоками, расположенными в разных положениях.
Разделение обоих графических ядер уже приводит к некоторой задержке, и эти задержки могут негативно повлиять на производительность и свести на нет положительные эффекты, которые такая конструкция может иметь с точки зрения общей мощности. Бесполезно иметь огромное количество шейдеров, блоков текстурирования и блоков растрирования, если связь между двумя или более блоками медленная и имеет высокую задержку.
Элемент, который может помочь уменьшить задержку, включен в патент AMD и описывается как схема «структура данных» с интеллектуальным коммутатором. Короче говоря, это будет Infinity Fabric, которую AMD использует с процессорами Ryzen, но адаптированная и оптимизированная для удовлетворения потребностей потребительского графического процессора.
Этот интеллектуальный коммутатор позволит оптимизировать доступ к памяти, выполняя очень конкретный рабочий цикл: он будет определять, требует ли запрос на графическую рабочую нагрузку миграции задач или репликации данных, и после постановки этого вопроса он будет принимать решение с запасом всего в несколько наносекунд.
Это помогло бы уменьшить проблему задержки при доступе к данным, но в патенте также предлагаются другие важные изменения, которые заключаются в интеграции кэшей L1 и L2 аналогично тому, что мы видели в графических ускорителях AMD Instinct., которые используют конструкцию MCM (модуль мультичип).
Каждый чиплет графического процессора будет иметь свои собственные кэши L1 и L2 и сопровождаться блоком общего кэша L3, управление доступом к которому будет соответствовать интеллектуальному коммутатору. Кэш-память L3 будет достаточно большой, чтобы уменьшить зависимость от основной памяти (видеопамяти), но нам нужно будет посмотреть, как решается вопрос доступа обоих графических процессоров к графической памяти.
Наиболее логичным было бы использовать унифицированную шину, которая позволяла бы каждому графическому чиплету получать доступ в любое время и с очень низкой задержкой ко всему доступному объему графической памяти, но в этом смысле у нас пока нет никакой конкретной информации о возможных нововведениях, имеющих значение для будущих Radeon.
Редактор: AndreyEx
