ВТИПО – 25 Османов Динмухамед СРО №9 ТЕХНИЧЕСКИЕ ХАРАКТЕРИСТИКИ ВИДЕОКАРТЫ Задание №1. Запустить утилиту CPU-Z, перейти на вкладку "Graphics", чтобы увидеть доступные параметры вашей видеокарты. Заполните некоторые общие параметры видеокарты в таблица 1: 1 2 2 3 4 5 6 7 8 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 Name GPU Technology Board Manuf. Code Name Revision TDP Transistors ROPs/TMUs GFX Core Memory Size Memory Type Memory Clock Driver Version Bus Interface Renderer AMD Radeon Graphics Renoir 7 nm Hewlett-Pacard Vega C4 15.0W 9800M 8/20 400 MHz 512 MB Использует ОЗУ (DDR4) 400 MHz 23.8.1 PCIe x16 3.0 Vulkan, DirectX, OpenGL,OpenGL, DirectCompute, DirectML Shaders 320 Pixel Fillrate 11.2 GPixel/s Texture Fillrate 28.0 GTexel/s Bus Width 128 bit Bandwidth 42.7 GB/s Digital WHQL Signature GPU Clock 1400 MHz AMD Disabled CrossFire Resizable BAR Disabled Описание всех полей: 1. Name (Название): Это название графического процессора (GPU), произведенного компанией AMD. 2. GPU (Графический процессор): Это кодовое имя графического процессора. 3. Technology (Технология): - Это технологический процесс производства, измеряемый в нанометрах. 4. Board Manufacturer (Производитель платы): Это компания, производившая графическую карту. 5. Code Name (Кодовое имя): Это кодовое имя архитектуры графического процессора. 6. Revision (Ревизия): Это номер версии или ревизии графического процессора. 7. TDP (Тепловыделение): Тепловая мощность графического процессора, измеряемая в ваттах. 8. Transistors (Транзисторы): Количество транзисторов в графическом процессоре. 9. ROPs/TMUs (ROPs/Текстурные блоки): ROPs (Render Output Units) отвечают за вывод изображения, а TMUs (Texture Mapping Units) - за текстурную обработку. 10. GFX Core (Графическое ядро): Частота работы графического ядра в мегагерцах. 11. Memory Size (Объем памяти): Объем видеопамяти на графической карте. 12. Memory Type (Тип памяти): Тип видеопамяти 13. Memory Clock (Частота памяти): Частота работы видеопамяти в мегагерцах. 14. Driver Version (Версия драйвера): Версия установленного графического драйвера. 15. Bus Interface (Интерфейс шины): Тип и версия шины PCI Express, через которую графическая карта подключена к материнской плате. 16. Renderer (Рендерер): Поддерживаемые графические API (программные интерфейсы) для рендеринга графики. Vulkan - это современный, открытый графический API, разработанный Khronos Group. Он предоставляет высокоэффективный и низкоуровневый доступ к графическим и вычислительным ресурсам видеокарты. Vulkan призван улучшить производительность и обеспечить более низкие накладные расходы по сравнению с некоторыми предыдущими API. DirectX - это набор API, разработанный Microsoft для работы с мультимедийными и графическими приложениями, включая видеоигры. Он включает в себя различные версии, такие как DirectX 9, 10, 11, и так далее. Версии DirectX часто используются в игровой индустрии для создания игр и приложений. OpenGL - это открытый стандартный графический API, поддерживаемый множеством платформ. Он часто используется в различных областях, включая разработку видеоигр, компьютерную графику и научные приложения. Как и Vulkan, OpenGL обеспечивает низкоуровневый доступ к видеокарте. OpenCL (Open Computing Language) - это открытый стандарт для параллельных вычислений на различных устройствах, включая графические процессоры. В отличие от некоторых других API, OpenCL ориентирован не только на графику, но и на общие вычисления. DirectCompute - это часть DirectX и представляет собой API для общего назначения для параллельных вычислений на видеокартах. Он позволяет разработчикам использовать вычислительные ресурсы GPU для выполнения задач, не связанных с графикой, таких как физические вычисления, обработка сигналов и другие. DirectML (Direct Machine Learning) - это библиотека глубокого обучения, разработанная Microsoft как часть DirectX-технологий. DirectML предоставляет набор API и инструментов для интеграции машинного обучения (ML) в приложения, использующие графический процессор (GPU). Она включена в набор DirectX и DirectX 12, что позволяет использовать мощности графического процессора для ускоренного выполнения задач машинного обучения. 17. Shaders (Шейдеры): Количество шейдерных ядер в графическом процессоре. 18. Pixel Fillrate (Пропускная способность по пикселям): Количество пикселей, которые графическая карта способна обрабатывать в секунду. 19. Texture Fillrate (Пропускная способность по текстурам): Количество текстур, которые графическая карта способна обрабатывать в секунду. 20. Bus Width (Ширина шины): Ширина шины видеопамяти, измеряемая в битах. 21. Bandwidth (Пропускная способность): Пропускная способность видеопамяти, измеряемая в гигабайтах в секунду. 22. Digital Signature (Цифровая подпись): Цифровая подпись драйвера, которая может указывать на его совместимость с Windows Hardware Quality Labs (WHQL). 23. GPU Clock (Частота GPU): Частота работы графического процессора в мегагерцах. 24. AMD CrossFire (Кроссфайр): Состояние технологии AMD CrossFire, которая позволяет объединять несколько графических карт для увеличения производительности. 25. Resizable BAR: Состояние технологии Resizable BAR, которая улучшает доступ к видеопамяти и может повысить производительность в некоторых случаях. Задание №2. Используя ссылку выберите 3 варианта видеокарты с различными техническими характеристиками. Заполните таблицу 2 по выбранным Вами видеокартам. Сравните их характеристики. Расскажите о преимуществах и различие в технических характеристиках. Сделайте вывод в конце таблицы. 1 Модель ASUS AMD Radeon RX KFA2 GeForce 560 ROG Strix GTX 1650 X Black 2 Графический процессор Микроархитектура Radeon RX 560 GeForce GTX 1650 GIGABYTE Intel Arc A380 WINDFORCE OC Arc A380 AMD GCN NVIDIA Turing Intel Xe-HPG Техпроцесс 14 нм 1175 МГц 1199 МГц 12 нм 1635 МГц 6 нм 2000 МГц 2350 МГц Объем и тип видеопамяти 4 гб, GDDR5 4 Гб, GDDR6 6 гб, GDDR6 Максимальная пропускная способность памяти Частота памяти 108.8 Гбайт/сек 192 Gb/s 186 Гбайт/сек 6800 МГц 12.000 MHz 15.500 МГц Количество универсальных процессоров (ALU) Число текстурных блоков Число блоков растеризации 1024 896 1024 64 56 64 16 32 32 10 Количество мониторов 2 3 4 11 Максимальное разрешение 5120x2880 (5K Ultra 7680x4320 (8K HD) Ultra HD) 7680x4320 (8K Ultra HD) 12 Разъемы дополнительного питания 8 pin 6 pin 6 pin 13 Рекомендуемый, потребляемый мощность Количество линий PCIe 450 Вт 300 Вт 350 / 84 Вт 8 16 8 3 4 5 6 7 8 9 14 Базовая частота Турбо частота 1410 МГц Вывод: 1. ASUS AMD Radeon RX 560 ROG Strix: Плюсы: Достаточно хорошая базовая и турбо частота, поддержка 2 мониторов, бренд ROG Strix может предоставить хорошее охлаждение. Минусы: Меньше объем видеопамяти по сравнению с другими моделями. 2. KFA2 GeForce GTX 1650 X Black: Плюсы: Более высокая частота памяти, более высокая рекомендуемая потребляемая мощность, поддержка 3 мониторов. Минусы: Немного меньше базовая частота GPU. 3. GIGABYTE Intel Arc A380 WINDFORCE OC: Плюсы: Самая современная архитектура Intel Xe-HPG, высокие базовая и турбо частоты, поддержка 4 мониторов. Минусы: Выше рекомендуемая мощность (максимальная), но есть и базовая мощность, что может быть более эффективным в повседневных задачах. КОНТРОЛЬНЫЕ ВОПРОСЫ 1. Ядро в терминологии CUDA: В терминологии CUDA ядро (kernel) представляет собой программу, которая выполняется на графическом процессоре (GPU). Ядро является функцией, написанной на языке программирования CUDA C/C++, которая выполняется параллельно множеством потоков на GPU. Когда вы запускаете ядро, оно выполняется на множестве ядер CUDA, обеспечивая параллельную обработку данных. 2. Характеристики памяти в CUDA: В CUDA доступны различные типы памяти: Глобальная память: Общая для всех потоков, доступная на уровне всей программы. Константная память: Специальный вид глобальной памяти с оптимизированным доступом. Локальная память: Память, выделяемая для каждого потока на уровне блока. Разделяемая память: Общая для всех потоков в блоке. Текстурная память: Оптимизированная для доступа к данным с использованием текстур. 3. Одновременная загрузка нескольких видеокарт NVIDIA: Для обеспечения одновременной загрузки нескольких видеокарт NVidia CUDA в системе, можно использовать технологии, такие как NVIDIA CUDA MultiProcess Service (MPS). MPS позволяет запускать несколько экземпляров CUDA-процесса на одной системе с несколькими видеокартами. 4. Определение версии и характеристик графического процессора NVIDIA: Для определения версии и характеристик графического процессора NVidia можно использовать различные инструменты, такие как утилиты системной информации (например, GPU-Z), команды командной строки (например, nvidia-smi), а также программное обеспечение для разработки CUDA. 5. Параллелизм в архитектуре CUDA: Параллелизм в архитектуре CUDA означает одновременное выполнение инструкций на множестве ядер графического процессора. CUDA обеспечивает как параллелизм на уровне данных, так и на уровне задач, позволяя эффективно решать задачи, которые могут быть разделены на множество маленьких подзадач. 6. Одновременное использование технологий OpenMP и CUDA: Да, возможно одновременное использование технологий OpenMP и CUDA в одном проекте. OpenMP используется для параллельного выполнения кода на многоядерных процессорах CPU, тогда как CUDA позволяет использовать мощности графического процессора для параллельных вычислений. В некоторых случаях, чтобы достичь лучшей производительности, можно использовать оба подхода, организуя параллелизм на разных уровнях (CPU и GPU).