Uploaded by dimasosmanov5

Лабараторная №9

advertisement
ВТИПО – 25
Османов Динмухамед
СРО №9
ТЕХНИЧЕСКИЕ ХАРАКТЕРИСТИКИ ВИДЕОКАРТЫ
Задание №1. Запустить утилиту CPU-Z, перейти на вкладку "Graphics", чтобы
увидеть доступные параметры вашей видеокарты. Заполните некоторые
общие параметры видеокарты в таблица 1:
1
2
2
3
4
5
6
7
8
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
Name
GPU
Technology
Board Manuf.
Code Name
Revision
TDP
Transistors
ROPs/TMUs
GFX Core
Memory Size
Memory Type
Memory Clock
Driver Version
Bus Interface
Renderer
AMD Radeon Graphics
Renoir
7 nm
Hewlett-Pacard
Vega
C4
15.0W
9800M
8/20
400 MHz
512 MB
Использует ОЗУ (DDR4)
400 MHz
23.8.1
PCIe x16 3.0
Vulkan, DirectX, OpenGL,OpenGL, DirectCompute,
DirectML
Shaders
320
Pixel Fillrate
11.2 GPixel/s
Texture Fillrate 28.0 GTexel/s
Bus Width
128 bit
Bandwidth
42.7 GB/s
Digital
WHQL
Signature
GPU Clock
1400 MHz
AMD
Disabled
CrossFire
Resizable BAR Disabled
Описание всех полей:
1. Name (Название): Это название графического процессора (GPU), произведенного компанией AMD.
2. GPU (Графический процессор): Это кодовое имя графического процессора.
3. Technology (Технология): - Это технологический процесс производства, измеряемый в нанометрах.
4. Board Manufacturer (Производитель платы): Это компания, производившая графическую карту.
5. Code Name (Кодовое имя): Это кодовое имя архитектуры графического процессора.
6. Revision (Ревизия): Это номер версии или ревизии графического процессора.
7. TDP (Тепловыделение): Тепловая мощность графического процессора, измеряемая в ваттах.
8. Transistors (Транзисторы): Количество транзисторов в графическом процессоре.
9. ROPs/TMUs (ROPs/Текстурные блоки): ROPs (Render Output Units) отвечают за вывод изображения, а
TMUs (Texture Mapping Units) - за текстурную обработку.
10. GFX Core (Графическое ядро): Частота работы графического ядра в мегагерцах.
11. Memory Size (Объем памяти): Объем видеопамяти на графической карте.
12. Memory Type (Тип памяти): Тип видеопамяти
13. Memory Clock (Частота памяти): Частота работы видеопамяти в мегагерцах.
14. Driver Version (Версия драйвера): Версия установленного графического драйвера.
15. Bus Interface (Интерфейс шины): Тип и версия шины PCI Express, через которую графическая карта
подключена к материнской плате.
16. Renderer (Рендерер): Поддерживаемые графические API (программные интерфейсы) для рендеринга
графики.
 Vulkan - это современный, открытый графический API, разработанный Khronos Group. Он
предоставляет высокоэффективный и низкоуровневый доступ к графическим и вычислительным
ресурсам видеокарты. Vulkan призван улучшить производительность и обеспечить более низкие
накладные расходы по сравнению с некоторыми предыдущими API.
 DirectX - это набор API, разработанный Microsoft для работы с мультимедийными и графическими
приложениями, включая видеоигры. Он включает в себя различные версии, такие как DirectX 9, 10,
11, и так далее. Версии DirectX часто используются в игровой индустрии для создания игр и
приложений.
 OpenGL - это открытый стандартный графический API, поддерживаемый множеством платформ. Он
часто используется в различных областях, включая разработку видеоигр, компьютерную графику и
научные приложения. Как и Vulkan, OpenGL обеспечивает низкоуровневый доступ к видеокарте.
 OpenCL (Open Computing Language) - это открытый стандарт для параллельных вычислений на
различных устройствах, включая графические процессоры. В отличие от некоторых других API,
OpenCL ориентирован не только на графику, но и на общие вычисления.
 DirectCompute - это часть DirectX и представляет собой API для общего назначения для
параллельных вычислений на видеокартах. Он позволяет разработчикам использовать
вычислительные ресурсы GPU для выполнения задач, не связанных с графикой, таких как
физические вычисления, обработка сигналов и другие.
 DirectML (Direct Machine Learning) - это библиотека глубокого обучения, разработанная Microsoft
как часть DirectX-технологий. DirectML предоставляет набор API и инструментов для интеграции
машинного обучения (ML) в приложения, использующие графический процессор (GPU). Она
включена в набор DirectX и DirectX 12, что позволяет использовать мощности графического
процессора для ускоренного выполнения задач машинного обучения.
17. Shaders (Шейдеры): Количество шейдерных ядер в графическом процессоре.
18. Pixel Fillrate (Пропускная способность по пикселям): Количество пикселей, которые графическая карта
способна обрабатывать в секунду.
19. Texture Fillrate (Пропускная способность по текстурам): Количество текстур, которые графическая карта
способна обрабатывать в секунду.
20. Bus Width (Ширина шины): Ширина шины видеопамяти, измеряемая в битах.
21. Bandwidth (Пропускная способность): Пропускная способность видеопамяти, измеряемая в гигабайтах в
секунду.
22. Digital Signature (Цифровая подпись): Цифровая подпись драйвера, которая может указывать на его
совместимость с Windows Hardware Quality Labs (WHQL).
23. GPU Clock (Частота GPU): Частота работы графического процессора в мегагерцах.
24. AMD CrossFire (Кроссфайр): Состояние технологии AMD CrossFire, которая позволяет объединять
несколько графических карт для увеличения производительности.
25. Resizable BAR: Состояние технологии Resizable BAR, которая улучшает доступ к видеопамяти и может
повысить производительность в некоторых случаях.
Задание №2. Используя ссылку выберите 3 варианта видеокарты с
различными техническими характеристиками. Заполните таблицу 2 по
выбранным Вами видеокартам. Сравните их характеристики. Расскажите о
преимуществах и различие в технических характеристиках. Сделайте вывод
в конце таблицы.
1
Модель
ASUS AMD Radeon RX KFA2 GeForce
560 ROG Strix
GTX 1650 X Black
2
Графический
процессор
Микроархитектура
Radeon RX 560
GeForce GTX 1650
GIGABYTE Intel
Arc A380
WINDFORCE OC
Arc A380
AMD GCN
NVIDIA Turing
Intel Xe-HPG
Техпроцесс
14 нм
1175 МГц
1199 МГц
12 нм
1635 МГц
6 нм
2000 МГц
2350 МГц
Объем и тип
видеопамяти
4 гб, GDDR5
4 Гб, GDDR6
6 гб, GDDR6
Максимальная
пропускная
способность
памяти
Частота памяти
108.8 Гбайт/сек
192 Gb/s
186 Гбайт/сек
6800 МГц
12.000 MHz
15.500 МГц
Количество
универсальных
процессоров
(ALU)
Число
текстурных
блоков
Число блоков
растеризации
1024
896
1024
64
56
64
16
32
32
10
Количество
мониторов
2
3
4
11
Максимальное
разрешение
5120x2880 (5K Ultra 7680x4320 (8K
HD)
Ultra HD)
7680x4320 (8K
Ultra HD)
12
Разъемы
дополнительного
питания
8 pin
6 pin
6 pin
13
Рекомендуемый,
потребляемый
мощность
Количество
линий PCIe
450 Вт
300 Вт
350 / 84 Вт
8
16
8
3
4
5
6
7
8
9
14
Базовая частота
Турбо частота
1410 МГц
Вывод:
1. ASUS AMD Radeon RX 560 ROG Strix:
 Плюсы: Достаточно хорошая базовая и турбо частота, поддержка 2
мониторов, бренд ROG Strix может предоставить хорошее
охлаждение.
 Минусы: Меньше объем видеопамяти по сравнению с другими
моделями.
2. KFA2 GeForce GTX 1650 X Black:
 Плюсы: Более высокая частота памяти, более высокая
рекомендуемая потребляемая мощность, поддержка 3 мониторов.
 Минусы: Немного меньше базовая частота GPU.
3. GIGABYTE Intel Arc A380 WINDFORCE OC:
 Плюсы: Самая современная архитектура Intel Xe-HPG, высокие
базовая и турбо частоты, поддержка 4 мониторов.
 Минусы: Выше рекомендуемая мощность (максимальная), но есть и
базовая мощность, что может быть более эффективным в
повседневных задачах.
КОНТРОЛЬНЫЕ ВОПРОСЫ
1. Ядро в терминологии CUDA: В терминологии CUDA ядро (kernel)
представляет собой программу, которая выполняется на графическом
процессоре (GPU). Ядро является функцией, написанной на языке
программирования CUDA C/C++, которая выполняется параллельно
множеством потоков на GPU. Когда вы запускаете ядро, оно выполняется
на множестве ядер CUDA, обеспечивая параллельную обработку данных.
2. Характеристики памяти в CUDA:
В CUDA доступны различные типы памяти:
 Глобальная память: Общая для всех потоков, доступная на уровне
всей программы.
 Константная память: Специальный вид глобальной памяти с
оптимизированным доступом.
 Локальная память: Память, выделяемая для каждого потока на
уровне блока.
 Разделяемая память: Общая для всех потоков в блоке.
 Текстурная память: Оптимизированная для доступа к данным с
использованием текстур.
3. Одновременная загрузка нескольких видеокарт NVIDIA: Для
обеспечения одновременной загрузки нескольких видеокарт NVidia CUDA
в системе, можно использовать технологии, такие как NVIDIA CUDA MultiProcess Service (MPS). MPS позволяет запускать несколько экземпляров
CUDA-процесса на одной системе с несколькими видеокартами.
4. Определение версии и характеристик графического процессора NVIDIA:
Для определения версии и характеристик графического процессора
NVidia можно использовать различные инструменты, такие как утилиты
системной информации (например, GPU-Z), команды командной строки
(например, nvidia-smi), а также программное обеспечение для
разработки CUDA.
5. Параллелизм в архитектуре CUDA:
Параллелизм в архитектуре CUDA означает одновременное выполнение
инструкций на множестве ядер графического процессора. CUDA
обеспечивает как параллелизм на уровне данных, так и на уровне задач,
позволяя эффективно решать задачи, которые могут быть разделены на
множество маленьких подзадач.
6. Одновременное использование технологий OpenMP и CUDA:
Да, возможно одновременное использование технологий OpenMP и
CUDA в одном проекте. OpenMP используется для параллельного
выполнения кода на многоядерных процессорах CPU, тогда как CUDA
позволяет использовать мощности графического процессора для
параллельных вычислений. В некоторых случаях, чтобы достичь лучшей
производительности, можно использовать оба подхода, организуя
параллелизм на разных уровнях (CPU и GPU).
Download