Федеральное агентство по образованию ГОУ ВПО «Российский химико-технологический университет имени Д.И. Менделеева»

advertisement
Федеральное агентство по образованию
ГОУ ВПО
«Российский химико-технологический университет
имени Д.И. Менделеева»
Новомосковский институт (филиал)
Кафедра ВТИТ
Предмет «Организация ЭВМ»
Лабораторная работа №1
Тема «Исследование характеристик центрального процессора»
Студент: Кривогуз А.Н.
Группа: АС-08-02
Преподаватель: Шульмин А.С.
Выполнение:
Новомосковск 2010
Цель работы:
1) Исследовать конструктивные особенности, процесс установки,
частотные и тепловые характеристики процессоров различных
поколений.
2) Ознакомиться с операциями, реализуемыми в центральном процессоре
и его принципом работы.
3) Изучить методы сравнения производительности современных
процессоров и оценки их пригодности для решения тех или иных задач.
Характеристики двух разных сравниваемых компьютерных
систем:
Далее будут описаны лишь различия компьютерных систем.
CPU:
Как видно из характеристик разных поколений процессоров Intel Core 2 Duo
E6550 и Intel Pentium D 925, мы имеем различия в напряжении питания (но
это не показатель, разброс значений невелик, да и в заводских
характеристиках разброс этого значения одинаковый), естественно разные
значения типа семейства и модели процессора идентификатора CPUID
(Processor Signature). Intel Core 2 Duo E6550 поддерживает SSSE набор
инструкций, в отличии от Intel Pentium D 925(в остальном поддержка
инструкций одинакова). Разные показатели объема первого КЭШа и Trace
КЭШа (у Core 2 Duo E6550 на порядок больше значение этого объема). У
Intel Pentium D 925 второй кэш разделен на 2, а у Intel Core 2 Duo E6550
второй кэш представлен единым (но объем одинаковый). Разные
действующие тактовые частоты: частота ядра (больше у Intel Pentium D 925),
частота шины (больше у Core 2 Duo E6550) и номинальная частота (больше у
Core 2 Duo E6550). Разный множитель (больше у Intel Pentium D 925).
Особенностью Intel Pentium D 925 является то, что в нем внедрена логическая
многопроцессорная архитектура Hyper-Threading, т.е. один физический
процессор представлен двумя логическими.
Cache:
Разные объемы первого и Trace КЭШа, причем Trace кэш Intel Pentium D
925 не имеет 64-байтного размера строки. У Intel Pentium D 925 второй
кэш разделен на 2, а у Intel Core 2 Duo E6550 второй кэш представлен
единым, но объем второго Кэша у этих процессоров одинаковый.
Mainboard:
Разные модели, разные чипсеты, разные БИОСы.
Memory:
В общих: у Intel Core 2 Duo E6550 режим DC симметричный, тогда как у
Intel Pentium D 925 он отсутствует.
В синхронизации: разные частоты DRAM(больше у Intel Core 2 Duo
E6550), разные FSB:DRAM(опять же показатель выше у Intel Core 2 Duo
E6550), время цикла tRAS (а тут Intel Core 2 Duo E6550 уступает).
SPD:
Различная пропускная способность: у Intel Core 2 Duo E6550 (400MHz)
больше, чем у Intel Pentium D 925(333MHz).(скрины вторых слотов думаю
идентичны).
Ход работы:
1) CPU RightMark:
Тестовый пакет CPU RightMark предназначен для объективного измерения
производительности современных и будущих процессоров в различных
вычислительных задачах, таких как численное моделирование физических
процессов и решение задач 3D-графики. Основной упор сделан на
тестирование под нагрузкой блоков FPU/SIMD процессора и связки CPU—
RAM.
Слева значения FPS для Intel Core 2 Duo E6550, справа - Intel
Pentium D 925.
Model 1
Model 1
Model 6
Model 6
Model 7
Model 7
8,3
6,7
12,5
8,3
8,7
8,1
8,3
5,8
11,5
8
9,4
6,2
8,3
5,8
10,9
7,9
9,4
6,3
8,3
5,8
10,7
7,5
9,4
6,7
8,3
5,8
10,7
8,3
9,4
6,8
8,3
5,8
10,7
8,1
9,4
6,6
8,3
5,8
11,4
8
9,4
6,8
8,3
5,8
12,5
8,3
9,4
6,8
8,3
5,8
13,5
7,9
9,4
6,8
8,3
5,8
12
7,5
9,4
6,8
8,3
5,8
11,8
7,9
9,4
6,8
8,3
5,8
11,8
7,5
9,4
6,8
8,3
5,8
11,1
7,9
9,4
6,8
8,3
5,8
10,7
7,5
9,4
6,8
8,3
5,8
10,7
7,9
9,4
6,8
8,3
5,8
10,7
7,5
9,4
6,8
8,3
5,8
10,7
7,9
9,4
6,8
8,3
5,8
10,7
7,9
9,4
6,8
8,3
5,8
10,7
7,9
9,4
6,8
8,3
5,8
10,7
7,9
9,4
6,8
8,3
5,8
11,5
7,9
9,4
6,8
8,3
5,8
10,5
7,9
9,4
6,8
8,3
5,8
11,4
7,9
9,4
6,8
8,3
5,8
10,7
7,9
9,4
6,8
8,3
5,9
10,7
7,9
9,4
6,8
8,3
6,2
10,7
7,9
9,4
6,8
8,3
6,1
10,7
7,9
9,4
6,8
8,3
5,8
10,7
7,9
9,4
6,8
8,9
6,2
10,7
7,9
9,4
6,8
8,5
5,8
10,7
7,9
9,4
6,8
9,1
6,2
10,7
7,9
9,4
6,8
Модель 1
Учитываются потери на трение, то есть тела движутся в вязкой среде.
Взаимодействие осуществляется по закону обратных квадратов расстояний,
при малых расстояниях притяжение сменяется отталкиванием. В процессе
взаимодействия тела накапливаются около общего центра масс, причем более
мелкие объекты оказываются ближе к центру масс. Такое расположение
диктуется минимумом потенциальной энергии. В процессе взаимодействия
потенциальная энергия системы стабилизируется.
Модель 6
Потери на трение отсутствуют. Взаимодействие осуществляется по закону
обратных расстояний, при малых расстояниях притяжение сменяется
отталкиванием. Модель представляет собой три звезды с общим поясом
астероидов. Конфигурация объектов не стабилизируется с течением времени,
однако отдельные объекты не улетают на бесконечность. Такое поведение
связано с тем, что соответствующий потенциал неограниченно возрастает на
бесконечности. Данная модель является примером системы, находящейся в
бесконечно глубокой потенциальной яме.
Модель 7
Учитываются потери на трение, то есть тела движутся в вязкой среде.
Взаимодействие осуществляется по закону обратных расстояний, при малых
расстояниях притяжение сменяется отталкиванием. Конфигурация объектов
становится шаровой — такое расположение соответствует минимуму
потенциальной энергии. Подобное поведение можно считать демонстрацией
поверхностного натяжения. Такая модель также может описывать каплю
воды.
Высчитаем средние арифметические:
Слева значения средне арифметических FPS для Intel Core 2 Duo E6550,
справа - Intel Pentium D 925.
Model 1
Model 1
Model 6
Model 6
Model 7
Model 7
8,1
5,7
10,7
7,6
9
6,6
В данных показателях лидирует процессор Intel Core 2 Duo E6550.
Причиной отставания Intel Pentium D 925 от Intel Core 2 Duo E6550 является
то, что в Intel Pentium D 925 внедрена логическая многопроцессорная
архитектура Hyper-Threading, т.е. один физический процессор представлен
двумя логическими, а в Intel Core 2 Duo E6550 используется многоядерная
архитектура, включающая два ядра. Но главной причиной является разница
тактовых частот, а чем выше тактовая частота, тем выше значение FPS.
Поскольку в тестовом приложении в основном выполняется эффективное
предварительное кэширование данных, производительность памяти не
оказывает решающего влияния на результаты.
2) Winrar и 7z.
Уровень сжатия – нормальный.
Программа/процессор
Intel Core 2 Duo E6550
Intel Pentium D 925
WinRAR
24 сек
17207022b
89 сек
24775090b
7z
10 сек
24767915b
61 сек
40507000b
Архиватор 7z использует алгоритм LZMA, который используется по
умолчанию. Этот алгоритм более совершенен чем алгоритм архивации
Winrar, поэтому и показатели у 7z на порядок лучше.
Скорость архивации зависит от скорости работы подсистемы памяти.
А у Intel Core 2 Duo E6550 частота оперативной памяти выше, объемы кешей
тоже на порядок больше, к тому же свою роль играет многопоточная
обработка данных в процессоре, отсюда и получается отставание Intel
Pentium D 925.
3) RightMark Memory Analyzer.
1) D-Cache Bandwidth (Тест реальной пропускной способности шины
L1/L2 кэша данных).
Intel Core 2 Duo E6550.
Intel Pentium D 925.
Тест Memory Bandwidth. Я использовал стандартные настройки. Тест
заключается в чтении, записи и копировании блоков информации различного
размера. Результат измерений приведен на скриншотах.
Мы видим кривые зависимости пропускной способности от размера
копируемого блока. На графиках отчетливо различима одна ступенька. Часть,
которая находится левее первого перепада, характеризуется максимальной
скоростью передачи данных. При этом она заканчивается на 16 килобайтах
для Intel Pentium D 925, а для Intel Core 2 Duo E6550 она заканчивается на 32,
что соответствует половине процессорного кэша первого уровня. Все дело в
том, что кэш первого уровня разделен пополам между данными и
инструкциями. Во время тестов чтения или записи первый спад происходит
на отметке 16 килобайт и 32 килобайта.
После этого начинает работать кэш второго уровня. Вторая ступень не такая
резкая, поскольку на первых порах кэш второго уровня вносит довольно
большой вклад. Однако с продолжением роста размера блока вклад кэша
экспоненциально падает до нуля (в теории).
2) D-Cache Arrival (Тест прибытия данных по шине L1/L2).
Intel Core 2 Duo E6550.
Intel Pentium D 925.
Тест D-Cache Arrival (Тест прибытия данных по шине L1/L2). Я использовал
стандартные настройки. Тест предназначен для тестирования деталей
реализации шины L1-L2 кэша данных (разрядность, мультиплексность).
Результат измерений приведен на скриншотах.
Латентность двойного обращения при прямом последовательном доступе,
при обратном последовательном доступе и при случайном доступе
возрастает начиная с 32 кб и 16 кб, что соответствует половине
процессорного кэша первого уровня. Это значит что отправка данных
происходит начиная именно с этого момента и продолжается до конца
второго КЭШа(в теории). Причем Intel Core 2 Duo E6550 делает это в два
раза быстрее.
3) Decode-Bandwidth (Тест конвейера и кэша инструкций).
Intel Core 2 Duo E6550.
Intel Pentium D 925.
Тест Decode-Bandwidth (Тест конвейера и кэша инструкций). Я использовал
стандартные настройки. Тест позволяет оценить эффективность
декодирования/исполнения ряда простых команд процессором
(ALU/FPU/MMX), а также эффективность работы L1 кэша инструкций.
Результат измерений приведен на скриншотах.
Эффективность работы L1 кэша инструкций Intel Pentium D 925.
падает вдвое, на четверти объема КЭШа L1 он снизил скорость
декодирования данных с 8мб/с до 3мб/с (примерно).А Intel Core 2 Duo E6550
с декодированием справился успешно.
4) I-Cache latency (Тест латентности кэша инструкций).
Intel Core 2 Duo E6550.
Intel Pentium D 925.
Тест I-Cache latency (Тест латентности кэша инструкций). Я использовал
стандартные настройки. Тест предназначен для измерения латентности
доступа в L1i/L2 кэш/RAM в условиях исполнения кода, а также
ассоциативности L1 кэша инструкций и объединенного L2 кэша
инструкций/данных. Принцип этого теста следующий: в выделенном блоке
памяти конструируется зависимая цепочка, каждый элемент которой
содержит в себе инструкцию перехода на следующий элемент (jmp) с шагом,
задаваемым величиной Stride Size, а последний элемент такой цепочки
содержит инструкцию возврата контроля (ret). Результат измерений приведен
на скриншотах.
Латентность – это задержка или ожидание, которая увеличивает реальное
время отклика по сравнению с ожидаемым. В компьютерах латентность
может быть уменьшена применением технологий упреждающего чтения и
многопоточности.
Процессор Intel Pentium D 925 имеет большую латентность по сравнению с
Intel Core 2 Duo E6550.
5) D-TLB (Тест трансляционного буфера данных).
Intel Core 2 Duo E6550.
Intel Pentium D 925.
Тест D-TLB (Тест трансляционного буфера данных). Я использовал
стандартные настройки. Тест предназначен для определения объема и
степени ассоциативности трансляционного буфера данных (Translation
Lookaside Buffer, L1/L2 D-TLB). В этом тесте, фактически, измеряется
латентность доступа в L1 кэш, но при том условии, что каждая последующая
строка кэша загружается не из той же самой, а из следующей страницы
памяти. Результат измерений приведен на скриншотах.
Одна из фундаментальных характеристик кэш-памяти — уровень
ассоциативности — отображает её логическую сегментацию. Дело в том, что
последовательный перебор всех строк кэша в поисках необходимых данных
потребовал бы десятков тактов и свёл бы на нет весь выигрыш от
использования встроенной в ЦП памяти. Поэтому ячейки ОЗУ жёстко
привязываются к строкам кэш-памяти (в каждой строке могут быть данные
из фиксированного набора адресов), что значительно сокращает время
поиска. С каждой ячейкой ОЗУ может быть связано более одной строки кэшпамяти: например, n-канальная ассоциативность (англ. n-way set associative)
обозначает, что информация по некоторому адресу оперативной памяти
может храниться в n местах кэш-памяти.
6) I-TLB (Тест трансляционного буфера инструкций ).
Intel Core 2 Duo E6550.
Intel Pentium D 925.
Тест I-TLB (Тест трансляционного буфера инструкций ). Я использовал
стандартные настройки. Тест предназначен для определения объема и
степени ассоциативности трансляционного буфера инструкций (Instructions
Translation Lookaside Buffer, L1/L2 I-TLB).
Результат измерений приведен на скриншотах.
Intel Pentium D 925 требуется в два раза больше тактов а следовательно и
времени нежели чем для Intel Core 2 Duo E6550.
4) WinBench 99.
CPUmark 32 и FPU WinMark для измерения производительности
процессорной подсистемы.
Программа/процессор
Intel Core 2 Duo E6550
Intel Pentium D 925
CPUMark32
88901
46401,2
FPU WinMark
-
89001,2
Показатель CPUmark32 характеризует скорость работы процессорной
подсистемы (включающей ЦП, вторичный кэш и системное ОЗУ) под
управлением 32-разрядных операционных систем.
Разница данных результатов связана с различием в КЭШ системе
процессоров, их различия, как известно у Intel Core 2 Duo E6550 первый
КЭШ и Trace КЭШ имеют больший объем, причем Trace кэш Intel Pentium D
925 не имеет 64-байтного размера строки. Различная пропускная
способность: у Intel Core 2 Duo E6550 (400MHz) больше, чем у Intel Pentium
D 925(333MHz). Также свою роль играет многопоточная обработка
процессора Intel Core 2 Duo E6550.
5) Sandra 2005.
Арифметический тест процессора
Арифметический тест процессора (CPU Arithmetic Benchmark) — позволяет
оценить производительность выполнения арифметических вычислений и
операций с плавающей запятой в сравнении с другими эталонными
компьютерными системами;
Результаты эталонных тестов:
Intel Core 2 Duo E6550
Intel Pentium D 925
Dhrystone ALU
28347 MIPS
15892 MIPS
Whetstone FPU
7036 MFLOPS
4328 MFLOPS
Whetstone iSSE2
10370 MFLOPS
7462 MFLOPS
ALU — арифметическо-логические целочисленные операции с
использованием регистров общего назначения;
FPU — некоторые элементарные и вычислительные операции,
осуществляемые блоком вычислений с плавающей точкой (FPU);
MIPS –миллион инструкций (операций) в секунду.
MFLOPS – миллион плавающих операций в секунду.
Из теста мы видим преимущество Intel Core 2 Duo E6550 перед Intel Pentium
D 925. Данные показатели напрямую связаны с значением тактовых частот
процессоров и пропускной способности оперативной памяти.
Мультимедийный тест процессора
Мультимедийный тест процессора (CPU Multi-Media Benchmark) — дает
возможность оценить производительность системы в работе с
мультимедийными данными при использовании поддерживаемых
процессором наборов SIMD-инструкций в сравнении с другими эталонными
компьютерными системами;
Результаты эталонных тестов:
Intel Core 2 Duo E6550
Intel Pentium D 925
Integer x8 iSSE2
61140 it/s
33944 it/s
Float x4 iSSE2
69193 it/s
40108 it/s
It/s – количество итераций в секунду.
Опять же лидирует Intel Core 2 Duo E6550.
Показатели теста напрямую зависят от характеристик процессора:
архитектуры и частот.
Вывод:
Итак, в двух разных сравниваемых компьютерных системах с процессорами
Intel Core 2 Duo E6550 и Intel Pentium D 925 явно лидирует компьютерная
система с процессором Intel Core 2 Duo E6550. Этот вывод сделан на основе
тестов CPU RightMark, архивации данных с помощью прикладных программ
Winrar и 7z, тестов RightMark Memory Analyzer, тестов WinBench 99 и тестов
Sandra 2005. Почти по всем параметрам тестов и конфигурации
компьютерных систем с помощью программы CPUZ, лидирует Intel Core 2
Duo E6550. Эти процессоры принадлежат разным поколениям, у них разные
архитектуры и разные стоимости.
Download