Лекция Шинная организация ПК. Шины PCI и AGP

advertisement
шины
Ядро
Ядро - это главная часть центрального процессора
(CPU). Оно определяет
• - тип сокета (гнезда, в которое вставляется процессор),
• диапазон рабочих частот,
• частоту работы внутренней шины передачи данных
(FSB).
• Ядро процессора характеризуется следующими
параметрами: технологический процесс,
• объем внутреннего кэша первого и второго уровня,
• напряжение и теплоотдача.
Прежде чем покупать CPU с тем или иным ядром,
необходимо удостовериться, что ваша материнская
плата сможет работать с таким процессором. В рамках
одной линейки могут существовать CPU с разными
ядрами.
Внутренняя шина и регистры процессора
• Хоть процессор и получает данные из
оперативной памяти с помощью шины
некоторой ширины, это не значит, что внутри
он может обрабатывать данные такой же
разрядности.
• Количество битов данных, которые
может обработать процессор за один
прием, характеризуется разрядностью
внутренних регистров.
• Регистр - это по существу ячейка памяти
внутри процессора.
• RISC — Reduced (Restricted) Instruction Set
Computer — процессоры (компьютеры) с
сокращенной системой команд. Эти
процессоры обычно имеют набор
однородных регистров универсального
назначения; их система команд отличается
относительной простотой.
•
В результате аппаратная реализация
такой архитектуры позволяет с небольшими
затратами выполнять эти инструкции за
минимальное (в пределе 1) число тактов
синхронизации.
• CISC — Complete Instruction Set Computer —
процессоры с полным набором инструкций, к
которым относится и семейство х86. Состав и
назначение их регистров существенно
неоднородны, широкий набор команд
усложняет декодирование инструкций, на что
расходуются аппаратные ресурсы.
Возрастает число тактов, необходимое для
выполнения инструкций.
• Практически во всех современных
процессорах внутренние регистры являются
не менее 32-разрядными (Itanium от Intel и
Hammer от AMD – 64 разряда).
• Шина- это магистраль, связывающая некоторые
компоненты компьютера между собой.
• Электрически шина - это провода,
обеспечивающие передачу электрического сигнала.
Естественно характеризовать шину скоростью, с
которой по ней могут передаваться данные.
• Шина данных процессора
• Одной из самых общих характеристик процессора
является разрядность его шины данных и шины
адреса.
• Когда говорят о шине процессора, обычно имеют
ввиду шину данных, которая является набором
соединений, для передачи и приема данных. Чем
больше сигналов одновременно поступает на шину,
тем больше данных по ней передается за
определенный интервал времени, и тем быстрее она
работает.
•
В процессоре 286 для приема и передачи двоичных
данных используется 16 соединений, поэтому их
шина данных считается 16-разрядной.
• У 32-х разрядных процессоров (например, 486),
таких соединений вдвое больше, поэтому за единицу
времени они передают и получают вдвое больше
данных, чем 16-и разрядные процессоры разумеется, эффективность выше.
• Современные процессоры (начиная с Pentium) имеют
64-х разрядную шину данных, поэтому они могут
передавать в системную память по 64 бита за один
такт.
• Такая реализация позволяет ускорить обмен
данными между быстрым процессором и
относительно медленным ОЗУ при неизменной
рабочей частоте последнего за счёт повышения
пропускной способности шины данных.
• В современных процессорах внешняя шина
данных 64-разрядная, а регистры и
внутренняя шина процессора могут быть попрежнему 32-разрядны. В современном
процессоре (например, Pentium) для
обработки информации, поступающей по
внешней 64-разрядной шине данных,
существует два обрабатывающих ее 32разрядных блока, называемых конвейерами.
• Такой процессор напоминает два
объединенных в одном корпусе 32-разрядных
процессора, а 64-разрядная внешняя шина
данных позволяет быстрее наполнить
регистры процессора.
• Такие процессоры, как Pentium 4 и Athlon
XP, являются 32 разрядными из-за
наличия внутренних регистров с
аналогичной разрядностью.
• В то же время шины ввода-вывода
процессора являются 64 разрядными, а
шины адреса — 32 разрядными.
Процессоры семейства Itanuim, AMD
Opteron и Athlon 64 являются
полноценными 64 разрядными
процессорами, поскольку имеют также 64
разрядные внутренние регистры.
• Такая архитектура, применяющая
для обработки поступивших данных
несколько конвейеров, называется
суперскалярной и применяется
сегодня во всех современных
процессорах
Шина адреса
• Разрядность шины адреса определяет
максимальный объем памяти, адресуемой
процессором.
• Например: процессор 8086 имел адресную
шину 20 бит.
• Таким образом, максимальный объем
оперативной памяти, поддерживаемой
процессором 8086, составляет 1 Мбайт.
• 286-ой процессор имел адресную шину равную
24 битам, адресуя, таким образом, уже 16
Мбайт.
• Современные процессоры имеют адресную
шину равной 36 бит, что соответствует
поддерживаемой оперативной памяти объемом
64 Гбайт!
Шина PCI (Peripheral Component
Interconnect bus)
– Разработка шины PCI началась весной 1991 года как
внутренний проект корпорации Intel (Release 0.1).
Специалисты компании поставили перед собой цель
разработать недорогое решение, которое бы
позволило полностью реализовать возможности
нового поколения процессоров 486/Pentium/P6 .
Особенно подчеркивалось, что разработка
проводилась "с нуля", а не была попыткой установки
новых "заплат" на существующие решения. В
результате шина PCI появилась в июне 1992 года
(R1.0). Разработчики Intel отказались от
использования шины процессора и ввели еще одну
"антресольную" (mezzanine) шину.
– В результате шина PCI появилась в июне
1992 года (R1.0). Разработчики Intel
отказались от использования шины
процессора и ввели еще одну
"антресольную" (mezzanine) шину.
• Благодаря такому решению шина
получилась, во-первых, процессоронезависимой, а во-вторых, могла работать
параллельно с шиной процессора, не
обращаясь к ней за запросами. Например,
процессор работает себе с кэшем или
системной памятью, а в это время по сети на
винчестер пишется информация.
СВОЙСТВА
– Полная поддержка multiply bus master
(например, несколько контроллеров жестких
дисков могут одновременно работать на шине).
– Поддержка кэша.
– Автоматическое конфигурирование карт
расширения при включении питания.
– Спецификация шины позволяет комбинировать
до восьми функций на одной карте (например,
видео + звук и т.д.).
– Шина позволяет устанавливать до 4 слотов
расширения, однако возможно использование
моста PCI-PCI для увеличения количества карт
расширения.
СВОЙСТВА
PCI-устройства оборудованы таймером, который
используется для определения максимального
промежутка времени, в течении которого
устройство может занимать шину.
– повышенная пропускная способность.
– Шина поддерживает метод передачи
данных, называемый "linear burst" (метод
линейных пакетов). Этот метод предполагает,
что пакет информации считывается (или
записывается) "одним куском", то есть адрес
автоматически увеличивается для следующего
байта. При этом увеличивается скорость
передачи собственно данных за счет
уменьшения числа передаваемых адресов.
Шина AGP (Accelerated Graphic Port)
Для видеоконтроллеров разработана
специальная шина, которая называется AGP
(Accelerated Graphics Port).
Появление 3D ускорителей привело к тому, что
ребром встал вопрос: что делать? Либо
увеличивать количество дорогой памяти
непосредственно на видеокарте, либо хранить
часть информации в дешевой системной
памяти, но при этом каким-нибудь образом
организовать к ней быстрый доступ.
СВОЙСТВА
Intel на базе того же стандарта PCI R2.1 разрабатывает
новую шину - AGP (R1.0, затем 2.0), которая
отличается от своего "родителя" в следующем:
– шина способна передавать два блока данных за один
66 MHz цикл (AGP 2x);
– устранена мультиплексированность линий адреса и
данных (в PCI для удешевления конструкции адрес и
данные передавались по одним и тем же линиям);
– дальнейшая конвейеризация операций чтения/записи
позволяет устранить влияние задержек в модулях
памяти на скорость выполнения этих операций.
– В результате пропускная способность шины была
оценена в 500 МВ/сек, и предназначалась она для
того, чтобы видеокарты хранили текстуры в
системной памяти, соответственно имели меньше
памяти на плате, и, соответственно, дешевели..
Особенности архитектуры процессоров
шестого поколения
• В P6 (686) реализованы возможности,
которых не было в процессорах предыдущих
поколений.
• Основных процессоров класса P6 два:
Pentium Pro и Pentium II.
• Основные особенностями процессоров
шестого поколения:
• динамическое выполнение,
• - улучшенное суперскалярное исполнение,
• архитектура двойной независимой шины
(DIB, Dual Independent Bus).
Процессор Pentium 4, выпущен в ноябре
2000 года, представляет собой совершенно
новое поколение процессоров (процессор
786)
• Гиперконвейерная технология (20
ступеней).
• ■ Нестандартное выполнение инструкций.
• ■ Расширенное прогнозирование ветвления.
• ■ Кэш-память первого уровня объемом 20
Кбайт (кэш контроля выполнения команд
объемом 12 Кбайт, плюс 8 Кбайт кэша
данных).
• ■ Ассоциативная восьмиуровневая 128-
разрядная кэш-память второго уровня
объемом 256 Кбайт, работающая на
частоте процессора.
• ■ Кэш-память второго уровня
позволяет обрабатывать до 4 Гбайт
ОЗУ.
• Расширенный модуль выполнения
операций с плавающей запятой.
• ■ Несколько режимов понижения
потребления мощности.
•
• Гиперконвейерная технология позволяет удвоить
по сравнению с Pentium III интенсивность
конвейерной обработки инструкций.
• Механизм быстрого выполнения позволяет двум
целочисленным АЛУ работать с удвоенной
частотой процессора, что делает возможным
выполнение инструкций в течение полутакта.
•
Системная шина с рабочей частотой 400 МГц
представляет собой учетверенную шину,
взаимодействующую с системным тактовым
генератором, частота которого 100 МГц, что
позволяет передавать данные четыре раза за
один такт.
• Благодаря динамическому выполнению
процессор может параллельно
обрабатывать большое количество
команд.
• Основные особенности
динамического выполнения
следующие:
• * множественное предсказание
ветвлений; это средство предназначено
для прогнозирования значения счетчика
команд при выполнении команд
ветвления;
• * анализ потока данных, благодаря
которому можно получить информацию,
необходимую для планирования
выполнения команд, независимо от их
первоначального порядка в программе;
• * упреждающее выполнение, которое
"предугадывает" изменения счетчика
команд и выполняет команды,
результаты которых, вероятно, вскоре
понадобятся.
• Предсказание ветвления ранее
использовалось только в высокопроизводительных универсальных процессорах. Это
средство позволяет полностью задействовать
возможности конвейера команд процессора, что
способствует повышению быстродействия.
• (В специальном устройстве выборки и
дешифрации команд используется высоко
оптимизированный алгоритм предсказания
ветвления, благодаря которому удается с
большой точностью прогнозировать поток и
результаты команд, которые будут выполнены
после нескольких команд ветвления, вызовов
процедур и возвратов).
• Упреждающее выполнение - возможность процессоров
выполнять команды с опережением фактического
значения счетчика команд.
• Устройство диспетчеризации и выполнения команд
процессора использует результаты анализа потока
данных для выполнения всех доступных команд из пула
команд и сохраняет результаты во временных регистрах.
Затем специальный модуль (модуль вытеснения
результатов) отыскивает в списке команд завершенные
команды, которые больше не зависят от данных,
вычисляемых в других командах, или от других команд
ветвления.
• Когда такие завершенные команды найдены, модуль
вытеснения, запоминают их результаты таким образом,
как в случае выполнения этих команд в порядке их
первоначального расположения. После этого список
команд от них освобождается.
• Динамическое выполнение, по существу,
ликвидирует недостатки и зависимость от линейного
(последовательного) выполнения команд.
•
Поддерживая независимое от линейного
расположения выполнение команд, это средство может
предотвратить задержки в модулях обработки команд,
возникающие вследствие ожидания данных из памяти.
Несмотря на то, что устройство предсказания порядка
команд помогает изменить порядок выполнения,
результаты записываются так, как если бы команды
выполнялись в первоначальном порядке. Поэтому
процессор Р6 точно так же, как процессоры Р5
(Pentium) и более ранние, может выполнять
имеющееся программное обеспечение, но только
значительно быстрее!
• Для обхода узкого места — внешней шины
— в Р6 применена архитектура двойной
независимой шины DIB (Dual Independent
Bus) , реализующая, по сути, две отдельные
шины.
• Одна из этих шин используется только для
связи с кристаллом вторичного кэша,
расположенным в том же корпусе
микросхемы или картридже, что и процессор.
Эта шина является локальной в
геометрическом смысле — проводники имеют
длину порядка единиц сантиметров, что
позволяет использовать ее на высокой
частоте тактирования, вплоть до частоты
ядра.
• Значительный объем вторичного кэша
обеспечивает удовлетворение
большинства запросов к памяти сугубо
локально, при этом коэффициент
загрузки внутренней шины достигает 90
%.
• Вторая шина процессорного кристалла
выходит на внешние выводы
микросхемы (картриджа), и является
системной, или «фасадной» шиной FSB
(Front-Side Bus) процессорa P6.
• Эта шина работает на внешней частоте
независимо от внутренней шины.
• Архитектура двойной независимой
шины необходима для повышения
эффективности процессора,
работающего на тактовой частоте 300
МГц и выше.
• процессоры Р6 работают на
тактовых частотах 1000 МГц и выше.
• процессоры Р7 работают на
тактовых частотах 1300-1700 МГц и
выше.
Download