Главная / Содержание / Процессоры. Часть 2.

 

Процессоры, совместимые с Pentium

В прошлый раз мы остановились с Вами на рассмотрении процессора Pentium фирмы Intel. Выход этого процессора был по настоящему революционным событием, и мимо этого, естественно не могли пройти конкуренты Intel. В то время конкуренцию Intel составляли две компании, производящие процессоры: AMD и Cyrix. Давайте рассмотрим продукцию этих фирм, аналогичную процессору Pentium.

AMD K5

AMD выпустила процессор, который назвала AMD K5. Чем он характерен? Во-первых, это процессор для того же процессорного разъема Socket 7, что и Pentium. Действительно, конкурентам Intel приходилось выпускать электрически совместимую с Intel продукцию, иначе покупателям процессоров AMD пришлось бы приобретать для этих процессоров специальные материнские платы, а это, разумеется, покупателю не нужно. Покупатель хочет иметь систему, полностью совместимую с процессором Pentium для того, чтобы в случае появления финансовой возможности перейти на использование процессоров Intel можно было не менять материнскую плату.

Процессор K5 производился по технологии 0,5мкм (как и процессор Pentium), но питание имел несколько выше - 3,52В (Pentium - 3,3В). Процессор имел кэш первого уровня размеров 16кб для команд и 8кб для данных. Кэш второго уровня размещался, как и в любой Pentium системе на материнской плате. К5 имел встроенный сопроцессор. Вышли следующие модификации процессора: К5-PR75, K5-PR90, K5-PR100, K5-PR120, K5-PR133, K5PR-166. Однако, в отличие от процессоров Pentium, AMD при маркировке K5 использовала НЕ тактовую частоту, а так называемый Pentium-Rating (PR). Что это значит? Это значит, что процессор К5 не работает на той частоте, которая на нем написана, а работает на более низкой частоте! При этом AMD утверждает, что производительность нового процессора с соответствующим PR равна производительности Pentium на этой частоте!!! Насколько это соответствует истине? Лишь отчасти. Действительно, по операциям с целыми числами процессор К5 показывает весьма неплохую эффективность, действительно давая производительность соответствующего Pentium. Но эффективность сопроцессора К5 оставляет желать много лучшего - К5 в среднем на 30% менее производителен на х87 командах, чем эквивалентный ему Pentium. В основном из-за этого пользователи и не любили процессор AMD K5, так как примерно в это время 3-х мерные игры, да и вообще мультимедиа-приложения, стали развиваться бурными темпами. Но, разумеется, у К5 был свой покупатель. Естественно, что процессор К5 стоил дешевле, нежели Pentium, причем AMD возводила в ранг политики своей работы принцип: "Эквивалентная производительность при меньшей на 20% цене". Но что значит эквивалентная производительность мы уже говорили: только в х86 инструкциях, в математике К5 был совсем не равен Pentium. Так же следует сказать о способностях К5 к разгону. Процессор гнался плохо. Это было связано и с повышенным питанием, и с перегревом кристалла, и с тем, что AMD стремилась отмаркировать свои процессоры на максимально возможной для них частоте чтобы подороже продать, лишая их нередко даже минимального запаса по тактовой частоте, что любви пользователей процессору не добавляло. В общем назвать К5 серьезным конкурентом Pentium не слишком правильно. Это было явное второе место с достаточно большим отрывом. И, наконец, таблица соответствия реальной частоты процессора К5 и написанного на нем PR

 

PR

Частота процессора

Множитель

Частота системной шины

75 МГц

75 МГц

х1.5

50 МГц

90 МГц

90 МГц

х1.5

60 МГц

100 МГц

100 МГц

х1.5

66 МГц

120 МГц

90 МГц

х1.5

60 МГц

133 МГц

100 МГц

х1.5

66 МГц

166 МГц

117 МГц

х1.75

66 МГц

 

 

Cyrix 6x86

Фирма Cyrix, еще один разработчик х86 процессоров, представила свой процессор под названием 6х86, совместимый по контактам с процессором Pentium. Этот процессор имел 16кб кэша первого уровня, изготавливался по технологии 0.5мкм и устанавливался в процессорный разъем Socket 7. Фирма Cyrix не имела своих производственных мощностей и производила свои процессоры на заводах фирмы IBM, из-за чего на процессорах Cyrix 6x86 может стоять маркировка как Cyrix так и IBM. В маркировке процессоров 6х86 так же, как и у процессоров К5 использовалась система Pentium-Rating, т.е. процессоры не работали на той частоте, которая на них была написана. Эффективность процессоров Cyrix по целочисленным вычислениям была сравнима с Pentium, в то время как операции с плавающей запятой 6х86 выполнял крайне медленно, проигрывая процессору Pentium в х87 операциях в среднем около 50%. Разгон процессоров был крайне затруднен даже в сравнении с плохо поддающимся разгону К5, это было связано в первую очередь с технологическими проблемами Cyrix, а так же с желанием отмаркировать процессор на как можно большей частоте с целью увеличить прибыль. Такие процессоры стоили еще дешевле чем К5, и, несмотря на это, пользовались спросом гораздо меньшим, чем К5, так как имели практически никуда не годный сопроцессор и грелись как сковородки.

Таблица соответствия реальной частоты процессора 6х86 и написанного на нем PR

 

PR

Частота процессора

Множитель

Частота системной шины

90 МГц

80 МГц

х2.0

40 МГц

120 МГц

100 МГц

х2.0

50 МГц

133 МГц

110 МГц

х2.0

55 МГц

150 МГц

120 МГц

х2.0

60 МГц

166 МГц

133 МГц

х2.0

66 МГц

200 МГц

150 МГц

х2.0

75 МГц

 

 

Процессоры Pentium MMX и совместимые

Процессоры Pentium MMX

Pentium MMX

Третье поколение процессоров Pentium, появившееся в январе 1997 года, объединило в своей конструкции технологические решения Pentium второго поколения и новую разработку, названную фирмой Intel технологией ММX. Процессоры Pentium MMX работают на тактовых частотах 166МГц, 200МГц и 233МГц; тактовая частота системной шины у всех моделей составляет 66 МГц. Они имеют много общего с процессорами Pentium второго поколения, однако новый процессор имеет целый ряд нововведений.

Во-первых, микросхемы Pentium ММХ производятся по усовершенствованной 0,35-микронной технологии и ядро процессора работают на пониженном напряжении в 2,8В, в то время как цепи ввода вывода процессора по прежнему требуют питания 3,3В, таким образом говорят, что процессору необходимо двойное питание, и работать он будет лишь в той материнской плате, которая это двойное питание ему может обеспечить. Сделать системные платы более универсальными в отношении используемого процессорами напряжения помогло новое решение фирмы Intel - процессорное гнездо типа Socket 7 с устанавливаемым модулем VRM (Voltage Regulation Module - модуль, регулирующий напряжение). Модуль можно легко заменить и таким образом перенастроить плату на использование новейших процессоров с любым рабочим напряжением. Уменьшение характерного размера техпроцесса, как мы уже упоминали позволяет процессору работать на более высоких частотах, а кроме того пониженное питание приводит к тому, что процессор меньше потребляет энергии, и, соответственно меньше греется.

Во-вторых, процессор Pentium MMX оборудован вдвое большим объемом L1 (32кб), чем его предшественник. Отсюда и безусловный рост производительности на равных c Pentium частотах. Оказывалось, что Pentium MMX 166МГц примерно равен по производительности обычному Pentium 200МГЦ, как раз из-за увеличившегося в два раза кэша L1.

Ну, и, наконец, наверное самое интересное: в новом процессоре помимо наборов команд х86 и х87 появляется еще один, новый набор команд. Этот набор команд назывался ММХ (Multi Media eXtentions) и именно он дал имя новому процессору. Разработанная фирмой Intel технология ММХ была реакцией на постоянно растущую популярность сетевых и мультимедиа-приложений, предъявляющих повышенные требования к аппаратному обеспечению. Во многих из этих приложений присутствуют циклично повторяющиеся последовательности команд, на выполнение которых уходит основная часть процессорного времени. Разработанная Intel технология SIMD (Single Instruction Multiple Data - один поток команд на несколько потоков данных) решает эту проблему путем выявления таких циклов и выполнения одной операции (команды) над несколькими данными. В архитектуру процессора введены 57 дополнительных команд, специально предназначенных для работы с графическими, видео- и аудиоданными. Но, к сожалению, новый набор команд был предназначен не для математических расчетов, а для операций с целыми числами. Новый набор команд позволял оперировать большими массивами данных, но никак не ускорял математику, поэтому ожидать от него большого пророста производительности в реальных мультимедиа-приложениях, таких как игры, не приходилось. Кроме того, мы с Вами уже обсуждали, что новый набор команд может принести пользу только в специально разработанных для него приложениях, старые программы, которые не содержат вызова ни одной новой команды, разумеется, не почувствуют прироста производительности от того, что процессор умеет исполнять еще один набор команд.

Давайте теперь поговорим о разгоне процессора Pentium MMX. Как только появились первые процессоры Pentium MMX, пользователи обратили внимание на то, что они прекрасно разгоняются. И в этом нет ничего удивительного! Ведь они сделаны по новой технологии 0,35мкм, значит имеют хороший запас по частоте, по сравнению с обычными Pentium, в то же время младший Pentium MMX работает на частоте низшей, нежели старший Pentium. Естественно предположить исходя из этого, что процессоры Pentium MMX отлично разгоняются. Действительно, процессор Pentium MMX 166МГц, по номиналу рассчитанный на частоту системной шины 66МГц и множитель х2,5, обычно без труда работает на частоте системной шины 75МГц (в результате 187МГц) и даже на частоте 83МГц (в результате - 208МГц). Но и это еще не предел! У многих экземпляров Pentium MMX 166МГц множитель был не зафиксирован, и его можно было изменять. В таком случае процессор Pentium MMX 166МГц мог работать в следующих режимах:

 

Частота системной шины

Множитель процессора

Результирующая частота

Вероятность работы

Для процессора с заблокированным множителем

75 МГц

х2.5

187 МГц

Да

Да

83 МГц

х2.5

208 МГц

Да

Да

66 МГц

х3.0

200 МГц

Да

Нет

75 МГц

х3.0

225 МГц

Да

нет

83 МГц

х3.0

250 МГц

обычно Да

Нет

66 МГц

х3.5

233 МГц

Да

Нет

75 МГц

х3.5

262 МГц

обычно Да

Нет

83 МГц

х3.5

292 МГц

Редко

Нет

 

Как видно из таблицы, процессор Pentium MMX 166 МГц отлично разгоняется и обычно разблокированный (в смысле множителя) процессор можно разогнать на 250-262 МГц, если же Ваш процессор имеет фиксированный множитель, то предел разгона - 208 МГц. Практически так же разгонялись и две оставшиеся модификации Pentium MMX: на 200 и 233 МГц. Соответственно, 200 МГц процессор, даже если у него заблокирован множитель, разгонится на 250МГц, а 233-ий - на 250-262МГц. Отдельные же экземпляры Pentium MMX удавалось разогнать на 292 МГц! Процессор Pentium MMX был первым процессором, разгон которого давал столь впечатляющие результаты, и разгон процессоров стал крайне популярен среди пользователей персональных компьютеров.

После выхода Pentium MMX фирма Intel прекратила разработку Socket 7 процессоров, оставив этот рынок своим конкурентам, (продукцию которых нам сейчас предстоит изучить) и занялась разработкой совершенно нового процессора Pentium II, речь о котором впереди.

Процессоры AMD K6

Спустя некоторое время после выхода процессора Pentium MMX, в апреле 1997 года, главный конкурент Intel фирма AMD, лицензировав у Intel набор команд MMX, выпустила свой новый процессор ADM K6. Как и Intel в процессоре Pentium MMX, AMD в К6 реализовала поддержку модного в то время набора команд ММХ. Как и Intel, АMD увеличила в новом процессоре кэш первого уровня (L1), причем до 64кб (у Pentium MMX - 32кб). Как и Pentium MMX, К6 изготавливался по новой, 0.35 мкм технологии. Более того, по сравнению с процессором К5, К6 был значительно переработан, и, в первую очередь AMD переработала сопроцессор, который был самым слабым местом процессора AMD K5. Так же AMD отказалась от непопулярной у конечного пользователя системы именования своих процессоров с помощью Pentium Rating, и стала маркировать свои процессоры их реальной частотой. Впервые AMD устроила массированную рекламу своим процессорам, в которой основным рефреном звучала фраза "Когда мы разрабатывали процессор К6 мы хотели сделать его хорошим, но не думали, что он станет настолько хорошим!" Действительно, К6 заметно шагнул вперед относительно К5, дальше, чем Pentium MMX относительно Pentium, но при этом AMD продолжала продавать свои процессоры на 25% дешевле, чем Intel на аналогичной частоте. Но, тем не менее, не смотря на то, что процессор K6 действительно был неплох и по х86 пожалуй был даже чуть быстрее Pentium MMX на равной частоте, его сопроцессор, даже будучи полностью переработанным, оставался медленнее, чем Интеловский, а производительность сопроцессора - производительность в графике и играх, поэтому, все же, К6 не мог сильно потеснить Pentium MMX, хотя его появление на рынке вполне можно назвать весьма удачным.

Процессор вышел с такими же частотами, как и его прямой конкурент Pentium MMX: К6-166, К6-200, К6-233, где маркировка, как мы уже упоминали - реальная частота процессора. Несмотря на то, что техпроцесс у К6 был 0.35 мкм, его напряжение питания было несколько выше, чем у Pentium MMX и составляло 2.9В на ядро и 3.3В на цепи ввода-вывода (у К6-233 - 3.2В на ядро). Повышенное питание означает во-первых, что у К6 была похуже технология (повышение питания - способ стабилизировать процессор, нередко применяется при разгоне), во-вторых процессор сильнее греется чем Pentium MMX. Но несмотря на перечисленные недостатки (недостаточно быстрый сопроцессор, повышенное питание), процессор AMD K6 стал вполне достойным конкурентом процессору Pentium MMX.

На этом история К6 не заканчивается. Когда Intel фактически покинул рынок Socket 7 систем, разработав новый процессор, AMD еще длительное время на этом рынке оставались. Постепенно появились процессоры К6, изготовленные с применением более совершенного 0.25 мкм техпроцесса с частотами 266 МГц и 300 МГц (Intel в то время уже развивал и продавал новую архитектуру - Pentium II, AMD не выходили вперед в технологическом плане, но, так как мы сперва изучим Socket 7 процессоры, то может создаться впечатление, что AMD удалось опередить Intel. Это не так. Когда это случится, мы обязательно это особо отметим :)).

Но и 266 и 300 МГц версии К6 - не последний этап развития этого процессора. Дело в том, что на базе вполне удачного К6 AMD построила целую серию процессоров, с помощью которых боролась с Intel, которая вовсю уже продавала Pentium II.

Процессоры AMD K6-2

K6-2

В мае 1998 года AMD представила свой новый процессор, снова для платформы Socket 7: ADM K6-2. Этот процессор был практически эквивалентен К6, выпускавшемуся с применением нового, 0.25 мкм техпроцесса, за исключением одной детали. В процессоре К6-2 поддерживался новый набор команд, ориентированный на вычисления с плавающей запятой. Этот набор команд был разработан AMD, назывался 3Dnow! и ничего подобного у Intel на тот момент не было. Intel только планировал через полгода выпустить процессор с новым набором команд, ориентированным на математику, и процессор AMD K6-2 оказался в весьма выигрышном положении. Несмотря на не слишком сильный сопроцессор, оставшийся в наследство от К6, новый процессор на приложениях, специально оптимизированных под 3Dnow!, нередко обыгрывал Intel-овский Pentium II как раз в тех приложениях, где Intel всегда считался недосягаем - в сложнейших трехмерных играх!!! И, хотя, таких оптимизированных приложений было не так много, как хотелось бы AMD и владельцам К6-2, тем не менее потенциал нового набора команд был высок, и процессор от AMD обеспечивал вполне приемлемую производительность, за очень небольшие деньги. Однако, Intel тоже не дремал, и выпустил свой недорогой процессор, который весьма потеснил К6-2, но об этом уже позже. Процессор AMD К6-2 выпускался с тактовыми частотами от 233 МГц до 550 МГц, в некоторых моделях этого процессора была применена системная шина на частоте 100 МГц (снова таки - сначала это использовал Intel на платформе Pentium II, а лишь затем AMD).

Процессоры AMD K6-III

K6-III

В феврале 1999 года AMD выпустила новый процессор для платформы Socket 7: K6-III. Фактически К6-III - тот же К6-2, прямо в кристалл процессора был добавлен кэш ВТОРОГО уровня, объемом 256кб, работающий не на частоте системной шины, а на частоте самого процессора (снова отметим - первой это внедрила Intel, и лишь затем AMD). Соответственно, кэш, располагавшийся на материнской плате, и являвшийся ранее кэшем второго уровня, стал кэшем третьего уровня, а процессор получил очень гибкую систему кэширования, состоящую из трех уровней: L1 - 64кб в процессоре, L2 - 256кб на частоте процессора, L3 - объемом 512-1024Мб - на частоте системной шины, расположенный на материнской плате. Производительность нового процессора была вполне приличной, хотя и не дотягивала до прямого конкурента Pentium III от Intel (о нем - позже). Процессор, естественно, поддерживал 3Dnow!, а самым слабым его местом по прежнему был сопроцессор, но не только он. Слабым местом стала сама шина процессора Pentium (иными словами архитектура Socket 7, уже порядком устаревшая. Intel, как мы чуть позже с Вами узнаем, применял новую архитектуру для систем на базе Pentium II, III).

Процессор К6-III не повторил массового успеха К6-2, так был относительно дорог из-за встроенного в ядро кэша второго уровня, а пользователь не желал тратить много денег на upgrade морально устаревшей системы, каковой в тот момент уже был Socket 7.

Процессоры AMD K6-2+ и K6-III+

K6-2+ :)K6-2+ - один из последних Socket7 процессоров AMD, появился в 2000 году. И первый Socket7 процессор, сделанный с использованием 0.18 мкм техпроцесса. Содержит на чипе 128 Кбайт кэша L2, работающих на частоте процессора. Начальная тактовая частота - от 533 МГц. Естественно, поддержка 3Dnow!

K6-III+ - 0.18 мкм вариант K6-III - с 256 Кбайт кэша L2 на чипе.

AMD ориентирует эти процессоры для использования в мобильных компьютерах, но, так как оба они имеют интерфейс Socket 7, то без проблем могут использоваться в обычных настольных компьютерах

Процессоры Cyrix 6x86MX (6x86M-II)

6x86mx

6x86MX (Позднее переименован в M-II) - несколько переработанный для большей производительности 6x86. Вчетверо увеличился кэш L1 - до 64 Кбайт (единый), увеличилась общая производительность процессора, добавился блок MMX, появилась поддержка двойного питания. Технология производства 0.35 мкм. Использовал частоту системной шины от 60 до 83 МГц. В маркировке использовал PR-рейтинг, на самом деле процессоры работали на меньших частотах. Процессоры 6х86MX делала и компания IBM. Позднее, по маркетинговым соображениям, Cyrix переименовал свои процессоры в M-II, а IBM до конца сотрудничества продавало их под маркой 6x86MX.

В целом процессор M-II не принес славы разработчикам. Процессоры, несмотря на двойное пониженное питание как и прежде сильно грелись и практически не разгонялись. В том время, как Intel и AMD разрабатывали новые наборы команд, технологии и процессоры, Cyrix на все это отвечал одним: снизим цены на M-II. Процессор унаследовал у своего предшественника 6х86 очень слабый сопроцессор, что сужало область применения нового процессора лишь крайне дешевыми компьютерами, где нет места трехмерной графике. Все эти факторы в совокупности привели к тому, к чему должны были привести: фирма Cyrix была вынуждена уйти с рынка процессоров для PC, а так как ничем другим она больше не занималась, то прекратила свое существование. Однако исчезла она не бесследно. Все, что осталось от Cyrix, купила весьма именитая сегодня тайваньская фирма VIA Tech., о роли которой на современном рынке PC мы с Вами еще неоднократно поговорим, когда будем изучать чипсеты.

Особенности архитектуры процессоров шестого поколения

Основными особенностями процессоров шестого поколения динамическое исполнение, улучшенное суперскалярное исполнение, архитектура двойной независимой шины (DIB, Dual Independent Bus).

Благодаря динамическому выполнению процессор может параллельно обрабатывать большое количество команд. Основные особенности динамического выполнения следующие:

* множественное предсказание ветвлений; это средство предназначено для прогнозирования значения счетчика команд при выполнении команд ветвления;

* анализ потока данных, благодаря которому можно получить информацию, необходимую для планирования выполнения команд, независимо от их первоначального порядка в программе;

* упреждающее выполнение, которое "предугадывает" изменения счетчика команд и выполняет команды, результаты которых, вероятно, вскоре понадобятся.

Предсказание ветвления ранее использовалось только в высокопроизводительных универсальных процессорах. Это средство позволяет полностью задействовать возможности конвейера команд процессора, что способствует повышению быстродействия. В специальном устройстве выборки и дешифрации команд используется высокооптимизированный алгоритм предсказания ветвления, благодаря которому удается с большой точностью прогнозировать поток и результаты команд, которые будут выполнены после нескольких команд ветвления, вызовов процедур и возвратов. Работа этого алгоритма подобна выработке множественных стратегий шахматистом, который в процессе игры, предсказывая стратегию противника, как бы перемещается в будущее. Прогнозируя результаты команд заранее, можно избежать задержек при выполнении других команд.

Средство анализа потока данных исследует этот поток через процессор, чтобы предотвратить неправильный порядок выполнения команд. Специальный модуль диспетчеризации и выполнения команд в процессоре контролирует многие команды и может обрабатывать их в таком порядке, при котором множественные суперскалярные модули выполнения команд используются оптимально. Выполнение команд в неподходящем порядке может привести к тому, что модули выполнения команд будут заняты даже в том случае, если из-за промахов кэша и зависимости команды от результатов других команд они были приостановлены.

Упреждающее выполнение - возможность процессоров выполнять команды с опережением фактического значения счетчика команд. Устройство диспетчеризации и выполнения команд процессора использует результаты анализа потока данных для выполнения всех доступных команд из пула команд и сохраняет результаты во временных регистрах. Затем специальный модуль (модуль вытеснения результатов) отыскивает в списке команд завершенные команды, которые больше не зависят от данных, вычисляемых в других командах, или от других команд ветвления. Когда такие завершенные команды найдены, модуль вытеснения или соответствующие средства, предусмотренные в стандартной архитектуре Intel, запоминают их результаты таким образом, как в случае выполнения этих команд в порядке их первоначального расположения. После этого список команд от них освобождается.

Динамическое выполнение, по существу, ликвидирует недостатки и зависимость от линейного (последовательного) выполнения команд. Поддерживая независимое от линейного расположения выполнение команд, это средство может предотвратить задержки в модулях обработки команд, возникающие вследствие ожидания данных из памяти. Несмотря на то что устройство предсказания порядка команд помогает изменить порядок выполнения, результаты записываются так, как если бы команды выполнялись в первоначальном порядке. Поэтому процессор Р6 точно так же, как процессоры Р5 (Pentium) и более ранние, может выполнять имеющееся программное обеспечение, но только значительно быстрее!

Другим новшеством Р6 является архитектура двойной независимой шины. Процессор имеет две шины данных: одну - для системы (системной платы), другую - для кэш-памяти. Благодаря этому существенно повысилось быстродействие кэш-памяти.

Процессоры поколения Р5 имели только одиночную шину процессора на системной плате, и все данные, включая передаваемые в кэш и из него, передавались по ней. Основная проблема состояла в том, что быстродействие кэш-памяти было ограничено тактовой частотой шины системной платы, которая равнялась 66 МГц. В процессорах шестого поколения кэш-память может работать на тактовой частоте 500 МГц или выше, а оперативная память (SDRAM) - с тактовой частотой 66 и 100 МГц, в силу этого возникла необходимость поместить кэш второго уровня ближе к процессору. Было принято решение подсоединить к процессору дополнительную шину, называемую специализированной (или выделенной) шиной кэша. Кэш-память второго уровня была соединен с этой шиной и могла работать на любой тактовой частоте. Сначала это было реализовано в Pentium Pro, где кэш-память второго уровня была установлена в корпусе процессора и работала на его тактовой частоте, а не на частоте системной шины. Однако такое решение оказалось слишком дорогостоящим, и поэтому кэш-память второго уровня была перемещен из корпуса процессора на картридж, в который упаковывается Pentium II. В этом случае шина кэша могла работать на любой тактовой частоте, и вначале она работала на частоте, вдвое меньшей тактовой частоты процессора. При наличии кэша на дополнительной шине, непосредственно соединенной с процессором, его быстродействие соизмеримо с быстродействием процессора. Если бы быстродействие кэша ограничивалось тактовой частотой системной платы (например, 66 или 100 МГц), как в случае использования гнезда типа Socket 7 (процессор Р5), тактовая частота кэш-памяти была бы равна 66 МГц, даже если частота процессора равнялась бы 333 МГц; на более новых платах кэш "увяз" бы на тактовой частоте 100 МГц при частоте процессора 500 МГц и выше. По мере роста тактовой частоты процессора с двойной независимой шиной за счет более высоких множителей тактовой частоты системной платы быстродействие кэша увеличивается то же количество раз, что и тактовая частота процессора. Другими словами, быстродействие кэш-памяти на двойной независимой шине увеличивается пропорционально быстродействию процессора!

Архитектура двойной независимой шины необходима для повышения эффективности процессора, работающего на тактовой частоте 300 МГц и выше. Со старым гнездом типа Socket 7 (для процессоров Р5) таких тактовых частот достичь было невозможно и пришлось бы нести огромные потери в эффективности из-за медленной (привязанной к тактовой частоте системной платы) кэш-памяти второго уровня. Именно поэтому тактовая частота процессоров Pentium класса Р5 не превосходит 266 МГц; процессоры Р6 работают на тактовых частотах 1000 МГц и выше.

Наконец, в архитектуре Р6 были расширены вычислительные возможности суперскаляра процессоров Р5: добавлены новые устройства выполнения команд, а команды разбиты на специальные микрооперации.

Если вы помните, Р5 имел только два модуля выполнения команд, в то время как Р6 имеет не менее шести отдельных специализированных (выделенных) модулей. Такой суперскаляр называется трехконвейерным (множественные модули выполнения команд могут выполнять до трех команд в одном цикле). Помимо всего прочего, в архитектуру Р6 встроена поддержка многопроцессорной системы, усовершенствованы средства обнаружения и исправления ошибок, а также оптимизировано выполнение 32-разрядного программного обеспечения.

Pentium Pro, Pentium II/III и другие процессоры шестого поколения - это не просто Pentium с более высоким быстродействием, они имеют много дополнительных возможностей и более совершенную архитектуру. Давайте теперь непосредственно рассмотрим какие же микропроцессоры Intel выпустил на описанной нами архитектуры.

 

Процессоры шестого поколения.

Часть I

 

Pentium Pro

Pentium Pro

Первым процессором шестого поколения стал процессор Pentium Pro. Процессор был объявлен в сентябре 1995 года, а продажи начались в 1996 году. Процессор устанавливался в гнездо Socket 8 и был несовместим с процессорами семейства Pentium. Внутри корпуса процессора на самом деле содержалось две различных микросхемы: собственно ядро процессора и кэш память второго уровня. Различные модификации процессора Pentium Pro имели кэш-память второго уровня объемом 256кб, 512кб, 1Мб и даже 2Мб (!!!), причем кэш-память второго уровня, находясь в самом процессоре, работала на частоте ядра процессора, а не на частоте системной шины!!! В процессоре была реализована двойная независимая шина (DIB), которая состоит из 64-битной шины кэш-памяти (на частоте процессора) и внешней шины данных процессора. Внешняя шина данных, как и у Pentium - 64-разрядная. Регистры процессора остались 32-разрядными, причем архитектура процессора глубоко оптимизирована на исполнение именно 32-разрядного кода: производительность на 32-битных приложениях значительно выше производительности обычного Pentium на такой же частоте, а производительность в 16-разрядных приложениях - существенно ниже чем у Pentium.

Кэш первого уровня L1 - 16кб (по 8кб для команд и данных), технология изготовления: 0.50, затем 0.35 мкм, частота системной шины 60, 66МГц, частота процессоров: 150-200МГц.

Изготовление процессоров Pentium Pro было крайне дорого из-за того, что в одном корпусе нужно было разместить два различных кристалла, цена даже на младшие модели с 256кб кэша L2 была весьма высокой и, кстати, так практически никогда и не опустилась! Стоимость процессоров с 1Мб, а тем более 2Мб кэша L2 была поистине фантастической! Из-за проблем с производством и, как следствие, высокой цены, эти процессоры никогда не стали процессором настольного PC, так навсегда и оставшись СУГУБО СЕРВЕРНЫМ решением. Этот процессор был для своего времени крайне революционным, и можно сказать, что он слишком сильно опередил свое время.

Pentium II Klamath

Процессор Pentium II в картридже

В мае 1997 года Intel представила новый процессор, который назвала Pentium II. Говоря о процессорах шестого поколения мы будем помимо официального названия процессора, упоминать его кодовое название, так как практический каждый Р6 процессор в рамках одного официального названия (например: Pentium II) имеет ряд принципиально отличающихся модификаций. Итак, кодовое имя первого Pentium II: Klamath. Что из себя представлял новый процессор?

Во многом новый процессор был наследником Pentium Pro. Pentium II Klamath имел двойную независимую шину для связи с кэшем второго уровня и оперативной памятью, имел улучшенную суперскалярную архитектуру, был оптимизирован под 32-разрядные приложения. Но при этом, в отличие от Pentium Pro, он поддерживал набор команд ММХ, было улучшено выполнение 16-разрядных приложений, в которых Pentium Pro был не силен. Но главное изменение коснулось кэша второго уровня. Как мы уже говорили, стоимость изготовления Pentium Pro была крайне высока именно из-за необходимости к корпус процессора упаковать два совершенно разных кристалла: сам процессор и кэш второго уровня. Выпуская процессор Pentium II, Intel продвигали его уже не на рынок очень дорогих серверов, а на рынок рабочих станций и домашних компьютеров. Поэтому Intel отказывается от такого дорогостоящего, как в Pentium Pro способа изготовления процессора с кэшем, и применяет другой подход. Intel решает из соображений экономии, разместить кэш L2 не в одном корпусе с процессором. Процессор Pentium II представляет собой сам кристалл процессора, без кэша L2 внутри, и этот кристалл припаян на небольшого размера платку, на которой помимо самого процессора, установлен и кэш второго уровня. Вся эта конструкция помещается в картридж и в таком виде продается. То есть с одной стороны Intel удаляет L2 из корпуса кристалла, с другой процессор и его кэш второго уровня объединены в общем картридже, процессор в таком виде устанавливается на материнскую плату, а процессор общается с кэшем напрямую, минуя материнскую плату. Однако обмен кэш - процессор происходит уже не на полной частоте процессора, как у Pentium Pro, а на половине частоты процессора. Это сделано для того, чтобы уменьшить стоимость процессора, так как полноскоростной кэш, устанавливаемый в картридж Pentium II, сделал бы процессор очень дорогим.

Итак, первый Pentium II, ядро Klamath. Кэш первого уровня: 32кб (16+16). Объем кэша второго уровня: 512кб. Частота его работы: половина частоты работы процессора (а не частота системной шины, как у Pentium систем). Процессор поставляется в картридже, внутри сам процессор и кэш L2. Наборы команд : помимо х86 и х87, поддерживается набор команд ММХ. Технология производства: 0.35 мкм (как и Pentium MMX). Питание: 2.8В. Частоты работы процессора: 233, 266, 300, 333МГц. Частота системной шины: 66 МГц. Процессорный разъем: Slot1 - новый разъем процессора для установки картриджа с процессором и кэшем второго уровня. Intel переходит на разъем типа Slot только из-за необходимости размещать на процессорной плате и сам процессор и L2 кэш, что делает неприменимым разъем типа Socket, повсеместно применявшийся ранее.

Производительность нового процессора заметно превышает производительность Pentium MMX за счет DIB, улучшенной суперскалярности, высокоскоростного кэша L2, переработанного сопроцессора. Что же касается разгона нового процессора, то с этим дела обстояли достаточно плохо. Во-первых, он был изготовлен по старой, применявшейся еще в Pentium MMX технологии 0.35 мкм, при этом работал на более высоких частотах, т.е. его потенциал разгона по определению ниже, чем у Pentium MMX. Но процессоры Pentium II Klamath плохо разгонялись даже не столько из-за этого, сколько из-за интегрированного в картридж кэша второго уровня. Дело в том, что это кэш Intel не изготавливал сам, а приобретал у соответствующего производителя, а высокоскоростной кэш стоит крайне дорого. Какой же Intel резон ставить, например, в 266 PII (кэш должен работать на 133 МГц) более высокоскоростной и стало быть более дорогой кэш??? Обычно именно кэш L2, устанавливаемый в процессорный картридж, не давал разгоняться Pentium II, ведь, вспомним, частота работы кэша второго уровня у процессора PII прямо связана с частотой работы самого процессора.

Pentium II Deschutes

Так выглядели извлеченные из картриджа PII Deschutes. И PII Klamath тоже :)

Эта новая модификация процессора Pentium II появилась весной 1998 года. Процессоры с ядром Deschutes выпускались с использованием новой технологии производства 0.25 мкм, питались напряжением 2.0В, и, стало быть, имели потенциал для работы на более высоких частотах. Новые процессоры вышли с частотами 350, 400 и 450 МГц. Практически ничего в процессоре не изменилось, просто новый техпроцесс, и, как следствие, новые частоты работы процессора. Но тем не менее, у процессоров на ядре Deschutes было отличие от процессоров на ядре Klamath, и заметить его можно, если посмотреть на частоты, с которыми вышли новые процессоры. Легко видеть, что новые процессоры используют уже не 66 МГц шину, нетрудно догадаться, что частота системной шины нового процессора составляет 100 МГц, т.е. обмен с памятью, к примеру, у новых процессоров происходит именно на частоте 100 МГц (и память эта: PC100 SDRAM). Но ведь в самом процессоре от того, что он работает на более скоростной системной шине ничего не изменилось, просто у процессора уменьшился коэффициент умножения и все! (Например: PII 333: системная шина 66 МГц, значит множитель :х5.0; PII 350: системная шина 100 МГц, множитель х3.5). Действительно, это нововведение крайне мало касается самого процессора, в первую очередь это ВАЖНЕЙШЕЕ для компьютерной индустрии событие связано с тем, что Intel разработал и выпустил на рынок одновременно с новыми процессорами и новый чипсет, который поддерживал частоту системной шины 100 МГц. Мы с Вами уже говорили, что трудно переоценить важность увеличения именно системной шины, так как от производительности системной шины зависит, например, скорость работы оперативной памяти (по крайней мере, в большинстве случаев:)). По этому главным было именно появления на рынке нового чипсета, который обеспечивал 100 МГц системную шину. Ну а кому нужен такой чипсет без процессора, который сможет в новой материнской плате работать? Естественно, что Intel выпустил и новый процессор с такими коэффициентами умножения, чтобы он мог работать на новой частоте системной шины. Собственно, выход процессора Pentium II Deschutes был большим шагом вперед производительности персонального компьютера, хотя определяющим в этом была разработка нового чипсета и конечно же массовое появление недорогого SDRAM, способного работать на частоте 100 МГц.

Процессоры шестого поколения.

Часть II

Процессоры Pentium II выпускались Intel для продвинутых пользователей и стоили относительно дорого. Intel пользовался следующей ценовой политикой: как только процессор PII с некоторой частотой должен начать стоить менее $200, цена на этот процессор не падала, а он просто снимался с производства. Итого, Pentium II никогда не становился настолько дешев, чтобы его могли приобрести бюджетные пользователи. Соответственно, покупатели с ограниченным бюджетом вынуждены были приобретать процессоры AMD для платформы Socket 7, тем более, что мы уже упоминали весьма удачный AMD K6-2. Но Intel решил это положение дел исправить, и, наряду с производительной линейкой процессоров Pentium II, анонсировал линейку дешевых процессоров Celeron, процессоров шестого поколения, устанавливаемых в те же материнские платы, что и Pentium II. Но при этом процессоры Celeron должны иметь урезанные относительного полноценного PII параметры и производительность. Intel объявил линейку Celeron в апреле 1998 года, практически сразу после выхода ядра Deschutes, и первый процессор, пошедший в продажу под именем Celeron, имел кодовое имя ядра Covington.

Celeron Covington

Celeron Covington

15 апреля 1998 года Intel выпускает первый Celeron на ядре Covington. Этот процессор имеет кэш первого уровня 32кб (16+16) как и PII, а кэш второго уровня у него просто отсутствует! То есть на процессорной плате, устанавливаемой в разъем Slot1 есть только процессор, а кэша L2 нет. Кроме того Intel решает, что нечего баловать пользователей дешевых систем такими современными технологиями, как 100 МГц системная шина, и процессор рассчитан на системную шину 66 МГц. Процессор был выпущен с частотами 266 и 300 МГц.

Первый Celeron был подвергнут справедливой критике покупателей и специалистов. Отсутствие кэша второго уровня и 66 МГц системная шина сильно уменьшали достоинства архитектуры шестого поколения. Фактически в обычных офисных приложениях Celeron Covington был медленнее, чем К6-2 на равной тактовой частоте, тем более, что достаточно быстро появились К6-2, рассчитанные на 100 МГц системную шину. Единственным достоинством нового процессора относительно К6-2 был сопроцессор, доставшийся Celeron в наследство от PII, и этот сопроцессор здорово обыгрывал сопроцессор К6-2. Но, безусловно, еще одним достоинством системы на базе Celeron была возможность одной лишь заменой процессора превратить свой компьютер в современный высокопроизводительный PII, чего с системой на базе К6-2 сделать было нельзя: нужно было менять материнскую плату. Процессор стоил недорого, но был крайне несбалансированным: быстрое процессорное ядро ,хороший сопроцессор, но очень медленная подсистема памяти из-за отсутствия кэша второго уровня. Процессор Celeron Covington был бы совсем непопулярен у пользователей, если бы не одно обстоятельство.

Процессор изготавливался по 0.25 мкм технологии и требовал питания 2.0В. Фактически это был Deschutes, на процессорную плату с которым не припаяли кэш второго уровня, и настроили множитель на частоту системной шины 66 МГц. Но!!! Давайте обратим внимание вот на какой факт: 0.25 мкм Deschutes работал на частотах 350-450 МГц, а такой же 0.25 мкм Celeron - на частотах 266-300 МГц. Следовательно, у Covington был прекрасный потенциал для разгона вплоть до тех же 350-450 МГц!!! Более того, учитывая тот факт, что с выходом Deschutes массово появились материнские платы с поддержкой частоты системной шины 100 МГц, оказалось возможным разогнать Covington, установив его на материнскую плату, предназначенную для системной шины частотой 100 МГц. Давайте прикинем: Covington 266 МГц=66 МГц х 4.0. Давайте установим частоту системной шины, равную 100 МГц. Процессор умножит эту частоту на положенные х4.0 ( кстати коэффициент умножения процессоров шестого поколения от Intel практически всегда жестко зафиксирован и менять его нельзя, лишь первые Klamath такое позволяли, во всех следующих процессорах Intel изменить множитель процессора было невозможно ) и в результате мы получим процессор Covington на частоте 400 МГц. Более того, мы таким образом разгоним не только сам процессор ,мы еще и разогнали системную шину и оперативную память, ликвидировав таким образом один из двух основных недостатков процессора Covington!!! За очень небольшие ,по сравнению с PII деньги, мы получили высокоскоростной процессор, на частоте системной шины 100 МГц, полностью эквивалентный PII кроме кэша второго уровня. Напомню, его в Covington просто нет. Кстати, именно из-за этого, в частности, разгон становится возможен, ведь, вспомним, именно кэш L2 мешал разгонять PII.

Возможность такого грандиозного разгона в полтора раза хоть немного спасала Covington в глазах пользователя: можно было получить систему с приличным быстродействием, но без кэша второго уровня. Интересно сравнить производительность такого вот разогнанного Covington 450 МГц (300 МГц разогнанные до 450 МГц) с производительность PII, так как достаточно заманчиво получить за малые деньги 450 МГц процессор с ядром PII. Производительность безкэшевого Covington сильно варьировалась в зависимости от задачи: в 3-х мерных играх, предположим, разогнанный Covington уступал PII на равной частоте в среднем 10-15%, что было прекрасным результатом, если сравнить цену на Celeron 300 МГц (и разогнать его на 450) с ценой PII 450. В других же задачах, например архивация, процессор мог проиграть PII вдвое. В общем, резюмируя, Covington во многом революционным процессором, но важнейший его недостаток - полное отсутствие кэша L2 делало его достаточно ущербным. Intel уяснил ошибки Covington, что ясно хотя бы из очень краткого модельного ряда (всего два процессора :)), и выпустил новый недорогой процессор, дав ему то же официальное имя: Celeron, но простроив его уже на ином ядре.

Celeron Mendocino

Celeron Mendocino

8 августа 1998 года Intel представил новое процессорное ядро Mendocino. В отличие от Covington, новый Celeron был оборудован кэшем второго уровня, размером 128кб. Но это еще не все! Кэш работал не на половинной частоте ядра процессора, а на полной частоте!!! Intel интегрировал этот кэш в корпус процессора, но не отдельным кристаллом, связанным внутри корпуса процессора с самим процессорным ядром (как у дорогого Pentium Pro), а непосредственно в ядро. Т.е. процессор Mendocino - это единый кристалл процессора с интегрированным в него кэшем второго уровня размером 128кб. Благодаря этому стоимость такого процессора вместе с кэшем была лишь немного выше, чем процессора без кэша! Т.е. процессорная платка Mendocino выглядела как и у Covington: процессор и больше ничего, а кэш располагался в самом кристалле процессора. Технология производства та же: 0.25 мкм, питание 2.0В, системная шина 66 МГц; новый процессор кроме кэша L2 практически ничем больше от Covington не отличался. Новый процессор вышел с частотами 300, 333 МГц, затем появились модели 366, 400, 433, 466, 500, 533 МГц, выпуск процессорного ядра Mendocino прекращен лишь в 2000 году.

Два важнейших вопроса: какова производительность нового процессорного ядра с небольшим, но быстрым кэшем, и как процессор разгоняется???

Во первых отметим, что сравнивать производительность Mendocino с Deschutes на равных частотах совершенно не корректно, так они используют различную частоту системной шины и память работает с разной скоростью. Но Mendocino можно сравнить по производительности с PII Klamath, которые тоже использовали 66 МГц системную шину. Что же выгоднее: 512кб кэша на половине частоты процессора как у Klamath, или 128кб полноскоростного кэша как у Mendocino? Оказывается, производительность примерно одинаковая, т.е. кэш Mendocino хоть и меньше чем у PII, но зато быстрее, что делает производительность двух процессоров очень близкой: где-то предпочтительнее PII, где то Celeron. Но давайте не забывать: мы сравнивали Klamath и Mendocino, естественно, Deschutes на равной частоте обойдет Mendocino из-за скорости системной шины. А нельзя ли установить процессор с ядром Mendocino на системную шину 100 МГц? Вообще говоря нет, например: Mendocino 400 МГц это 66 МГц х 6.0. Запустить его как 100 МГц х 4.0 невозможно, так как множитель, как мы уже говорили у Intel процессоров шестого поколения практически всегда зафиксирован. Ну а если попытаться разогнать младшие модели Mendocino? Если Covington 300 (66х4.5) МГц часто можно использовать как 100х4.5=450, то будет ли, к примеру, 300 МГц Mendocino вести себя аналогично, сможет ли он также хорошо разогнаться?

Опыт показывает, что Mendocino разгоняется не хуже Covington!!! Таким образом Вы приобретаете, например, 300 МГц Mendocino, запускаете его на 100 МГц системной шины, и получаете 450 МГц процессор, ничем не уступающий полноценному PII Deschutes! Системная шина - те же 100 МГц, а эффективность кэша меньшего размера, но работающего с большей скоростью примерно такая же, как и PII Deschutes. Это было золотое время для любителей разгона! Купив недорого 300 МГц Celeron Mendocino можно было получить систему, ничуть не менее производительную, чем система на базе самого крутого на тот момент PII !!! Естественно, что Celeron Mendocino получил огромную популярность у пользователей. Но, если его не разгонять, то 66 МГц системная шина будет весьма сильно замедлять систему относительно более дорогого PII.

Любой ли Mendocino так хорошо разгоняется, любой ли процессор можно заставить работать на 100 МГц системной шине? Конечно нет. На то время предел техпроцесса 0.25 мкм лежал в области 450-500 МГц, т.е. максимальная частота, которую Вы могли бы получить составляла эти самые 450-500 МГц. Давайте посчитаем: 300 МГц Celeron на 100 МГц по шине разгоняется на 100х4.5 = 450 МГц. Вероятность, что Ваш 300 МГц Mendocino заработает на 450 МГц - 80%, не меньше. Celeron 333 МГц при 100 МГц системной шины 100х5.0 = 500 МГц - вероятность такого разгона гораздо меньше. А 366 МГц Celeron при 100 МГц по шине должен был бы работать на 550 МГц, что уже крайне маловероятно. Все более старшие процессоры Mendocino уже нельзя заставить работать на 100 МГц шине - они просто не смогу разогнаться до такой большой частоты. Именно поэтому для разгонщика интерес представляют только младшие модели: имея технологический потенциал работать на более высоких частотах, они с заводов уходят "недоразогнанными" и это легко можно "поправить"!!!

Со временем Intel усовершенствовал свой 0.25 мкм техпроцесс и теоретический предел для 0.25 мкм поднялся примерно до 600 МГц. Т.е. более новые 333 МГц Mendocino стали уверенно работать на 500 МГц, появились даже партии 366 МГц Mendocino, прекрасно работающие на 550 МГц. Возможно существовали и 400 МГц Mendocino, работающие на 600 МГц, но подобной информации я не имею.

Подводя итог, можно сказать: процессорное ядро Mendocino оказалось очень удачным, и не зря модельный ряд состоит из 8 моделей, а выпускался процессор около двух лет.

 

Процессоры шестого поколения.

Часть III

 

Pentium !!! Katmai

Мы рассмотрели с Вами недорогие процессоры Intel аж до второй половины 2000 года, а теперь вернемся к изучению сегмента рынка мощных процессоров для рабочих станций, процессоров, пришедших на смену Pentium II.

Весной 1999 года Intel выпустил новый процессор, который назвал незамысловато: Pentium !!! Давайте разберемся, что представлял собой этот процессор, и что позволило Intel дать этому процессору новое имя P!!!

P!!! Katmai

Кодовое название ядра нового процессора: Katmai. Процессор, как и все семейство P6, имел 32кб кэша первого уровня (16+16), имел кэш L2, объемом 512кб, расположенный на процессорной платке и работающий на половине частоты ядра процессора, был рассчитан на системную шину 100 МГц и вышел с частотами 450 МГц и 500 МГц. Что же отличало новый процессор от Deschutes? Практически только одно: новый процессор поддерживал новый набор команд, ориентированный на вычисления с плавающей запятой. Этот набор до выхода процессора принято было называть KNI (Katmai New Instruction), а официальное название нового набора команд: SSE (Streaming SIMD Extensions). Набор команд достаточно неплохо справлялся с возложенной на него задачей, но мы помним, что новый набор команд полезен только для специально оптимизированных приложений. Так чем же новый процессор лучше, чем Deschutes, помимо новых частот? Ничем кроме набора команд SSE. Впрочем Intel, понимая, что это малый стимул для пользователя, чтобы он переплачивал за новый процессор, установила цену на 450 МГц P!!! Katmai равную цене на PII Deschutes, таким образом просто заменяя модельный ряд PII на P!!!. Разумеется, Intel было бы разумнее выпустить новое процессорное ядро, назвав его Pentium !!!, чем давать новое имя по сути старому ядру с новым набором команд. Но тут следует заметить, что новое ядро у Intel еще не было готово, оно появилось позднее, а AMD выпустила К6-2, который поддерживал набор команд 3Dnow!, и Intel нужно было чем-то ответить. Затем, в сентябре 1999 года, в связи с задержкой выхода нового процессорного ядра, Intel даже пришлось выпустить 533 МГц и 600 МГц Pentium !!! на ядре Katmai, хотя изначально планировалось, что такие процессоры выйдет уже на новом ядре. К сказанному о Pentium !!! Katmai осталось добавить, что процессоры 533 МГц и 600 МГц использовали новую частоту системной шины 133 МГц (о соответствующих чипсетах мы в свое время еще поговорим). Разумеется, процессоры Katmai практически не разгонялись. Во первых, будучи сделанными с использованием 0.25 мкм техпроцесса, они уже работали на предельной частоте (мы говорил - максимум лежит около 600 МГц), а во вторых Katmai, как и Deschutes, имел кэш второго уровня на процессорной платке, и этот кэш практически не разгонялся.

Pentium !!! Coppermine

P!!! Coppermine

Однако неурядицы с выходом нового процессорного ядра, и, примерно год назад Intel анонсировал процессор с уже знакомым названием Pentium !!!, построенный на совершенно новом ядре: Coppermine. Новый процессор снова имел 32кб кэша первого уровня (16+16), а кэш второго уровня изменился. Его стало ... вдвое меньше - 256кб! Но, при этом, кэш L2 нового процессора располагался не на процессорной платке, а непосредственно в кристалле процессора, как и у Mendocino. За счет этого скорость работы кэша второго уровня равнялась скорости работы процессорного ядра, кроме того задержки на доступ кэшу уменьшились. За счет нового кэша ядро Coppermine было несколько быстрее ядра Katmai, но, главное - процессор Coppermine был дешевле в производстве, так как ядром процессор и ограничен, в то время как Katmai еще нужен был дорогостоящий кэш L2. Но это еще не все. Как мы помним Katmai практически исчерпал потенциал 0.25 мкм техпроцесса и дальнейший рост частоты требовал применения более тонкой технологии. Intel выпустила новый процессор с применением 0.18 мкм техпроцесса (питание от 1.65В). Стало быть, процессоры Coppermine могли работать на более высоких частотах: ан сегодняшний день предел технологии Coppermine примерно 1,1 ГГц, но это конечно не значит, что любой экземпляр процессора Coppermine разгонится до этой частоты. Естественно, Coppermine поддерживал набор команд SSE. Новые процессоры предназначались как для системной шины 100 МГц, так и 133 МГц. Стартовая частота 500 МГц, на сегодня доступна модель 1,1 ГГц.

Celeron Coppermine-128

Celeron Coppermine-128

На базе нового процессорного ядра Coppermine, Intel решила выпустить и процессор класса Celeron, ядро нового процессора называется Coppermine-128. Несмотря на то, что Intel говорил о том, что Celeron станут выпускать для системной шины 100 МГц, новый Celeron снова был рассчитан на применение старой, 66 МГц системной шины, что крайне сильно ограничивало Celeron Coppermine-128. Но тем не менее, новый Celeron выпускается с применением 0.18 мкм техпроцесса, стало быть неплохо разгоняется, в особенности младшие модели, поддерживает новый набор команд SSE и показывает вполне нормальную производительность в штатном режиме, хотя, конечно, системная шина 66 МГц не дает процессору реализовать скоростные качества ядра. Тактовые частоты в модельном ряде: 533, 566, 600, 663, 667, 700, 733, 766 МГц Буквально несколько недель назад Intel НАКОНЕЦ выпустил первый процессор Celeron Coppermine-128 рассчитанный на системную шину 100 МГц - Celeron 800 МГц. Однако пока цена на этот процессор не позволяет считать его дешевым, и практически по стоимости он ближе к Pentium !!! На сегодняшний день процессоры с ядрами Coppermine и Coppermine-128 - основная продукция, предлагаемая Intel на рынке как мощных рабочих станций, так и недорогих систем.

Процессоры шестого поколения.

Часть IV

Мы с Вами до сих пор упоминали лишь процессоры шестого поколения, произведенные Intel. А как же конкуренты? Производит ли AMD процессоры шестого поколения или до сих пор делает лишь Socket 7 совместимые процессоры?

Как неоднократно подчеркивалось конкуренты Intel всегда стремились сделать свои процессоры электрически совместимыми с процессорами Intel для того, не разрабатывать для них чипсетов и материнских плат и, самое главное, чтобы пользователь мог приобрести стандартную платформу, в которую мог устанавливать как процессор производства Intel, так и процессор производства AMD. Если бы процессоры AMD которые мы уже рассмотрели были бы не совместимы с продукцией Intel электрически, много ли пользователей согласились бы приобретать материнскую плату, в которую можно установить лишь процессоры "второго сорта", каковыми все же не смотря ни на что были процессоры AMD?

Процессор AMD Athlon (Argon)

Athlon Argon в картридже

Тем более интересным и неожиданным было решение AMD не производить процессоры шестого поколения, совместимые с Pentium II/!!! AMD объявила о разработке совершенно нового, не совместимого аппаратно (но, естественно, совместимого программно) с Pentium II/!!! процессора с кодовым именем К7, который должен был принести AMD лавры уже не изготовителя дешевых и менее производительных клонов продукции Intel, а производителя процессоров, напрямую конкурирующих с Intel. Разумеется, если бы процессор оказался бы слабым по производительности, это бы означало полный провал для AMD. Ведь если делая дешевые процессоры, которые можно вставить в любую материнскую плату AMD ни чем особо не рискует, то изготавливая процессоры, совершенное не совместимые аппаратно с интеловскими, AMD рискует остаться вообще без покупателей. Поэтому можно смело сказать, что ставя на новый процессор, AMD сыграла ва-банк.

В августе 1999 года AMD выпускает так долго ожидаемый процессор и называет его Athlon (кодовое имя ядра Argon).

Если подойти к архитектуре AMD Athlon поверхностно, то основные его параметры можно обрисовать следующим образом:

* Чип, производимый по технологии 0.25 мкм (затем 0.18 мкм)

* Ядро нового поколения с кодовым именем Argon, содержащее 22 млн. транзисторов

* Работает в специальных материнских платах с процессорным разъемом Slot A

* Использует высокопроизводительную системную шину Alpha EV6, лицензированную у DEC

* Кеш первого уровня 128 Кбайт - по 64 Кбайта на команды и на данные

* Кеш второго уровня 512 Кбайт. Расположен вне процессорного ядра, но в процессорном картридже как у PII. Работает на половинной частоте ядра.

* Напряжение питания - 1.6В

* Набор SIMD-инструкций 3DNow!, расширенный дополнительными командами. Всего 45 команд

* Выпускаются версии с частотами 500, 550, 600, 650 ... 1000 МГц.

Athlon Argon без картриджа

Однако таким простым процессор AMD Athlon кажется только лишь на первый взгляд. На самом же деле за этими несколькими строками скрываются многочисленные архитектурные инновации, например, как нетрудно заметить, Athlon превосходит Intel по размеру кэша первого уровня, который у Intel Pentium III всего 32 кбайта.

Перейдем теперь к более подробному рассмотрению архитектуры AMD Athlon.

Прежде чем углубляться в сам процессор, посмотрим, чем же отличается системная шина EV6, примененная AMD, от привычной интеловской GTL+ (так официально называется системна шина процессоров Intel шестого поколения). Внешнее сходство бывает обманчиво. Хотя процессорный разъем Slot A на системных платах для процессора AMD Athlon выглядит также как и Slot 1, перевернутый на 180 градусов, шинные протоколы и назначения контактов у Intel Pentium III и AMD Athlon совершенно различны. Внешняя похожесть вызвана тем, что AMD просто хотела облегчить жизнь производителям системных плат, которым не придется покупать особенные разъемы для установки на Slot A системные платы. Только и всего.

На самом же деле, хоть EV6 и работает на частоте 100 МГц, передача данных по ней, в отличие от GTL+ ведется на обоих фронтах сигнала, т.е. шина работает в режиме DDR, потому фактическая частота передачи ДАННЫХ составляет 200 МГц. Если учесть тот факт, что ширина шины EV6 - 72 бита, 8 из которых используется под ECC (контрольную сумму), то получаем скорость передачи данных 64бита х 200 МГц = 1,6 Гбайт/с. Напомню, что пропускная способность GTL+, работающей на 100 МГц в два раза меньше - 800 Мбайт/с. Повышение частоты GTL+ до 133 МГц дает увеличение пропускной способности при этом только до 1,06 Гбайт/с. Казалось бы, как в случае с GTL+, так и с EV6 получаются внушительные значения пропускной способности. Однако, только современная PC133 память может отобрать от нее до 1066 Мбайт/с, а AGP, работающий в режиме 2x - до 528 Мбайт/с. Не говоря уже о PCI и всякой другой мелочевке. Получается, что GTL+ уже сейчас может не справляться с передаваемыми объемами данных. У EV6 же в этом случае все в порядке, потому эта шина более перспективна.

Прежде чем переходить непосредственно к функционированию AMD Athlon, хочется затронуть тему L1 и L2 кэшей.

Что касается кэша L1 в AMD Athlon, то его размер 128 Кбайт превосходит размер L1 кэша в Intel Pentium III аж в 4 раза, не только подкрепляя высокую производительность Athlon, но и обеспечивая его эффективную работу на высоких частотах. В частности, одна из проблем используемой Intel архитектуры Katmai, которая, похоже, уже не позволяет наращивать быстродействие простым увеличением тактовой частоты, как раз заключается в малом объеме L1 кэша, который начинает захлебываться при частотах, приближающихся к гигагерцу. AMD Athlon лишен этого недостатка.

Что же касается кэша L2, то и тут AMD оказалось на высоте. Во-первых, Athlon поддерживает размеры L2 512 Кбайт до 16 Мбайт (хотя выпускался только с 512 кб). Pentium III, как известно, поддерживает только 512-килобайтный кэш второго уровня. К тому же, Athlon может использовать различные делители для скорости L2-кеша: 1:1, 1:2, 2:3, 1:3 и 2:5. Такое разнообразие делителей позволяет AMD не зависеть от поставщиков кэша определенной скорости, особенно при выпуске более быстрых моделей.

Но и без ложки дегтя здесь не обошлось. Только лишь до 700 МГц процессора скорость кэша L2 была равна половине частоты процессора, у 750-го Athlon скорость кэша составляла уже 2/5 от частоты процессора и затем и вовсе 1/3.

С целочисленными операциями у процессоров от AMD всегда все было в порядке. Со времен AMD K6 процессоры от Intel проигрывали именно в скорости целочисленных вычислений. Тем не менее, в Athlon AMD напрочь отказалась от старого наследия. Благодаря наличию трех конвейерных блоков исполнения целочисленных команд (Integer Execution Unit) AMD Athlon может выполнять три целочисленные инструкции одновременно. Что же касается Pentium III, то его возможности ограничиваются одновременным выполнением только двух команд.

Отдельно хочется затронуть вопрос конвейеров. Оптимальной глубиной конвейера для процессоров с современными скоростями считается 9 стадий. Увеличение этого числа приводит к ускорению процесса обработки команд, так как скорость работы конвейера определяется работой самой медленной его стадии. Однако, в случае слишком большого конвейера при ошибках в предсказании переходов оказывается что большая часть работы по исполнению команд, уже вошедших на конвейер выполнена напрасно. Его приходится очищать и начинать процесс заново.

Потому в AMD Athlon глубина целочисленных конвейеров составляет 10 стадий, что близко к оптимуму. К сожалению, поклонники продукции Intel снова не услышат ничего утешительного, так как конвейер в Pentium III состоит из 12-17 стадий в зависимости от типа исполняемой инструкции.

С замиранием сердца обращаем наш взгляд на блок FPU, встроенный в Athlon. Как мы все хорошо помним, для предыдущих процессоров AMD операции с плавающей точкой были настоящей ахиллесовой пятой. Главной проблемой было то, что блок FPU в K6, K6-2 и K6-III был неконвейеризированый. Это приводило к тому, что хотя многие операции с плавающей точкой в FPU от AMD выполнялись за меньшее число тактов, чем на интеловских процессорах, общая производительность была низкой, так как следующая вещественная операция не могла начать выполняться до завершения предыдущей. А что-то менять в своем FPU AMD в то время не хотела, призывая разработчиков к отказу от его использования в пользу 3DNow!.

Но, похоже, прошлый опыт научил AMD. В Athlon арифметический сопроцессор имеет конвейер глубиной 15 стадий против 25 у Pentium III. Не следует забывать, что, как уже говорилось выше, более длинный конвейер не всегда обеспечивает лучшую производительность.

FPU в Athlon объединяет в себе три блока: один для выполнения простых операций типа сложения, второй - для сложных операций типа умножения и третий - для операций с данными. Благодаря такому разделению работы Athlon может выполнять одновременно по две вещественночисленные инструкциии. А ведь такого не умеет даже Intel Pentium III - он выполняет инструкции только последовательно! Так что, как это ни странно, FPU интеловских процессоров оказался не таким уж замечательным, как это принято было считать ранее.

На первый взгляд с выполнением MMX-операций у Athlon по сравнению с K6-III изменений не произошло. Однако это не совсем так. Хотя и MMX-инструкции используются в крайне небольшом числе приложений, AMD добавила в этот набор еще несколько инструкций, которые также появились в MMX-блоке процессора Pentium III. В их число вошли нахождение среднего, максимума и минимума и изощренные пересылки данных.

Блока 3DNow! в AMD Athlon коснулись сильные изменения. Хотя его архитектура и осталась неизменной - два конвейера обрабатывают инструкции, работающие с 64-битными регистрами, в которых лежат пары вещественных чисел одинарной точности, в сам набор команд было добавлено 24 новинки. Новые операции должны не только позволить увеличить скорость обработки данных, но и позволить задействовать технологию 3DNow! в таких областях, как распознавание звука и видео. Кроме этого, по аналогии с SSE были добавлены и инструкции для работы с данными, находящимися в кэше. Поддержка обновленного набора 3DNow! уже встроена в Windows 98 SE и в DirectX 6.2.

Таким образом, в набор 3DNow! входит теперь 45 команд, против 71 инструкции в SSE от Intel. Причем, судя по всему, использование новых команд должно дать еще больший эффект от 3DNow!

Процессор AMD Athlon оказался весьма удачным процессором и смог составить весьма достойную конкуренцию P!!! Katmai. Однако, с выходом P!!! Coppermine над Athlon стали сгущаться тучи: процессоры от Intel с каждой новой моделью получали все более и более быстродействующий кэш L2, в то время как кэш второго уровня процессора Athlon топтался на месте, и новые модели все меньше и меньше выигрывали у предыдущих. Решение очевидно: пойти по пути Intel: встроить L2 кэш в ядро процессора, решив тем самым проблему высокоскоростного кэша. Так инженеры AMD и поступили.

Процессор AMD Athlon (Thunderbird)

Athlon ThunderbirdAthlon Thunderbird

AMD разработала новое ядро, которое назвала Thunderbird, в которое встроено помимо тех же 128кб кэша первого уровня, что и в предыдущую модель процессора, еще и 256кб кэша второго уровня, работающего на полной тактовой частоте процессора. Практически новый процессор, который в продажу пошел под уже проверенным именем Athlon, очень близок к Athlon Argon, за исключением кэша второго уровня. И, соответственно, новый Athlon является прямым конкурентом современного P!!! Coppermine. Но при том, что производительность новых процессоров AMD не уступает производительности процессоров от Intel, цены но Athlon существенно ниже, чем на P!!! И сегодня покупка производительной рабочей станции на базе процессора от AMD - обычное явление: это столь же производительно, но при этом дешевле, а на сэкономленные деньги можно купить больше оперативной памяти :).

Процессор AMD Duron (Spitfire)

DuronDuron

Но выпуском нового Athlon AMD не ограничилась. Изначально было объявлено, что на новом ядре выйдет и удешевленный процессор с кодовым названием Spitfire, которое затем преобразовалось в официальное имя Duron. Новый дешевый процессор отличается от Athlon только лишь уменьшенным кэшем второго уровня: он составляет не 256 кб, а 64 кб. Получается, что у Duron кэша вдвое меньше, чем у Celeron? Нет! Дело в том, что у процессоров Intel так называемый включительный кэш, т.е. содержимое кэша первого уровня всегда присутствует и в кэше второго уровня. Таким образом у P!!! Coppermine и Celeron суммарный объем кэша равен количеству кэша второго уровня, а у процессоров AMD кэш эксклюзивный, т.е. содержимое L1 не дублируется в L2, следовательно, всего кэша у Duron даже больше чем у Celeron. Если производительность P!!! и Athlon примерно равны, то Duron с треском выигрывает у Celeron по производительности. За счет чего? Ведь исходные процессоры примерно близки по производительности, почему же их упрощенные модификации различаются? Дело в том, что у Duron всего лишь уменьшен объем кэш-памяти второго уровня, в то время как у Celeron по прежнему системная шина 66 МГц! а у Duron, как и у оригинального Athlon Argon и Athlon Thunderbird системная шина 100 МГц DDR и оперативная память у Duron работает на частоте 133 МГц, а не 66 МГц, как у Celeron. Мало того, процессор Duron стоит гораздо дешевле чем Celeron на равной тактовой частоте. Таким образом, процессор Duron сегодня безусловно предпочтительнее в недорогих системах, нежели Celeron! Выходит, что сегодня AMD теснит Intel на всех фронтах: в сегменте высокопроизводительных систем производительности решений от Intel и AMD примерно равны, в то время как цены на Athlon значительно ниже, в сегменте дешевых систем преимущество AMD еще ярче: при выигрыше в цене, решение от AMD еще и здорово выигрывает в скорости. Прошли времена, когда лидер на рынке процессоров был один, сегодня конкурентная борьба как никогда остра, ну а пользователь от этого только выигрывает: процессоры становятся более быстрыми и стремительно дешевеют.

Блок перемычек L1 изначально замкнут - множитель разблокированБлок перемычек L1 разомкнут - множитель заблокированБлок перемычек L1 замкнут простым карандашом

Особо хочется остановиться на разгоне новых процессоров от AMD. Как оказалось, что и Athlon и Duron прекрасно разгоняются! Но! Частоту системной шины EV6 менять уже не так просто. Дело в том, что она позволяет лишь очень незначительный разгон, 7-10МГц. Множитель у этих процессоров не меняется, сколько бы вы пытались настроить материнскую плату на то, чтобы она скомандовала процессору поменять множитель. Т.е. получается, что разогнать Duron и Athlon нельзя! Почти так. Дело в том, что коэффициент умножения в этих процессорах все же можно менять. Но для этого необходимо произвести процессору небольшую модификацию. Оказывается, что у процессора все же предусмотрена возможность управления множителем. AMD естественно выгоднее делать все процессоры на одной технологической линии, нежели держать для изготовления процессора каждой частоты свой собственный конвейер. Возникает вопрос - как же отделяют процессоры, работающие на разных частотах? Вот Intel на последней стадии перед упаковкой процессора в корпус делает все необходимые изменения, чтобы процессор использовал один фиксированный коэффициент умножения. А AMD пошла другим путем. Он настраивают процессор на использование некоторого коэффициента умножения уже на той стадии, когда процессор упакован в корпус. На верхней части корпуса Athlon и Duron есть ряды пар контактных площадок. Они разделены на блоки L1-L7. Изначально все пары контактных площадок замкнуты. Когда процессор уже готов, необходимые пары площадок перерезаются с помощью лазерного луча, таким образом задается множитель и питание процессора. А что если пользователь приведет пары перемычек в состояние, эквивалентное другому процессору, например: берем Duron 600 МГц, и перерезая и соединяя необходимые перемычки, приводим их к состоянию как, допустим, у 800 МГц. Фактически таким образом мы изменяем множитель процессора с х6.0 на х8.0!!! Но такой метод весьма опасен, так как разрезая перемычки на корпусе процессора мы не только лишаем его товарного вида и теряем гарантию, но и легко можем его повредить. Но, оказывается есть еще один способ! Набор перемычек L1, оказывается, отвечает за возможность выставления множителя извне, с материнской платы! Если ваша материнская плата может давать процессору команду менять множитель, то само по себе это Вам, как уже говорилось, ничего не дает. А если Вам удастся замкнуть все 4 перемычки в блоке L1, то после этого Ваша материнская плата может менять процессору множитель! А сделать это можно обычным простым карандашом: как известно графит - отличный проводник. Таким образом удается разблокировать множитель процессору, и, независимо от того, на сколько удается разогнать процессор подъемом частоты системной шины, пользователь всегда может, выбрав подходящее умножение, заставив процессор работать на повышенной частоте! Таким образом, если у нас есть подходящая материнская плата (т.е. умеющая менять множитель процессора) то мы НЕЗАВИСИМО ни от каких других компонентов системы можем разогнать процессор по максимуму его возможностей. Давно на рынке не было процессоров, которые гнались бы коэффициентом умножения, а процессоры Duron гонятся очень хорошо. Характерная частота, до которой можно разогнать 600-650 МГц процессор - 850-950 МГц, а удачные экземпляры работают на частоте 1 ГГц. И это при цене на Duron 650 МГц равной сегодня примерно 60$!!! Все вышесказанное касается как новых Athlon так и Duron и, естественно добавляет прелести этим процессорам в глазах тех пользователей, которые не прочь бесплатно добавить своей системе 30-50%% производительности.

В целом можно сказать, что у AMD получилось! Новые процессоры, базирующиеся на ядре K7 оказались не только конкурентоспособны продукции Intel. Пожалуй, процессоры AMD на сегодня по совокупности обстоятельств (цена, производительность, возможности разгона) предпочтительнее в домашнем или офисном компьютере, чем процессоры Intel.

Процессорные разъемы

Давайте уделим немного внимания разъемам, в которые вставляются процессоры.

Socket 1,2,3. Для 486-х процессоров

486-ые процессоры устанавливались в гнезда Socket 1, Socket 2, Socket 3. Гнезда Socket 2 и 3 выглядят практически одинаково, различие между ними состоит в питании процессора и, как следствие, в поддерживаемых процессорах. Между этими гнездами есть небольшие различия, однако, практическая ценность этого сегодня так мала, что останавливаться подробнее мы на этом не будем.

Socket 4. Для Pentium первой модификации

Самые первые модели Pentium (60 и 66 МГц) устанавливались в разъем Socket 4. Так как эти процессоры не получили никого значительного распространения, то увидеть живьем платы с таким Socket Вам вряд ли удастся. Напомню, что платы для Pentium первых модификаций не подходят для последующих процессоров Pentium.

Socket 5,7. Для Pentium совместимых процессоров

Процессоры Pentium и совместимые (в т.ч. Pentium MMX, K5, K6, K6-2, K6-III и др.), как мы уже упоминали, вставляются в разъем, который называется Socket 7. Первые процессоры этого класса (младшие модели Pentium и К5) устанавливались в разъем, который назывался Socket 5. Его отличие от пришедшего затем ему на смену гнезда Socket 7 в невозможности произвольно изменять напряжение питания процессора. В остальном Socket 5 и Socket 7 совместимы.

Socket 8. Гнездо для процесcора Pentium Pro

Процессоры Pentium Pro - первые процессоры фирмы Intel шестого поколения устанавливались в специально разработанное для них гнездо: Socket 8. Вообще говоря никакие другие процессоры в это гнездо установлены быть не могут, однако спустя много лет после того как Pentium Pro ушел со сцены, появились специальные переходники, которые позволяли в гнездо Socket 8 устанавливать процессоры Celeron. Правда стоили они столько, что проще было купить новую плату для процессора Celeron и не мучаться.

Slot 1. Гнездо для процессоров Pentium II, !!!, Celeron

Slot 1. Гнездо для процессоров Pentium II, !!!, CeleronSocket 370

Intel разработал разъем Slot 1 для того, чтобы установить на рядом с процесором, на специальной процессорной платке кэш второго уровня, чтобы ускорить взаимодействие процессора и кэша L2. А процессорная платка, фотографии которой вы видели в материале предыдущих глав как раз и устанавливается в разъем Slot 1. Однако, начиная с самого первого процессора Celeron необходимость в такой процессорной платке отпадает - кэша L2 на удешевленных процессорах нет! Но, естественно, процессоры Celeron продолжают выпускать в разъем Slot1, так как других разъемов и материнских плат просто нет. Но выпускать процессор в разъем типа Slot дороже, чем в разъем типа Socket, поэтому со временем Intel разрабатывает новый разъем, специально ориентированный на процессоры Celeron, и такой разъем называется Socket370. Однако со временем вместо процессоров с внешним относительно кристалла кэшем L2 появляются процессоры, базирующиеся на ядре Coppermine. Таким процессорам совершенно не нужен разъем типа Slot, и, со временем, Intel снова переходит для своих процессоров на использование разъема типа Socket, а именно - Socket 370.

Slot A. Гнездо для процессоров AMD AthlonSocket A

Аналогично, процессоры AMD Athlon устанавливались в разъем типа Slot и этот разъем назывался SlotA. Весьма интересно, что МЕХАНИЧЕСКИ SlotA эквивалентен Slot1, но, естественно, не совместим с ним электрически. С выходом процессоров, кэш которых расположен в ядре процессора, AMD тоже уходит от более дорогого способа устанавливать процессоры в разъемы типа Slot, и переходит к более дешевому решению, предлагая разъем SosketA.

 

Главная / Содержание / Процессоры. Часть 2.

 

Используются технологии uCoz