Развитие микропроцессоров в обозримом будущем: направления и технологии

Вид работы:

Дипломная (ВКР)
Предмет:

Информационное обеспечение, программирование
Язык:

Русский
,
Формат файла:
MS Word

1,96 Мб
Опубликовано:

2015-07-20

Все дипломные работы по информационному обеспечению

Скачать дипломную работу Читать текст online Заказать дипломную
*Помощь в написании! Посмотреть все дипломные работы

Вы можете узнать стоимость помощи в написании студенческой работы.

Развитие микропроцессоров в обозримом будущем: направления и технологии

Введение

Актуальность. На сегодняшний день микропроцессоры составляют основу компьютерной техники, и переход к новым поколениям вычислительных средств приобретает особую актуальность. Это связано с потребностями решения сложных задач больших размерностей. Непрерывный рост характеристик требует разработки и создания принципиально новых вычислительных средств для поддержки их эффективного функционирования.

Быстродействие компьютера зависит, прежде всего, от того, какой центральный процессор в нем установлен. Какие бы задачи пользователь не ставил перед системой, процессор играет в них основную роль, и если он достаточно производителен, то работа с компьютером будет продуктивной и комфортной. Если же скорости процессора не хватает, то есть риск, что рабочий процесс превратится в нервотрепку как для рядового пользователя, так и для сотрудника научно-исследовательского центра.

Тактовая частота процессора является одной из основных характеристик, но далеко не единственной. К примеру, такая характеристика, как технологический процесс производства (проектная норма процессора), определяет структурный размер тех элементов, из которых состоит процессор. В частности, от него напрямую зависят размеры транзисторов и их характеристики (длина затвора, время переключения, энергопотребление и т.д.)

Величина транзисторов в персональных компьютерах, выпущенных IBM в 1983 году, составляла 10 мкм (микрометров). Сегодня их характерный размер - 0,25 мкм. За это же время тактовая частота процессоров возросла более чем в 50 раз, а плотность транзисторов на кристалле увеличилась в 20 раз.

Полупроводниковая индустрия обладает уникальной способностью поддерживать очень высокие темпы технологического развития на протяжении долгого периода времени. Это позволяет производителям из года в год снижать цены на свои продукты, одновременно увеличивая их быстродействие и расширяя функциональность. Но бесконечное увеличение скорости вряд ли возможно, ведь существуют чисто физические ограничения. Тем не менее, сотни исследователей, представляющих самые различные организации, упорно трудятся, пытаясь преодолеть технологические барьеры.

Цель выпускной квалификационной работы:

перечислить и рассмотреть современные достижения в развитии микропроцессоров;

проанализировать направления развития микропроцессоров;

выделить новые технологии производства микропроцессоров;

дать обзор прогнозов развития микропроцессорной техники.

Объект исследования - развитие микропроцессоров в обозримом будущем: направления и технологии.

Предмет исследования - технологии производства микропроцессоров в настоящем и ближайшем будущем, пути развития современных процессоров, развитие концепции двухъядерных и многоядерных процессоров и ее реализации, совершенствование архитектур микропроцессоров, анализ перспектив развития процессоров ведущими фирмами производителями и их планы.

Исследование основывается на общенаучных методах познания: обобщение и систематизация теоретических данных; сравнение, анализ, синтез, изучение и обработка данных эмпирики; построение научных гипотез; моделирование выводов исследования и их классификация.Возможность достижения высоких частот работы современных микропроцессоров напрямую зависит от количества транзисторов. Однако, ее проектирование усложняется факторами, отражающими современные тенденции в полупроводниковой индустрии:

• Переход к новым технологиям. Уменьшение технологических размеров приводит к росту неточности контроля над размерами структур на кристалле в процессе изготовления, негативно влияющих на производительность.

• Увеличение степени интеграции приводит к росту флуктуаций напряжения питания и наводок, увеличению нагрузки на процессор и удлинению пути распространения сигнала.

В конечном итоге эти факторы приводят к снижению производительности микропроцессора и к увеличению накладных расходов на организацию архитектуры. Требуется более сложная методология разработки, которая позволит увеличить мощность и быстродействие.

В практической части выпускной квалификационной работы показаны результаты комплексного анализа процессоров фирм AMD и Intel.

Глава 1. Развитие и производство микропроцессоров

.1 Определение и функции микропроцессора

Микропроцессор - центральное устройство (или комплекс устройств) ЭВМ (или вычислительной системы), которое выполняет арифметические и логические операции, заданные программой преобразования информации, управляет вычислительным процессом и координирует работу устройств системы (запоминающих, сортировальных, ввода - вывода, подготовки данных и др.). В вычислительной системе может быть несколько параллельно работающих процессоров; такие системы называют многопроцессорными. Наличие нескольких процессоров ускоряет выполнение одной большой или нескольких (в том числе взаимосвязанных) программ. Основными характеристиками микропроцессора являются: быстродействие и разрядность.

Быстродействие - это число выполняемых операций в секунду. Разрядность характеризует объём информации, который микропроцессор обрабатывает за одну операцию: 8-разрядный процессор за одну операцию обрабатывает 8 бит информации, 32-разрядный - 32 бита и 64 разрядные - 64 бита. Скорость работы микропроцессора во многом определяет быстродействие компьютера. Микропроцессор выполняет всю обработку данных, поступающих в компьютер и хранящихся в его памяти, под управлением программы, также хранящейся в памяти. Персональные компьютеры оснащают центральными процессорами различных мощностей. Микропроцессор, самостоятельное или входящее в состав микро-ЭВМ устройство обработки информации, выполненное в виде одной или нескольких больших интегральных схем. Микропроцессор и устройства вычислительной техники и автоматики, выполненные на их основе. Микропроцессорная техника применяется в системах автоматического управления технологическим и контрольно-испытательным оборудованием, в космических аппаратах, транспортных средствах, бытовых приборах и т.д. Изначально термин центральное процессорное устройство описывал специализированный класс логических машин, предназначенных для выполнения сложных компьютерных программ. Вследствие довольно точного соответствия этого назначения функциям существовавших в то время компьютерных процессоров, этот термин естественным образом был перенесён на сами компьютеры. Начало применения термина и его аббревиатуры по отношению к компьютерным системам было положено в 1960-е годы. Устройство, архитектура и реализация процессоров с тех пор неоднократно менялись, однако их основные исполняемые функции остались теми же, что и прежде.

Главными характеристиками ЦПУ являются: тактовая частота, производительность, энергопотребление, нормы литографического процесса используемого при производстве (для микропроцессоров) и архитектура. Ранние ЦП создавались в виде уникальных составных частей для единственных в своём роде компьютерных систем. Позднее от дорогостоящего способа разработки процессоров, предназначенных для выполнения одной единственной или нескольких узкоспециализированных программ, производители компьютеров перешли к серийному изготовлению типовых классов многоцелевых процессорных устройств. Тенденция к стандартизации компьютерных комплектующих зародилась в эпоху бурного развития полупроводниковых элементов, мейнфреймов и миникомпьютеров, а с появлением интегральных схем она стала ещё более популярной. Создание микросхем позволило ещё больше увеличить сложность ЦП с одновременным уменьшением их физических размеров. Стандартизация и миниатюризация процессоров привели к глубокому проникновению основанных на них цифровых устройств в повседневную жизнь человека. Современные процессоры можно найти не только в таких высокотехнологичных устройствах, как компьютеры, но и в автомобилях, калькуляторах, мобильных телефонах и даже в детских игрушках. Чаще всего они представлены микроконтроллерами, где помимо вычислительного устройства на кристалле расположены дополнительные компоненты (память программ и данных, интерфейсы, порты ввода / вывода, таймеры и др.). Современные вычислительные возможности микроконтроллера сравнимы с процессорами персональных ЭВМ десятилетней давности, а чаще даже значительно превосходят их показатели. Физическая структура микропроцессора достаточно сложна. Ядро процессора содержит главный управляющий и исполняющие модули - блоки выполнения операций над целочисленными данными. К локальным управляющим схемам относятся: блок плавающей запятой, модуль предсказания ветвлений, модуль преобразования CISC-инструкций во внутренний RISC-микрокод, регистры микропроцессорной памяти (в МП типа VLIW до 256 регистров), регистры кэш памяти 1-го уровня (отдельно для данных и инструкций), шинный интерфейс и многое другое.

Функции процессора:

. Обработка данных по заданной программе путем выполнения арифметических и логических операций;

. Программное управление работой устройств компьютера.

Модели процессоров включают следующие совместно работающие устройства:

) Устройство управления (УУ). Осуществляет координацию работы всех остальных устройств, выполняет функции управления устройствами, управляет вычислениями в компьютере.

) Арифметико-логическое устройство (АЛУ). Так называется устройство для целочисленных операций.

КЭШ-память. Особая высокоскоростная память процессора. Кэш используется в качестве буфера для ускорения обмена данными между процессором и оперативной памятью, а также для хранения копий инструкций и данных, которые недавно использовались процессором. Значения из кэш-памяти извлекаются напрямую, без обращения к основной памяти. При изучении особенностей работы программ было обнаружено, что они обращаются к тем или иным областям памяти с различной частотой, а именно: ячейки памяти, к которым программа обращалась недавно, скорее всего, будут использованы вновь. Предположим, что микропроцессор способен хранить копии этих инструкций в своей локальной памяти. В этом случае процессор сможет каждый раз использовать копию этих инструкций на протяжении всего цикла. Доступ к памяти понадобиться в самом начале.

КЭШ первого уровня (L1 cache). Кэш-память, находящаяся внутри процессора. Она быстрее всех остальных типов памяти, но меньше по объёму. Хранит совсем недавно использованную информацию, которая может быть использована при выполнении коротких программных циклов. КЭШ второго уровня (L2 cache). Также находится внутри процессора. Информация, хранящаяся в ней, используется реже, чем информация, хранящаяся в кэш-памяти первого уровня, но зато по объёму памяти он больше. Также в настоящее время в процессорах используется кэш третьего уровня. КЭШ второго уровня (L2 cache).

Также находится внутри процессора. Информация, хранящаяся в ней, используется реже, чем информация, хранящаяся в кэш-памяти первого уровня, но зато по объёму памяти он больше. Также в настоящее время в процессорах используется кэш третьего уровня. Основная память. Намного больше по объёму, чем кэш-память, и значительно менее быстродействующая. Многоуровневая кэш-память позволяет снизить требования наиболее производительных микропроцессоров к быстродействию основной динамической памяти. Так, если сократить время доступа к основной памяти на 30%, то производительность хорошо сконструированной кэш-памяти повыситься только на 10-15%. Кэш-память, как известно, может достаточно сильно влиять на производительность процессора в зависимости от типа исполняемых операций, однако ее увеличение вовсе не поднимет общую производительность работы процессора. Все зависит от того, насколько приложение оптимизировано под данную структуру и использует кэш, а также от того, помещаются ли различные сегменты программы в кэш целиком или кусками. КЭШ-память не только повышает быстродействие микропроцессора при операции чтения из памяти, но в ней также могут храниться значения, записываемые процессором в основную память; записать эти значения можно будет позже, когда основная память будет не занята. Такая кэш-память называется кэшем с обратной записью (write back cache). Её возможности и принципы работы заметно отличаются от характеристик кэша со сквозной записью (write through cache), который участвует только в операции чтения из памяти.

Шина - это канал пересылки данных, используемый совместно различными блоками системы. Шина может представлять собой набор проводящих линий в печатной плате, провода, припаянные к выводам разъемов, в которые вставляются печатные платы, либо плоский кабель. Информация передается по шине в виде групп битов. В состав шины для каждого бита слова может быть предусмотрена отдельная линия (параллельная шина), или все биты слова могут последовательно во времени использовать одну линию (последовательная шина). К шине может быть подключено много приемных устройств - получателей. Обычно данные на шине предназначаются только для одного из них. Сочетание управляющих и адресных сигналов, определяет для кого именно.

.2 Эволюция процессоров

Первым этапом, затронувшим период с 40-х по конец 50-х годов, было создание процессоров с использованием электромеханических реле, ферритовых сердечников (устройств памяти) и вакуумных ламп. Они устанавливались в специальные разъёмы на модулях, собранных в стойки.

Большое количество таких стоек, соединённых проводниками, в сумме представляли процессор. Отличительной особенностью была низкая надёжность, низкое быстродействие и большое тепловыделение.

Вторым этапом, с середины 50-х до середины 60-х, стало внедрение транзисторов. Транзисторы монтировались уже на близкие к современным по виду платам, устанавливаемым в стойки. Как и ранее, в среднем процессор состоял из нескольких таких стоек. Возросло быстродействие, повысилась надёжность, уменьшилось энергопотребление. Третьим этапом, наступившим в середине 60-х годов, стало использование микросхем. Первоначально использовались микросхемы низкой степени интеграции, содержащие простые транзисторные и резисторные сборки, затем по мере развития технологии стали использоваться микросхемы, реализующие отдельные элементы цифровой схемотехники (сначала элементарные ключи и логические элементы, затем более сложные элементы - элементарные регистры, счётчики, сумматоры).

.3 Основные направления развития микропроцессоров

Современные процессоры AMD и Intel хоть и обеспечивают превосходное быстродействие, а также поддерживают огромное число современных технологий, все еще остаются сильно измененными разработками 10-летней давности. Но обе компании уже объявили о своих намерениях представить ЦП на основе принципиально новых архитектур. У AMD это Bulldozer, у Intel - Nehalem. В этом материале рассматриваются их основные возможности и нововведения, а также дальнейшие перспективы развития рынка микропроцессоров. Компания Intel выпустила процессор Pentium II, в основе которого лежали все идеи, реализованные в Pentium и Pentium Pro, и это было единственное решение для компьютеров из middle-end и high-end сегментов. Для бюджетного сектора предназначались уже морально устаревшие Pentium, а также решения от других компаний, в частности от AMD. Вопроса "Что выбрать: Intel или AMD?" тогда не было. Все знали, что процессоры Intel лучшие и все их рекомендовали к приобретению.

Теперь вопрос выбора стоит немного более остро, хотя число производителей ЦП несколько поубавилось. С одной стороны Intel предлагает более скоростные чипы Core 2 Duo, а с другой каждое их обновление требует смены системной платы, да и их стоимость относительно решений AMD у них повыше. Тем не менее, все самые современные процессоры AMD и Intel имеют в своей основе наработки 8-10-летней давности. Чипы Core выросли из Pentium M, которые в свою очередь базируются на архитектуре P6, легшей в основу Pentium Pro и последующих разработок. AMD очень преуспела, выпустив процессор Athlon, основанный на архитектуре K7. K8 хоть и имеет сильные отличия, однако это всего лишь сильно переработанный K7. Ну а K10 - это эволюционное развитие K8. Однако и Intel и AMD обещают в ближайшие полтора-два года представить принципиально новые процессорные архитектуры. Междоусобная конкуренция заставила пойти обоих производителей ЦП на этот весьма дорогостоящий шаг. Intel стала говорить об этом еще два года назад, а AMD в этом году объявила о намерении представить новый процессор с высокой интеграцией компонентов. В этой статье мы собрали всю имеющуюся информацию о планах этих компаний касательно готовящегося обновления архитектур. Развитие микропроцессорной архитектуры идет по пути постоянного повышения их производительности. Традиционными направлениями являются повышение тактовой частоты работы МП и увеличение количества одновременно выполняемых команд за счет увеличения числа конвейеров (исполнительных устройств) в МП. Однако оба эти направления следует признать экстенсивными, имеющими естественные ограничения. Повышение тактовой частоты, которое в основном обеспечивается путем увеличения количества ступеней в конвейере, приводит к большим потерям времени при необходимости перезагрузки конвейера вследствие конфликтов по управлению или при переключении на новую задачу. Такое увеличение имеет также и физические ограничения, связанные со схемотехникой кристалла БИС. Ограничения определяются также влиянием накладных расходов при передаче частично обработанной команды на следующую ступень конвейера. На больших частотах эти расходы становятся соизмеримыми с длительностью обработки на очередном этапе. Во многом это направление исчерпало себя в микропроцессоре Pentium 4 , работающем на частотах, близких к 4 ГГц.

Повышение производительности за счет увеличения числа конвейеров в микропроцессоре можно оценить увеличением числа команд, выполняемых программами за такт (IPC - INsTRuctions Per Cycle). Так, для МП Alpha 21264 этот показатель равен 6, столько же микроопераций за такт может выдать Pentium 4. Но это предельные значения, а реальные программные коды, в частности, из-за различных взаимозависимостей, дают гораздо более низкое значение IPC.

В настоящее время для повышения производительности микропроцессоров используется ряд новых подходов, основными из которых являются:

. CMP (Chip Multi ProcessINg) - создание на одном кристалле системы из нескольких микропроцессоров (многоядерность);

. SMT (Simultaneous MultiThreadINg) - многонитевая архитектура;

. EPIC (Explicitly Parallel INsTRuction ComputINg) - вычисления с явным параллелизмом в командах.

Направление CMP обеспечивается возросшими технологическими возможностями, которые позволяют создать на одном кристалле несколько микропроцессоров и организовать их работу по принципу мультипроцессорных систем.

Производители чипов уже не гонятся за частотой, сместив акцент на многоядерную архитектуру, которая позволяет наращивать производительность, сохраняя в приемлемых границах энергопотребление и тепловыделение. Многоядерные процессоры хорошо приспособлены для требовательных мультимедийных задач, таких как обработка видеозаписей, работы с большими базами данных, одновременное выполнение нескольких ресурсоемких заданий, например, компьютерной игры, записи DVD и загрузки файлов из Интернета. При таком подходе задача повышения производительности работы отдельных приложений требует распараллеливания последних, то есть проблема перемещается с аппаратного на программный уровень. На данный момент сложности заключаются в том, что большая часть существующего программного обеспечения создавалась без расчета на использование в многоядерных и многопроцессорных конфигурациях. Другими словами, прогресс в области аппаратных средств на какое-то время опередил прогресс в области программного обеспечения. Направление SMT в развитии архитектуры микропроцессоров базируется на том, что одна задача не в состоянии полностью загрузить все возрастающие ресурсы микропроцессора. Поэтому на одном процессоре осуществляется запуск нескольких задач одновременно, при этом распараллеливание программ осуществляется аппаратными средствами МП. Это позволяет более равномерно загрузить ресурсы процессора. Параллельно в разных устройствах МП могут выполняться команды из разных задач. Так, микропроцессор Alpha 21264 поддерживает выполнение до 4 задач одновременно. При поддержке SMT на 4 нити каждый процессор с точки зрения операционной системы выглядит как 4 логических процессора. Исследования показали, что SMT позволяет увеличить производительность данного процессора до двух раз, а дополнительные схемы управления занимают всего около 10% площади кристалла.

Некоторые микропроцессоры для максимального повышения своей производительности используют оба выше названных подхода. Так, компания Sun Microsystems представила новый процессор ULTRaSPARC T2. Направление EPIC фактически использует известную технологию VLIW (Very Large INsTRuction Word) - очень длинного командного слова. Распараллеливание алгоритма между исполнительными модулями производится компилятором на этапе создания машинного кода, когда команды объединяются в связки и не конкурируют между собой за ресурсы микропроцессора. При этом упрощается блок управления на кристалле.

Использование технологии Hyper Threading в современных микропроцессорах. Hyper-threading (HTT) - это торговая марка компании Intel для реализации технологии "одновременной мульти поточности" на микроархитектуре Pentium 4. Расширенная форма супер поточности, впервые появившаяся в процессорах Intel Xeon и позднее добавленная в процессоры Pentium 4. Эта технология увеличивает производительность процессора при определённых рабочих нагрузках путём предоставления "полезной работы" исполнительным устройствам (англ. execution units), которые иначе будут бездействовать; к примеру, в случаях кэш-промаха.

Процессоры Pentium 4 с включённым Hyper-threading операционная система определяет как два разных процессора вместо одного.

Преимущества Hyper-threading представлены как:

. Улучшенная поддержка многопоточного кода, позволяя запускать потоки одновременно;

. Улучшена реакция и время отклика; увеличено количество пользователей, которое может поддерживать сервер.

.4 Поколения процессоров

Существует семь поколений процессоров.

Первое поколение (процессоры 8086 и 8088 и математический сопроцессор 8087) задало архитектурную основу - набор "неравноправных" 16-разрядных регистров, сегментную систему адресации в пределах 1 Мб с большим разнообразием режимов, систему команд, систему прерываний и ряд других атрибутов. В процессорах применялась "малая" конвейеризация: пока одни узлы выполняли текущую команду, блок предварительной выборки выбирал из памяти следующую.

Втрое поколение (80286 и сопроцессор 80287) добавило в семейство так называемый "защищённый режим", позволяющий употреблять виртуальную память размером до 1Гб для каждой задачи, пользуясь адресуемой физической памятью в пределах 16 Мб. Защищённый режим является основой для построения многозадачных операционных систем, в которых система привилегий жестко регламентирует взаимоотношения задач с памятью, операционной системой и друг с другом. Производительность процессоров 80286 возросла не только в связи с ростом тактовой частоты, но и за счет значительного усовершенствования конвейера.

Третье поколение (80386/80387 с "суффиксами" DX и SX, определяющими разрядность внешней шины) ознаменовалось переходом к 32-разрядной архитектуре. Кроме расширения диапазона представляемых величин (16 бит отображают целые числа в диапазоне от 0 до 65535 или от -32768 до +32767, а 32 бита - более четырёх миллиардов) представляемых величин (16 бит отображают целые числа в диапазоне от 0 до 65535 или от -32768 до +32767, а 32 бита - более четырёх миллиардов), увеличилась ёмкость адресуемой памяти. На этих процессорах начала широко использоваться система Microsoft Windows.

Четвертое поколение (80486 также DX и SX) не внесло существенных изменений в архитектуру, зато был принят ряд мер для повышения производительности. В этих процессорах значительно усложнен исполнительный конвейер. В данном поколении отказались от внешнего сопроцессора - он стал размещаться на одном кристалле с центральным (либо его нет совсем).

Пятое поколение (процессор Pentium у фирмы Intel и К5 у фирмы AMD) дало суперскалярную архитектуру. Для быстрого снабжения конвейеров командами и данными из памяти шина данных этих процессоров сделана 64-разрядной, из-за чего их первое время иногда ошибочно называли 64-разрядными процессорами. "На закате" этого поколения появилось расширение ММХ (Matrics Math Extensions {instruction set} - набор команд для расширения матричных математических операций (первоначально Multimedia Extension {instruction set} - набор команд для мультимедиа-расширения).

"Традиционные 32-разрядные процессоры способны выполнять сложение двух 8-разрядных чисел, размещая каждое из них в младших разрядах 32-разрядных регистров. При этом 24 старших разряда регистров не употребляются, и потому, например, при одной операции сложения ADD осуществляется просто сложение двух 8-разрядных чисел. Команды ММХ оперируют сразу с 64 разрядами, где могут храниться восемь 8-разрядных чисел, причем имеется возможность выполнить их сложение с другими 8-разрядными числами в процессе одной операции ADD. Регистры ММХ могут употребляться также для одновременного сложения четырех 16-разрядных слов или двух 32-разряных длинных слов. Такой принцип получил название SIMD (Single Instruction/Multiple Data - "один поток команд/много потоков данных").

Новые команды были предназначены в первую очередь для ускорения выполнения мультимедиа программ, но применять их можно не только к задачам, прямо связанным с технологией мультимедиа. В ММХ появился и новый тип арифметики - с насыщением: если результат операции не помещается в разрядной сетке, то переполнения (или "антипереполнения") не происходит, а устанавливается максимально (или минимально) возможное значение числа.

Шестое поколение процессоров началось с Pentium Pro и продолжилось в процессорах Pentium III, Celeron и Xeon (у фирмы AMD сюда относятся процессоры К6, К6-2, К6-2+, К6-III). Ключевым здесь является динамическое исполнение, под которым понимается исполнение команд не в том порядке, как это предполагается программным кодом, а в том, как "удобно" процессору. Как пятое поколение по ходу развития было дополнено расширением ММХ, так шестое поколение получило расширения, увеличивающие возможности ММХ. У AMD это расширение 3dNnoy!, а у Intel - SSE (Streaming SIMD Extensions - потоковые расширения SIMD).

Седьмое поколение началось с процессора Athlon (у фирмы AMD). Причисление его к новому поколению обусловлено развитием суперскалярности и суперконвейерности. Седьмое поколение процессоров Intel началось позже с процессора Pentium 4.

.5 Технология производства

Сейчас на рынке наблюдается интересная тенденция: с одной стороны компании-производители стараются как можно быстрее внедрить новые техпроцессы и технологии в свои новинки, с другой же, наблюдается искусственное сдерживание роста частот процессоров. Во-первых, сказывается ощущение неполной готовности рынка к очередной смене семейств процессоров, а фирмы еще не получили достаточно прибыли с объема продаж производящихся сейчас CPU - запас еще не иссяк. Достаточно заметно превалирование значимости цены готового изделия над всеми остальными интересами компаний. Во-вторых, значительное снижение темпов "гонки частот" связано пониманием необходимости внедрения новых технологий, которые реально увеличивают производительность при минимальном объеме технологических затрат. Производители столкнулись с проблемами при переходе на новые техпроцессы. Технологическая норма 90 нм оказалась достаточно серьезным технологическим барьером для многих производителей чипов. Это подтверждает и компания TSMC, которая занимается производством чипов для многих гигантов рынка, таких как компании AMD, nVidia, ATI, VIA. Долгое время ей не удавалось наладить производство чипов по технологии 0,09 мкм, что привело к низкому выходу годных кристаллов. Это одна из причин, по которой AMD долгое время переносила выпуск своих процессоров с технологией SOI (Silicon-on-Insulator). Связано это с тем, что именно на этой размерности элементов стали сильно проявляться всевозможные ранее не столь сильно ощутимые негативные факторы как токи утечки, большой разброс параметров и экспоненциальное повышение тепловыделения.

Один из альтернативных выходов - это применение технологии SOI (кремний на изоляторе), которое относительно недавно внедрила компания AMD в своих 64-разрядных процессорах. Впрочем, это стоило ей немало усилий и преодоление большого количества попутных трудностей. Зато сама технология предоставляет громадное количество преимуществ при сравнительно малом количестве недостатков. Плюсов - масса. Никакого неконтролируемого движения электронов под каналом транзистора, сказывающегося на его электрических характеристиках - раз. После подачи отпирающего тока на затвор, время ионизации канала до рабочего состояния, до момента, пока по нему пойдет рабочий ток, сокращается, то есть, улучшается второй ключевой параметр производительности транзистора, время его включения/выключения - это два. Или же, при той же скорости, можно просто понизить отпирающий ток - три. Или найти какой-то компромисс между увеличением скорости работы и уменьшением напряжения. При сохранении того же отпирающего тока, увеличение производительности транзистора может составить вплоть до 30%, если оставить частоту той же, делая упор на энергосбережение, то там плюс может быть и большим - до 50%. Наконец, характеристики канала становятся более предсказуемыми, а сам транзистор становится более устойчивым к спорадическим ошибкам, вроде тех, что вызывают космические частицы, попадая в субстрат канала, и непредвиденно ионизируя его. Теперь, попадая в подложку, расположенную под слоем изолятора, они никак не сказываются на работе транзистора. Единственным минусом SOI является то, что приходится уменьшать глубину области эмиттер/коллектор, что прямо и непосредственно сказывается на увеличении ее сопротивления по мере сокращения толщины. И наконец, третья причина, которая способствовала замедлению темпов роста частот - это низкая активность конкурентов на рынке. Можно сказать, каждый был занят своими делами. AMD занималась повсеместным внедрением 64-битных процессоров, для Intel это период усовершенствования нового техпроцесса, отладки для увеличенная выхода годных кристаллов.

Итак, необходимость перехода на новые техпроцессы очевидна, но технологам это дается каждый раз все с большим трудом. Первые процессоры Pentium (1993 г) производились по техпроцессу 0,8 мкм, затем по 0,6 мкм. В 1995 году впервые для процессоров 6-го поколения был применен техпроцесс 0,35 мкм. В 1997 году он сменился на 0,25 мкм, а в 1999 - на 0,18 мкм. Современные процессоры выполняются по технологии 0,13 и 0,09 мкм, причем последняя была введена в 2004 году. Очевидно, что чем толще этот слой, тем лучше он выполняет свои изоляционные функции, но он является составной частью канала, и не менее очевидно, что если производители собираются уменьшать длину канала (размер транзистора), то надо уменьшать его толщину, причем, весьма быстрыми темпами. К слову говоря, за последние несколько десятилетий толщина этого слоя составляет в среднем порядка 1/45 от всей длины канала. Но у этого процесса есть свой конец - как утверждал все тот же Intel, при продолжении использования SiO2, как это было на протяжении последних 30 лет, минимальная толщина слоя будет составлять 2.3. нм, иначе утечка приобретет просто нереальные величины. Для снижения подканальной утечки до последнего времени ничего не предпринималось, сейчас ситуация начинает меняться, поскольку рабочий ток, наряду со временем срабатывания затвора, является одним из двух основных параметров, характеризующих скорость работы транзистора, а утечка в выключенном состоянии на нем непосредственно сказывается - на сохранении требуемой эффективности транзистора. Приходится, соответственно, поднимать рабочий ток, со всеми вытекающими последствиями.

Основные этапы производства.

Изготовление микропроцессора - это сложнейший процесс, включающий более 300 этапов. Микропроцессоры формируются на поверхности тонких круговых пластин кремния - подложках, в результате определенной последовательности различных процессов обработки с использованием химических препаратов, газов и ультрафиолетового излучения.

В процессе изготовления микросхем на пластины-заготовки наносят в виде тщательно рассчитанных рисунков тончайшие слои материалов. На одной пластине помещается до нескольких сотен микропроцессоров. Весь процесс производства процессоров можно разделить на несколько этапов: выращивание диоксида кремния и создание проводящих областей, тестирование и изготовление.

Выращивание диоксида кремния и создание проводящих областей.

Процесс производства микропроцессора начинается с "выращивания" на поверхности отполированной пластины изоляционного слоя диоксида кремния. Осуществляется этот этап в электрической печи при очень высокой температуре. Толщина оксидного слоя зависит от температуры и времени, которое пластина проводит в печи. Затем следует фотолитография - процесс, в ходе которого на поверхности пластины формируется рисунок-схема. Сначала на пластину наносят временный слой светочувствительного материала - фоторезист, на который с помощью ультрафиолетового излучения проецируют изображение прозрачных участков шаблона, или фотомаски. Маски изготавливают при проектировании процессора и используют для формирования рисунков схем в каждом слое процессора. Под воздействием излучения засвеченные участки фотослоя становятся растворимыми, и их удаляют с помощью растворителя (плавиковая кислота), открывая находящийся под ними диоксид кремния. Открытый диоксид кремния удаляют с помощью процесса, который называется "травлением". Затем убирают оставшийся фотослой, в результате чего на полупроводниковой пластине остается рисунок из диоксида кремния. В результате ряда дополнительных операций фотолитографии и травления на пластину наносят также поликристаллический кремний, обладающий свойствами проводника.

В ходе следующей операции, называемой "легированием", открытые участки кремниевой пластины бомбардируют ионами различных химических элементов, которые формируют в кремнии отрицательные и положительные заряды, изменяющие электрическую проводимость этих участков.

Наложение новых слоев с последующим травлением схемы осуществляется несколько раз, при этом для межслойных соединений в слоях оставляются "окна", которые заполняют металлом, формируя электрические соединения между слоями. В своем 0.13-микронном технологическом процессе корпорация Intel применила медные проводники. В 0.18-микронном производственном процессе и процессах предыдущих поколений Intel применяла алюминий. И медь, и алюминий - отличные проводники электричества. При использовании 0,18-мкм техпроцесса использовалось 6 слоев, при внедрении 90 нм техпроцесса в 2004 году применили 7 слоев кремния.

Каждый слой процессора имеет свой собственный рисунок, в совокупности все эти слои образуют трехмерную электронную схему. Нанесение слоев повторяют 20-25 раз в течение нескольких недель.

Тестирование.

Чтобы выдержать воздействия, которым подвергаются подложки в процессе нанесения слоев, кремниевые пластины изначально должны быть достаточно толстыми. Поэтому прежде чем разрезать пластину на отдельные микропроцессоры, ее толщину с помощью специальных процессов уменьшают на 33% и удаляют загрязнения с обратной стороны. Затем на обратную сторону "похудевшей" пластины наносят слой специального материала, который улучшает последующее крепление кристалла к корпусу. Кроме того, этот слой обеспечивает электрический контакт между задней поверхностью интегральной схемы и корпусом после сборки. После этого пластины тестируют, чтобы проверить качество выполнения всех операций обработки. Чтобы определить, правильно ли работают процессоры, проверяют их отдельные компоненты. Если обнаруживаются неисправности, данные о них анализируют, чтобы понять, на каком этапе обработки возник сбой.

Затем к каждому процессору подключают электрические зонды и подают питание. Процессоры тестируются компьютером, который определяет, удовлетворяют ли характеристики изготовленных процессоров заданным требованиям.

Изготовление корпуса.

После тестирования пластины отправляются в сборочное производство, где их разрезают на маленькие прямоугольники, каждый из которых содержит интегральную схему. Для разделения пластины используют специальную прецизионную пилу. Неработающие кристаллы отбраковываются. Затем каждый кристалл помещают в индивидуальный корпус. Корпус защищает кристалл от внешних воздействий и обеспечивает его электрическое соединение с платой , на которую он будет впоследствии установлен. Крошечные шарики припоя, расположенные в определенных точках кристалла, припаивают к электрическим выводам корпуса. Теперь электрические сигналы могут поступать с платы на кристалл и обратно. После установки кристалла в корпус процессор снова тестируют, чтобы определить, работоспособен ли он. Неисправные процессоры отбраковывают, а исправные подвергают нагрузочным испытаниям: воздействию различных температурных и влажностных режимов, а также электростатических разрядов. После каждого нагрузочного испытания процессор тестируют для определения его функционального состояния. Затем процессоры сортируют в зависимости от их поведения при различных тактовых частотах и напряжениях питания.

.6 Технологические этапы производства микропроцессоров

Как создаются чипы.

Производство чипов заключается в наложении тонких слоёв со сложным "узором" на кремниевые подложки. Сначала создаётся изолирующий слой, который работает как электрический затвор. Что касается производства подложек, то из цельного монокристалла-цилиндра их необходимо нарезать тонкими "блинами", чтобы потом легко разрезать на отдельные кристаллы процессоров. Для тестов каждого кристалла на подложке используются электрические зонды. Наконец, подложка разрезается на отдельные ядра, нерабочие ядра сразу же отсеиваются. В зависимости от характеристик, ядро становится тем или иным процессором и заключается в упаковку, которая облегчает установку процессора на материнскую плату. Все функциональные блоки проходят через интенсивные стресс-тесты.

Всё начинается с подложек.

Первый шаг в производстве процессоров выполняется в чистой комнате.

Кстати, важно отметить, что подобное технологичное производство представляет собой скопление огромного капитала на квадратный метр. На постройку современного завода со всем оборудованием легко "улетают" 2-3 млрд. долларов, да и на тестовые прогоны новых технологий требуется несколько месяцев. Только затем завод может серийно выпускать процессоры. В общем, процесс производства чипов состоит из нескольких шагов обработки подложек. Сюда входит и создание самих подложек, которые в итоге будут разрезаны на отдельные кристаллы.

Производство подложек.

Первый этап - выращивания монокристалла. Для этого затравочный кристалл внедряется в ванну с расплавленным кремнием, который находится чуть выше точки плавления поликристаллического кремния. Важно, чтобы кристаллы росли медленно (примерно день), чтобы гарантировать правильное расположение атомов. Поликристаллический или аморфный кремний состоит из множества разномастных кристаллов, которые приведут к появлению нежелательных поверхностных структур с плохими электрическими свойствами. Когда кремний будет расплавлен, его можно легировать с помощью других веществ, меняющих его электрические свойства. Весь процесс происходит в герметичном помещении со специальным воздушным составом, чтобы кремний не окислялся. Монокристалл разрезается на "блины" с помощью кольцевой очень точной алмазной пилы, которая не создаёт крупных неровностей на поверхности подложек. Конечно, при этом поверхность подложек всё равно не идеально плоская, поэтому нужны дополнительные операции. Монокристаллы представлены на рисунке 1. (Приложение А).

Сначала с помощью вращающихся стальных пластин и абразивного материала (такого, как оксид алюминия), снимается толстый слой с подложек (процесс называется притиркой). В результате устраняются неровности размером от 0,05 мм до, примерно, 0,002 мм ( 000 нм). Затем следует закруглить края каждой подложки, поскольку при острых кромках могут отслаиваться слои. В результате устраняются неровности размером от 0,05 мм до, примерно, 0,002 мм (2000 нм). Затем следует закруглить края каждой подложки, поскольку при острых кромках могут отслаиваться слои. Далее используется процесс травления, когда с помощью разных химикатов (плавиковая кислота, уксусная кислота, азотная кислота) поверхность сглаживается ещё примерно на 50 мкм. Физически поверхность не ухудшается, поскольку весь процесс полностью химический. Он позволяет удалить оставшиеся погрешности в структуре кристалла, в результате чего поверхность будет близка к идеалу. Последний шаг - полировка, которая сглаживает поверхность до неровностей, максимум, 3 нм. Полировка осуществляется с помощью смеси гидроксида натрия и гранулированного диоксида кремния.

Сегодня подложки для микропроцессоров имеют диаметр 200 или 300 мм, что позволяет производителям чипов получать с каждой из них множество процессоров. Следующим шагом будут 450-мм подложки, но раньше 2013 года ожидать их не следует. В целом, чем больше диаметр подложки, тем больше можно произвести чипов одинакового размера. 300-мм подложка, например, даёт более чем в два раза больше процессоров, чем 200-мм.

Легирование и диффузия.

Легирование, которое выполняется во время роста монокристалла, уже упоминалось. Но легирование производится и с готовой подложкой, и во время процессов фотолитографии позднее. Это позволяет менять электрические свойства определённых областей и слоёв, а не всей структуры кристалла. Добавление легирующего вещества может происходить через диффузию. Атомы легирующего вещества заполняют свободное пространство внутри кристаллической решётки, между структурами кремния. В некоторых случаях можно легировать и существующую структуру. Диффузия осуществляется с помощью газов (азот и аргон) или с помощью твёрдых веществ или других источников легирующего вещества.

Создание маски.

Чтобы создать участки интегральной схемы, используется процесс фотолитографии. Поскольку при этом нужно облучать не всю поверхность подложки, то важно использовать так называемые маски, которые пропускают излучение высокой интенсивности только на определённые участки. Маски можно сравнить с чёрно-белым негативом. Интегральные схемы имеют множество слоёв (20 и больше), и для каждого из них требуется своя маска. Структура из тонкой хромовой плёнки наносится на поверхность пластины из кварцевого стекла, чтобы создать шаблон. При этом дорогие инструменты, использующие поток электронов или лазер, прописывают необходимые данные интегральной схемы, в результате чего получается шаблон из хрома на поверхности кварцевой подложки. Важно понимать, что каждая модификация интегральной схемы приводит к необходимости производства новых масок, поэтому весь процесс внесения правок очень затратный.

Фотолитография.

С помощью фотолитографии на кремниевой подложке формируется структура. Процесс повторяется несколько раз, пока не будет создано множество слоёв (более 20). Слои могут состоять из разных материалов, причём, нужно ещё и продумывать соединения микроскопическими проволочками. Все слои можно легировать. Перед тем, как начнётся процесс фотолитографии, подложка очищается и нагревается, чтобы удалить липкие частицы и воду. Затем подложка с помощью специального устройства покрывается диоксидом кремния. Далее на подложку наносится связывающий агент, который гарантирует, что фоторезистивный материал, который будет нанесён на следующем шаге, останется на подложке. Фоторезистивный материал наносится на середину подложки, которая потом начинает вращаться с большой скоростью, чтобы слой равномерно распределился по всей поверхности подложки. Затем подложка вновь нагревается. Принцип действия фотолитографии представлен на рисунке 2. (Приложение Б)

Затем через маску обложка облучается квантовым лазером, жёстким ультрафиолетовым излучением, рентгеновским излучением, пучками электронов или ионов - могут использоваться все эти источники света или энергии.

УФ-излучение и газовые лазеры.

Жёсткое УФ-излучение с длиной волны 13,5 нм облучает фоторезистивный материал, проходя через маску. Для получения требуемого результата очень важны время проецирования и фокусировка. Плохая фокусировка приведёт к тому, что останутся лишние частицы фоторезистивного материала, поскольку некоторые отверстия в маске не будут облучены должным образом. То же самое получится, если время проецирования будет слишком маленьким. Тогда структура из фоторезистивного материала будет слишком широкой, участки под отверстиями будут недодержанными. С другой стороны, чрезмерное время проецирования создаёт слишком большие участки под отверстиями и слишком узкую структуру из фоторезистивного материала. Как правило, очень трудоёмко и сложно отрегулировать и оптимизировать процесс. Специальная шаговая проекционная установка перемещает подложку в нужное положение. Затем может проецироваться строчка или один участок, чаще всего соответствующий одному кристаллу процессора. Дополнительные микроустановки могут вносить иные изменения. Они могут отлаживать существующую технологию и оптимизировать техпроцесс. Микроустановки обычно работают над площадями меньше 1 кв. мм, в то время как обычные установки покрывают площади большего размера. Существуют мокрый и сухой процессы травления, которыми обрабатываются участки диоксида кремния. Мокрые процессы используют химические соединения, а сухие процессы - газ. Отдельный процесс заключается и в удалении остатков фоторезистивного материала. Производители часто сочетают мокрое и сухое удаление, чтобы фоторезистивный материал был полностью удалён. Это важно, поскольку фоторезистивный материал органический, и если его не удалить, он может привести к появлению дефектов на подложке.

После травления и очистки можно приступать к осмотру подложки, что обычно и происходит на каждом важном этапе, или переводить подложку на новый цикл фотолитографии.

Тест подложек представлен на рисунке 3. (Приложение В)

Готовые подложки тестируются на так называемых установках зондового контроля. Они работают со всей подложкой. На контакты каждого кристалла накладываются контакты зонда, что позволяет проводить электрические тесты. С помощью программного обеспечения тестируются все функции каждого ядра. Разрезание подложки представлено на рисунке 4. (Приложение Г). С помощью разрезания из подложки можно получить отдельные ядра. На данный момент установки зондового контроля уже выявили, какие кристаллы содержат ошибки, поэтому после разрезания их можно отделить от годных. Раньше повреждённые кристаллы физически маркировались, теперь в этом нет необходимости, вся информация хранится в единой базе данных.

Затем функциональное ядро нужно связать с процессорной упаковкой, используя клейкий материал. После этого нужно провести проводные соединения, связывающие контакты или ножки упаковки и сам кристалл.

Проводное соединение подложки представлены на рисунке 5. (Приложение Д)

Большинство современных процессоров используют пластиковую упаковку с распределителем тепла. Обычно ядро заключается в керамическую или пластиковую упаковку, что позволяет предотвратить повреждение.

Упаковка процессора представлена на рисунке 6. (Приложение Е).

Глава 2. Перспективы развития микропроцессоров

.1 Ближайшее будущее микропроцессоров

выпустит 12 новых процессоров на микроархитектуре Haswell, пять из них - семейства Pentium.

Компания Intel готовит к выпуску несколько новых CPU на микроархитектуре Haswell. Так, наряду с моделями Core i7-4820K, i7-4930K и i7-4960X, о которых мы уже писали ранее, компания добавит в свой каталог модель Core i7-4771.i7-4771 будет отличаться от текущей модели Core i7-4770 лишь чуть большей номинальной тактовой частотой: 3,5 ГГц против 3,4 ГГц. В остальном характеристики этих CPU одинаковы.

Линейка Core i5 пополнится моделями Core i5-4440 и Core i5-4440S. Оба CPU - четырехъядерные, с поддержкой памяти DDR3-1600 МГц и интегрированным видеоядром Intel HD Graphics 4600 (до 1100 МГц). Тактовая частота и TDP модели Core i5-4440 - 3,1-3,3 ГГц и 84 Вт, модели Core i5-4440s - 2,8-3,3 и 65 Вт соответственно.

Линейка Core i3, по аналогии, прирастет моделями Core i3-4130 и Core i3-4130T, Core i3-4330 и Core i3-4330T.i3-4130 и Core i3-4130T получат поддержку технологии Hyper-Threading, GPU Intel HD Graphics 4400 с максимальной частотой 1150 МГц и по 3 МБ кэш-памяти. Различие между ними - в частотах и TDP: Core i3-4130 - 3,4 ГГц и 54 Вт, Core i3-4130T - 2,9 и 35 Вт.i3-4330 и Core i3-4330T получили по 4 МБ кэш-памяти и Intel HD Graphics 4600, остальные их характеристики соответствуют характеритистикам Core i3-4130 и Core i3-4130T. Частота и TDP Intel Core i3-4330 - 3,5 ГГц и 54 Вт, Core i3-4330T - 3,0 ГГц и 35 Вт.

Линейка Pentium пополнится моделями G3220, G3420 и G3430, которые, очевидно, придут на смену CPU G2030, G2130 и G2140 соответственно. Все они получат по два вычислительных ядра, двухканальный контроллер оперативной памяти (DDR-1600 МГц в случае старших моделей и DDR3-1333 МГц - в случае младшей), 3 МБ кэш-памяти и интегрированное видеоядро, максимальная частота которого составит 1100 МГц. Тактовая частота CPU Pentium G3430 составит 3,3 ГГц, G3420 - 3,2 ГГц, G3220 - 3,0 ГГц. TDP всех трех процессоров - 54 Вт.

Энергоэффективные Pentium G3420T и G3220T будут отличаться меньшей тактовой частотой (2,7 и 2,6 ГГц соответственно) и меньшим значением TDP (35 Вт).

О цене новых процессоров Intel данных пока нет.

Процессор AMD FX-9370.

Компанию AMD можно критиковать по несметному количеству причин. Потоки недовольства могут быть легко направлены в адрес её нерасторопности в проектировании новых микроархитектур, затягивания внедрения новых технологических процессов, неверной расстановки приоритетов при создании современных процессорных дизайнов, безалаберности в исполнении собственных планов, перехода на автоматизированное проектирование компоновки полупроводниковых кристаллов, наплевательского отношения к собственным инженерным кадрам, многочисленных маркетинговых просчётов и многого другого. Однако в чём AMD упрекнуть совершенно невозможно, так это в отсутствии боевого духа. Несмотря на то, что, объективно говоря, в распоряжении компании нет достойных процессорных дизайнов, которые она могла бы противопоставить высокопроизводительным модификациям интеловских процессоров Core, AMD пытается сохранить хорошую мину при плохой игре и прилагает недюжинные усилия к тому, чтобы при сборке настольных систем у энтузиастов всё-таки оставалась какая-то возможность выбора. В ход идут все доступные средства, начиная с ценового маневрирования и заканчивая внесением в микроархитектуру не требующих коренных переделок оптимизаций. И если до недавних пор у AMD неплохо получалось сохранять достаточно весомую армию сторонников, которых вполне устраивало, что старшие процессоры серии FX обеспечивают производительность на уровне Core i5, заставляя при этом полностью забыть о каком-либо энергосбережении, то теперь эта ситуация начала угрожающе изменяться. Появление интеловских процессоров с микроархитектурой Haswell подняло планку производительности современных настольных систем, неминуемо оттесняя линейку FX в сторону бюджетных и недорогих предложений. Однако ответное снижение цен уже вряд ли может считаться достаточной контрмерой. Возможно, компания AMD и способна к самоиронии, но выпуск бюджетных восьмиядерных процессоров - шутка не особенно смешная, особенно если принять во внимание площадь их полупроводникового кристалла и вытекающую из этого себестоимость. Поэтому для поддержания ослабевающих позиций AMD и на более отчаянные шаги - расширение линейки процессоров FX двумя новыми представителями с повышенными тактовыми частотами: FX-9590 и FX-9370.

На первый взгляд в выходе таких процессоров нет ничего из ряда вон выходящего, рост номинальной частоты - вполне привычное направление развития процессорных линеек. Однако в данном случае мы имеем дело с совершенно особенным явлением: AMD подняла частоты имеющихся процессоров Vishera, закрыв глаза на реальные возможности этого процессорного дизайна. Итогом такого грубого и прямолинейного подхода стало формальное появление представителей серии FX, работающих на частотах до 5 ГГц, но с ограниченной доступностью, запредельным тепловыделением и энергопотреблением и проблемной совместимостью с имеющейся инфраструктурой. Мера эта вынужденная: к сожалению, на данном этапе каких-то других способов усилить линейку FX у AMD в распоряжении нет. Следующая микроархитектура Steamroller и более совершенные технологические процессы пока ещё не готовы, да и целесообразность дальнейшего развития семейства высокопроизводительных многоядерных процессоров FX для десктопных применений находится под большим вопросом.

В итоге новые процессоры вроде и представлены, но просто так пойти и купить их в магазине невозможно. По официальной версии, FX-9590 и FX-9370 доступны только для системных интеграторов и только в отдельных регионах. Россия в число стран, где распространяются новинки, не входит. В результате разыскать FX-9590 или FX-9370 для проведения тестирования оказалось практически нереальной задачей. Российское представительство компании AMD помочь нам с образцами наотрез отказалось, а в широкой продаже в отечественных магазинах они так и не появились, несмотря на то, что анонс состоялся ещё 11 июня. Тем не менее несколько экземпляров FX-9370 всё-таки просочилось в розницу по серым каналам, и после нескольких неудачных попыток ухватить один из них нам таки удалось. AMD FX-9590 - это специальная тюнингованная модель, частота которой в турборежиме доходит до 5-гигагерцевой отметки, а номинальная частота установлена на уровне 4,7 ГГц. Такие процессоры AMD реализует в очень ограниченных количествах, так как их выпуск требует специального отбора наиболее удачных полупроводниковых кристаллов. Но даже, несмотря на "индивидуальный" подход к производству, TDP у FX-9590 достигает запредельных 220 Вт. Страдает и цена: как и всякий раритет, FX-9590 стоит неожиданно много. В тех немногих американских и европейских магазинах, где его можно найти, ниже $800 цены не опускаются.

Совершенно очевидно: расчёт в первую очередь делается на коллекционеров, интерес которых к FX-9590 дополнительно подогревается тем фактом, что он может оказаться самым последним процессором AMD в линейке FX. По крайней мере актуальные версии планов компании не предполагают дальнейшего развития этого семейства ни в нынешнем, ни в будущем году, и даже тогда, когда в распоряжении AMD совершенно точно появится новая микроархитектура Steamroller.

Доставшийся же нам на тестирование AMD FX-9370 - более интересная с практической точки зрения модель. Её номинальная частота на 300 МГц ниже, чем у старшего собрата, - она составляет 4,4 ГГц в номинале и 4,7 ГГц в турборежиме. Но при этом тепловой пакет установлен тот же, 220 Вт, что оставляет некоторое пространство для разгона. Демократичнее выглядит и цена. AMD противопоставляет FX-9370 старшим моделям Core i7 для LGA1150/1155-систем и реализует их по цене порядка $300-$350.

При этом внешне в AMD FX-9370 ничто не выдаёт продукт премиум-класса. Процессор поставляется в небольшой картонной коробочке, в которой, кроме самого CPU, инструкции по установке и наклейки на корпус, ничего нет. Учтя высокий уровень тепловыделения, выбор систем охлаждения AMD решила переложить на плечи сборщиков, а придумывание какой-то эксклюзивной упаковки (например, подобной той, в которой предлагались оверклокерские AMD Phenom II 42 Black Edition TWKR) не имело смысла по той причине, что FX-9370 вообще не должен распространяться в розницу. Сам же процессор на поверку оказался обычным Vishera, не имеющим каких-либо глубинных отличий от привычного FX-8350. В основе AMD FX-9370 используется точно такая же версия полупроводникового кристалла OR-C0, как и в других процессорах для платформы Socket AM3+, основанных на вычислительных ядрах Piledriver.

Совершенно очевидно, что FX-9370 - это узаконенный разгон FX-8350 на 400-500 МГц, выполненный силами самого производителя. Скорее всего, для FX-9370 компания AMD отбирает более удачные полупроводниковые кристаллы, но в первую очередь работоспособность на повышенных частотах реализуется за счёт увеличения напряжения питания. Так, при работе на штатной частоте 4,4 ГГц напряжение, подаваемое на вычислительные ядра, составляет порядка 1,41 В, а при активации технологии Turbo Core 3.0 оно может увеличиваться до 1,46 В. Это примерно на 0,07-0,08 В выше, чем у обычных процессоров Vishera.

Развитие процессоров и платформ в ближайшие 10 лет.

Очевидно, что последние несколько лет были отмечены большим прогрессом вычислительных систем. Но какими бы ни были достижения прошедших десяти лет, в следующем десятилетии появление и миграция новых приложений и моделей использования на массовые компьютеры определят возросшие требования к вычислительным платформам будущего: высокая производительность, низкое энергопотребление и огромное увеличение функциональности.

Учитывая то, что фактически произошел титанический сдвиг в моделях использования компьютеров, определяются и проектируются компьютерные платформы будущего, которые существенно, глобально изменят не только вычисления, но также интерфейсы и требования к инфраструктуре.

Архитектура микропроцессоров 2015 года.

Глядя в будущее, можно сказать, что процессоры и платформы будут выделяться не только высокой производительностью самой по себе, но также богатыми и разнообразными вычислительными и коммуникационными возможностями, управлением питанием, повышенной надежностью, безопасностью и управляемостью, а также полной интеграцией со всеми остальными компонентами платформы. Intel планирует в течение нескольких последующих лет выпустить процессоры, которые будут содержать множество ядер - в некоторых случаях даже сотни. В корпорации считают, что архитектуры Intel с поддержкой многопроцессорной обработки на уровне кристалла (chip-level multiprocessing, CMP) представляют будущее микропроцессоров, потому что такие архитектуры позволяют достичь огромных уровней производительности и в то же время обеспечить эффективное управление питанием и эффективный режим охлаждения. В прошлом повышение производительности традиционных одноядерных процессоров в основном происходило за счет увеличения тактовой частоты (до настоящего времени около 80% производительности определяла тактовая частота). Но постоянное повышение частоты упирается в ряд фундаментальных физических барьеров. Во-первых, с уменьшением размеров кристалла и с повышением частоты возрастает ток утечки транзисторов. Это ведет к повышению потребляемой мощности и выделению тепла. Во-вторых, преимущества более высокой тактовой частоты частично сводятся на нет из-за задержек при обращении к памяти, так как время доступа к памяти не соответствует возрастающим тактовым частотам. В-третьих, для некоторых приложений традиционные последовательные архитектуры становятся неэффективными с возрастанием тактовой частоты из-за так называемого фон-неймановского узкого места - ограничения производительности в результате последовательного потока вычислений. При этом возрастают резистивно-емкостные задержки передачи сигналов, что является дополнительным узким местом, связанным с повышением тактовой частоты. Следовательно, необходимо добиваться повышения производительности другими средствами, отличными от повышения тактовой частоты больших монолитных ядер.

Решением является принцип "разделяй и властвуй" - разделение задачи на множество одновременных операций и их распределение между множеством небольших вычислительных устройств. В отличие от последовательного выполнения операций с максимально возможной тактовой частотой, процессоры с многопроцессорной обработкой на уровне кристалла будут обеспечивать высочайшую производительность при более приемлемых тактовых частотах благодаря параллельному выполнению множества операций. Новые Архитектуры смогут обойти проблемы, вызванные повышением тактовой частоты (увеличение тока утечки, несоответствие производительности процессора и памяти, а также проблемы фон-неймановского узкого места).

Специализированное аппаратное обеспечение.

Со временем многие важные функции, которые сейчас выполняются программным обеспечением или специализированными микросхемами, перейдут непосредственно к процессору. Это направление является движущей силой развития бизнес-моделей уже на протяжении 35 лет. Перенося выполнение функций на кристалл, образуется большой выигрыш в скорости, существенная экономия места и значительное сокращение энергопотребления. Связь с малыми задержками между специализированным аппаратным обеспечением и ядрами общего назначения может стать очень важной для того, чтобы удовлетворить потребности производительности и функциональности архитектур будущих процессоров и платформ.

Специализированное аппаратное обеспечение - важная составляющая архитектур будущих процессоров и платформ. Примеры таких устройств, реализованные в прошлом - вычисления с плавающей запятой, обработка графики и сетевых пакетов. В течение нескольких последующих лет в процессорах специализированное аппаратное обеспечение будет использоваться для широкого спектра задач. Возможные варианты включают: критические функциональные блоки приемопередатчиков для беспроводных сетей, цифровую обработку сигналов, рендеринг трехмерной графики, расширенную обработку изображений, распознавание речи и рукописного текста, расширенные функции безопасности, надежности и управления, обработка XML и других интернет-протоколов, извлечение информации, а также обработка естественных языков.

Подсистемы памяти большой емкости.

По мере постоянного роста производительности непосредственно процессоров доступ к памяти может стать серьезным "узким местом". Для того чтобы загрузить множество высокопроизводительных ядер соответствующим количеством данных, важно организовать подсистему памяти таким образом, чтобы память большой емкости находилась на кристалле и ядра имели к ней прямой доступ. Некоторые области памяти могут быть выделены определенным ядрам, совместно использоваться группами ядер или использоваться всеми ядрами глобально, в зависимости от потребностей приложений. Такая гибкая возможность изменения конфигурации необходима для того, чтобы ликвидировать "узкое место" производительности, когда множество ядер будет соперничать за доступ к памяти.

Микроядро.

Для управления всеми этими сложными процессами: назначением задач ядрам, включением и выключением ядер при необходимости, реконфигурацией ядер при изменении рабочей загрузки и многими другими микропроцессорам потребуется изрядная доля встроенных интеллектуальных способностей. В архитектурах с развитыми возможностями параллельной обработки процессор сам по себе сможет выполнять несколько потоков вычислений, невидимых на пользовательском уровне, разделяя приложение на потоки, которые могут выполняться параллельно. Один из способов эффективного выполнения всех этих задач - встроенное микроядро, дополняющее ПО высокого уровня для решения задач всестороннего управления аппаратным обеспечением.

Виртуализация.

Для работы микропроцессоров будущего потребуется несколько уровней виртуализации. Например, виртуализация необходима для того, чтобы скрыть сложную структуру аппаратного обеспечения от расположенного выше ПО. Виртуализация также будет использоваться для обеспечения управляемости, надежности и безопасности. Например, процессор можно разделить на множество виртуальных процессоров, часть из которых будет выделена для задач управления и безопасности, а остальные будут управлять приложениями.

Управление питанием и охлаждением.

Для этого будут использоваться несколько технологий. Как упоминалось выше, процессоры будут состоять из десятков и даже сотен небольших ядер с низкой потребляемой мощностью и интеллектуальным управлением питанием, которое сможет значительно сократить потери электроэнергии, позволяя процессору использовать только те ресурсы, которые нужны в данный момент .

Кроме этого, архитектура будет обеспечивать ультравысокую производительность без ультравысоких тактовых частот, что позволит обойти некоторые проблемы тока утечки, связанные с увеличением частоты. Задачи, критичные по времени, будут работать на быстрых ядрах с большей потребляемой мощностью, в то время как остальные - на более медленных с пониженным энергопотреблением.

Основная цель этих усовершенствований - построение архитектур с интеллектуальным управлением питанием, которое сможет автоматически реконфигурировать процессор с учетом потребностей питания и рабочей нагрузки.

Параллелизм.

Для того чтобы в полной мере получить преимущества от использования будущих архитектур, задачи должны быть существенно распараллелены - например, разделены на подзадачи, которые могут выполняться одновременно на множестве ядер. Сегодняшние одноядерные и многоядерные процессоры способны одновременно обслуживать всего несколько потоков. Будущие процессоры смогут обрабатывать множество потоков - сотни, а в некоторых случая даже тысячи. Некоторые задачи можно достаточно просто распараллелить (с небольшой помощью компиляторов), т. к. процессор и микроядро смогут обеспечить необходимую многопоточность. Например, в обработке изображений полное изображение можно разделить на множество отдельных областей, каждую из которых можно обрабатывать независимо и одновременно. К этой категории относится от 10 до 20% предполагаемых задач будущего. Вторая группа задач - около 60% - может быть распараллелена, если применить некоторые усилия.

Среди таких задач - некоторые приложения баз данных, извлечения информации, синтеза, обработки текста и голоса. Третья группа - задачи, распараллелить которые очень трудно: задачи с линейными алгоритмами, когда выполнение каждой стадии зависит от результатов выполнения предыдущей стадии. Анализируя сегодняшние потребности и тенденции, можно утверждать, что архитектура процессоров и платформ должна двигаться в направлении виртуализированной, реконфигурируемой архитектуры с большим числом ядер, богатым набором встроенных функциональных возможностей, большим объемом внутрикристальной памяти и интеллектуальным микроядром.

Следовательно, эволюция архитектур, сопровождаемая необходимостью увеличения объемов вычислений и строгим соблюдением совместимости с тысячами существующих приложений, создает уверенность в том, что процессоры и платформы в ближайшие годы станут основой для создания огромного количества фантастических и интеллектуальных новых приложений, которые изменят наш бизнес и образ жизни так, как мы даже не можем представить.

.2 Нанотехнологии

Нанотехнология - междисциплинарная область фундаментальной и прикладной науки и техники, имеющая дело с совокупностью теоретического обоснования, практических методов исследования, анализа и синтеза, а также методов производства и применения продуктов с заданной атомной структурой путём контролируемого манипулирования отдельными атомами и молекулами. Нанотехнологии в микроэлектронике - довольно горячо обсуждаемая в данное время тема, ей посвящены сотни научных конференций и семинаров в год. Только в 2002 и 2003 годах затраты Intel на проведение научных исследований в области нанотехнологий в микроэлектронике составили более 4 миллиардов долларов. Чтобы микропроцессоры с десятками и сотнями миллионов транзисторов не превратились попутно в микроволновые печи (а такая перспектива при работе процессоров на частотах в единицы ГГц, увы, есть), Intel ведет исследования в области нанотехнологий в микроэлектронике. Уже пал барьер геометрического разрешения в 0,1 мкм или 100 нм. А с помощью установок фотолитографии с жесткими ультрафиолетовыми лучами уже удалось получить разрешение менее 40-50 нм. Толщина диэлектрика полевых транзисторов ныне составляет менее 1,2 нм, что достигается созданием самоформирующихся слоев диэлектрика с толщиной в 3-5 атомных слоев. Для улучшения электрических характеристик кремния используется его растяжение (напряженный кремний), улучшающее атомарную структуру материала.

Вместо алюминия для проводников все чаще применяется медь - материал с меньшим удельным сопротивлением. Уже нынешний уровень развития нанотехнологий в микроэлектронике позволяет создавать пластины и даже трубки толщиной в атомный слой, так что возможности этого направления почти безграничны. Они и служат гарантией того, что закон Мура будет соблюдаться еще многие годы. Закон Мура (1975 год) гласит, что число интегральных транзисторов на кристаллах микросхем (прежде всего микропроцессоров) будет удваиваться каждые полтора-два года. Массовое распространение персональных ЭВМ изменило требования к программам. Главными из этих требований стали: простота правил работы, эстетичность, надежность программ, универсальность их функций, простота обучения работе на компьютерах.

Нанотехнологии в микроэлектронике развиваются уверенными шагами. В данное время в России создаются научные центры и открываются факультеты в ВУЗах, ориентированные на изучение нанотехнологий и их развитие.

Сейчас работы в области нанотехнологий ведутся в четырех основных направлениях:

молекулярная электроника;

биохимические и органические решения;

квазимеханические решения на основе нанотрубок;

квантовые компьютеры.

Молекулярная электроника.

Возможность использования молекулярных материалов и отдельных молекул как активных элементов электроники уже давно привлекает внимание исследователей различных областей науки. Однако только в последнее время, когда стали практически ощутимы границы потенциальных возможностей полупроводниковой технологии, интерес к молекулярной идеологии построения базовых элементов электроники перешел в русло активных и целенаправленных исследований, которые стали сегодня одним из важнейших и многообещающих научно-технических направлений электроники.

Дальнейшие перспективы развития электроники связываются с созданием устройств, использующих квантовые явления, в которых счет уже идет на единицы электронов. В последнее время широко ведутся теоретические и экспериментальные исследования искусственно создаваемых низкоразмерных структур; квантовых слоев, проволок и точек. Ожидается, что специфические квантовые явления, наблюдающиеся в этих системах, могут лечь в основу создания принципиально нового типа электронных приборов.

Основное внимание было сосредоточено на молекулярных системах не случайно. Во-первых, молекула представляет собой идеальную квантовую структуру, состоящую из отдельных атомов, движение электронов по которой задается квантово-химическими законами и является естественным пределом миниатюризации. Другой, не менее важной особенностью молекулярной технологии, является то, что создание подобных квантовых структур в значительной мере облегчено тем, что в основе их создания лежит принцип самосборки. Способность атомов и молекул при определенных условиях самопроизвольно соединяться в наперед заданные молекулярные образования является средством организации микроскопических квантовых структур; оперирование с молекулами предопределяет и путь их создания. Именно синтез молекулярной системы является первым актом самосборки соответствующих устройств. В настоящее время ведется интенсивный поиск концепций развития молекулярной электроники и физических принципов функционирования, и разрабатываются основы построения базовых элементов. Для решения поставленных задач и концентрации усилий исследователей, работающих в различных областях знаний, во всех индустриально развитых странах создаются Центры молекулярной электроники, объединенные лаборатории, проводятся международные конференции и семинары.

Биохимические и органические решения.

Сегодня биофизики обнаружили уже более пятидесяти соединений, на основе которых могут быть построены процессоры-модели различных нелинейных задач. Отдельного внимания заслуживают разработки нового типа процессора - белкового.

Управление у белкового процессора химическое: воздействуя на него различными веществами, можно регулировать законы распространения волны - получить волну, развитие которой описывается теми же уравнениями, что и исследуемые процессы. Словом, с помощью таких процессоров можно моделировать нелинейные задачи, недоступные сегодня даже самым быстродействующим компьютерам. Причем решение получается в считанные секунды. Ведь ответ на задачу - поведение самой волны.

Каждая частица белка на подложке процессора имеет диаметр всего в 50 мкм и занимает площадь меньшую, чем транзистор на подложке интегральной микросхемы. Можно подсчитать: на подложке площадью в одинквадратный сантиметр умещается 1012 таких вычислительных белковых ячеек. В образование волны за одну секунду вовлекаются 1012 частиц. Если пересчитать это на скорость вычислений обычной, цифровой вычислительной машины, получится весьма хорошее быстродействие - миллион операций в секунду. Это, кстати, если волна движется со скоростью всего, лишь в одну десятую миллиметра в секунду. А ведь движение может быть и быстрее - скорость распространения волны зависит от веществ, входящих в состав белков. Сама волна, как сказано выше - решение задачи. Но как прочесть это решение? Ученые решили и эту проблему. Им удалось сделать волну зримой. То есть ее движение сопровождает либо изменение цвета, либо излучение световых волн. Так что за волной-ответом можно с высокой точностью следить с помощью оптических устройств. Уже сегодня можно говорить о новом поколении вычислительных устройств- гибридах электронной техники и биологии. И не будем забывать: работа биофизиков по созданию живых вычислителей сегодня в самом начале.

Квазимеханические решения на основе нанотрубок.

Углеродные нанотрубки (НТ) - своеобразные цилиндрические молекулы диаметром примерно от половины нанометра и длиной до нескольких микрометров. Эти полимерные системы впервые обнаружили менее 10 лет назад как побочные продукты синтеза. Тем не менее уже сейчас на основе углеродных нанотрубок создаются электронные устройства нанометрового (молекулярного) размера. Ожидается, что в обозримом будущем они заменят элементы аналогичного назначения в компьютерах. В результате будет достигнут теоретический предел плотности записи информации (порядка одного бита на молекулу) и вычислительные машины обретут практически неограниченную память и быстродействие, лимитируемое только временем прохождения сигнала через прибор.

Существует 2 основных типа нанотрубок: одностенные нанотрубки ОСНТ (single-walled nanotubes - SWNT), у которых одна оболочка из атомов углерода, и многостенные МСНТ (multi-walled nanotubes - MWNT), которые состоят из множества сгруппированных углеродных трубок. Нанотрубки склонны крепко слипаться между собой, формируя набор или "канат", состоящий из металлических и полупроводниковых нанотрубок. Металлические проводящие ток нанотрубки могут выдерживать плотности тока в 100 раз выше, чем обычные металлы, а полупроводниковые нанотрубки можно электрически включать и выключать посредством поля, генерируемого электродом, что позволяет создавать полевые транзисторы.

Квантовые компьютеры.

Фейнман высказал мысль о том, что квантовые задачи должен решать квантовый компьютер: природе задачи должен соответствовать способ ее решения. И предложил один из вариантов квантового компьютера. Но настоящий бум начался в 1995 году, когда американский математик Шор переложил для квантового компьютера алгоритм вычисления простых множителей больших чисел.

Шор показал, что если классический компьютер для нахождения множителей числа из 1000 двоичных знаков должен сделать 2 в степени 1000 операций, то квантовому компьютеру для этого понадобится всего 1000 в степени 3 операций.

Компьютер на ядерно-магнитном резонансе.

Теоретических моделей квантового компьютера множество. Проблема, скорее, в том, чтобы найти разумные пути создания реального прибора. Существует как минимум два подхода к осуществлению идеи такого устройства. Ученые, сами того не предполагая, уже создали квантовый компьютер. Его первый "опытный образец" - это импульсный ядерный магнитно-резонансный (ЯМР) спектрометр высокого разрешения. При воздействии импульсом на резонансной частоте одного из ядер оно начинает эволюционировать, остальные же ядра "молчат". Для того чтобы заставить эволюционировать второй атом, надо взять другую частоту и дать импульс на ней. Иными словами, процесс вычислений управляется импульсами переменного магнитного поля, - нужно только написать алгоритм поставленной задачи.

Компьютер на ионных ловушках.

Этот подход основан на использовании ионных ловушек, или "подвешенных" в вакууме ионов. Больше всего экспериментов по квантовым вычислениям с использованием таких кристаллов предложили ученые Инсбрукского университета в Австрии, а осуществили их больше всего ученые из Лос-Аламосской лаборатории в США. И оказалось, что больших кристаллов не удается получить, на сегодняшний день получена цепочка из 30 ионов. Но дальнейший прогресс в увеличении числа ионов связывают с созданием трехмерной лазерной стоячей волны созданием трехмерной лазерной стоячей волны - трехмерной совокупности точек с минимумами потенциальной энергии для поляризованных атомов. Конечно, в этом направлении очень много работы, но само направление - верное.

Квантовый компьютер на твердом теле.

Это могут быть сверхпроводники, как предлагают ученые из Института Ландау. Предпочтительнее же подход, который в позапрошлом году высказал австралийский физик Кейн: делать квантовый компьютер на точно таком же кремнии, на котором сегодня работает традиционная микроэлектроника. В нужных местах на расстояниях порядка 100 мкм располагают атомы фосфора - обычная примесь в кремнии, которая прекрасно изучена. Если на таком расстоянии расположить два атома фосфора, то облака внешних электронов немного пересекутся, что необходимо для их взаимодействия, и атомы смогут обмениваться состояниями (один атом управляет электронами другого). Очень похоже на полевой транзистор - те же затворы, только вместо тока - состояния атома.

Глава 3. Сравнительные характеристики процессоров

.1 Процессоры Intel на ядре Clarkdale

Ценовое позиционирование двухъядерного CPU Intel Core i3-530 представляется намного более взвешенным и обоснованным по сравнению с его собратом Intel Core i5-661. Недорогой Intel Core i3-530 унаследовал от линейки Clarkdale поддержку технологии Intel Hyper-Threading с возможностью создания виртуальных ядер, интегрированный контроллер памяти DDR3 и большой потенциал производительности, заложенный в новейшей архитектуре Intel. Уникальность процессоров на ядре Clarkdale состоит в том, что они содержат два кристалла: на одном располагаются два 32 нм вычислительных ядра Westmere и кэш-память, а на другом 45 нм графическое ядро, встроенный контроллер памяти и контроллер PCI Express. Процессоры на ядре Clarkdale работают на Socket LGA1155 и Socket LGA1156 платформах, однако использовать возможности встроенного графического ядра позволяют только материнские платы с сокетом LGA1155.

Краткая характеристика процессоров линейки Clarkdale показаны в таблице 1.

Таблица 1. Краткая характеристика процессоров Intel линейки Clarkdale.

Модель	Ядер	Потоков	Номинальная частота ядра	Частота Turbo	Кэш L3	Потребление энергии	Цена $
Core i3-530	2	4	2.93 ГГц	-	4 Мб	73 Вт	113
Core i5-661	2	4	3.33 ГГц	3.60 ГГц	4 Мб	87 Вт	196
Core i7-920	4	8	2.66 ГГц	2.93 ГГц	130 Вт	284

Относительно недорогой Intel Core i3-530 инженеры Intel лишили возможности при определённых условиях автоматически поднимать тактовую частоту - такую функциональность обеспечивает технология Intel Turbo Boost. Правда, при этом его стандартная частота составляет немалые 2,93 ГГц, что само по себе неплохо. Тепловой пакет Intel Core i3-530 заявлен на уровне 73 Вт и соответствует аналогичному показателю других моделей линейки, за исключением Intel Core i5-661 87 Вт (в данном случае повышенное тепловыделение обусловлено более высокой частотой работы встроенного видеоядра, которая составляет 900 МГц - против 733 МГц у других моделей). В тестировании участвовали оба процессора, а также CPU Intel Core i7-920.

.2 Процессоры AMD

Спустя некоторое время после дебюта процессоров Intel на ядре Clarkdale компания AMD провела масштабное обновление практически всей своей линейки процессоров. Обращают на себя внимание сразу два обстоятельства: во-первых, были представлены одновременно пять новых моделей CPU; во-вторых, по сравнению с предыдущими моделями, тактовая частота была повышена всего на 100 МГц. Таким образом, обновление происходило широким фронтом и сопровождалось небольшим снижением цены в сочетании с некоторыми улучшениями. CPU серии Athlon II X2 базируются на появившемся сравнительно недавно кристалле Regor с двумя вычислительными ядрами (как у некоторых CPU Phenom II), для каждого из которых предусмотрена индивидуальная кэш-память второго уровня объёмом 1 МБ. Эти CPU лишены кэша L3, что является характерной особенностью всего модельного ряда Athlon II. Потенциал разгона процессоров Regor не поражает воображение, зато сам кристалл имеет небольшие размеры и характеризуется низким энергопотреблением в сочетании с малой себестоимостью. Так, AMD Athlon II X2 255 тактован на 3,1 ГГц, имеет TDP 65 Вт и стоит всего $74 - неплохое сочетание цены и качества.

Как бы то ни было, трёхъядерники и четырёхъядерники от AMD являются достойными соперниками для семейства Intel Core i3. Хотя AMD пока не может обеспечить тот же уровень вычислительной мощности с помощью двух ядер, она вполне способна предложить за те же деньги большее количество процессорных ядер с некоторыми издержками в виде повышенного энергопотребления и тепловыделения . Тестировались: Athlon II Х3 440, Athlon II Х4 635, Phenom II Х4 965 (таблица 2).

Таблица 2. Краткая характеристика процессоров AMD

Модель	Ядер	Номинальная частота ядра	Кэш верхнего уровня	Потребление энергии	Цена $
Athlon II X3 440	3	3.0 ГГц	3х512 Кб L2	95 Вт	84
Athlon II Х4 635	4	2.9 ГГц	4х512 Кб L2	95 Вт	119
Phenom II Х4 965	4	3.4 ГГц	6 Мб L3	125 Вт	195

.3 Сравнение характеристик

Тестовое ПО: SiSoft Sandra 2010.1.16.11, Prime95, Stream Memory Bandwidth, 64-битная версия CPU-Z 1.52.2, WorldBench 6 Gold, Valve VRAD map build benchmark, Panorama Factory, Cinebench. Использованное программное обеспечение, представляется в широком доступе. Для большинства тестов использовался режим питания "сбалансированный" (Balanced), подразумевающий включение энергосберегающих функций SpeedStep и Cool'n'Quiet. Тестирование показало, что включение SpeedStep и Cool'n'Quiet не влияет негативно на производительность современных CPU. Это особенно актуально с учётом того, что в большинстве случаев современные компьютерные системы используют эти режимы. Единственным случаем, когда функции энергосбережения были отключены, стало измерение задержки кэш-памяти; в остальных ситуациях их отключение не имело смысла.

Для обеспечения чистоты эксперимента и получения объективных данных были приняты все необходимые меры. Проход каждого теста осуществлялся три раза с последующим усреднением полученных данных.

Общая производительность системы.

С недавнего времени в составе тестового программного обеспечения появился пакет PC WorldBench. При работе с ним возникали ситуации, когда невозможно было получить повторяющихся устойчивых результатов. Было обнаружено, что WorldBench проявляет крутой нрав и периодически отказывается корректно работать. Также было замечено, что в одних и тех же тестах могут получаться разные результаты, и далеко не всегда это обусловлено различием в уровне производительности процессоров. Некоторые бенчмарки в составе PC WorldBench 6, такие как Windows Media Encoder 9, не оптимизированы под многопоточность, хотя современные версии подобного рода приложений в большинстве своём умеют использовать все преимущества многоядерности/многопоточности. По этой причине было решено воспользоваться только некоторыми тестами в составе PC WorldBench.

Тестовый модуль MS Office Productivity помогает получить представление о реальной производительности системы при работе с приложениями офисного пакета Microsoft Office 2003 SP-1 (Приложение А, Таблица 3). В ходе тестирования осуществлялось симулирование работы в многозадачной среде посредством переключения между несколькими офисными приложениями. В данном случае польза от дополнительных вычислительных ядер минимальна, поэтому результаты для различных моделей разнятся не более чем на 20%.

Одновременная работа с Firefox и Windows Media Encoder.

В тесте выполняется кодирование видео в фоновом режиме с активным интернет-браузером Firefox (Приложение А, Таблица 4). Работа ещё одного приложения в фоновом режиме незначительно отразилась на результатах предыдущего теста.

Потребляемая мощность и энергоэффективность.

Потребляемая мощность играет очень важную роль в комплексной оценке производительности современных процессоров. Этот показатель особенно актуален с учётом проводимого сравнительного анализа для определения лидера в модельных парах, составленных конкурирующими решениями. Для оценки мощности, потребляемой системой на протяжении определённого промежутка времени, использовался анализатор Extech 380803. Замеры производились в точке подключения системы к питающей сети. Таким образом, полученные результаты отражают данные по энергопотреблению системы в целом, в том числе процессора, материнской платы, подсистемы памяти, графической подсистемы, жёстких дисков (питание монитора осуществлялось по отдельной линии).

Для большей наглядности результаты представлены на двух графиках (диаграммы 1 и 2).

На диаграмме 1(Приложение Ж) представлена потребляемая мощность процессора AMD.

На диаграмме 2 (Приложение И) представлена потребляемая мощность процессора Intel.истемная конфигурация на базе Phenom II демонстрирует показатели на уровне Intel Core i7-920.

Таблица 5 (приложение К) содержит средневзвешенные результаты тестирования на пиковое потребление мощности, характеризующие работу системы при рендеринге 3D-сцены в течение 10 секунд в промежутке между 15-й и 25-й секундами.

В этом тесте лидерство Intel проявляется в ещё большей степени. Сравнение данных по Intel Core i5-661 и Athlon II Х4 635 показывает, что система на базе AMD Athlon II Х4 635 потребляет на 28 Вт больше. Сравнение полученных результатов говорит о большом прогрессе, достигнутом в области эффективного расходования электроэнергии. Так, система на базе самого раннего решения от Intel в составе тестового набора потребляет в 7,5 раз больше энергии по сравнению с системой на основе самого передового в этом смысле CPU Intel Core i7-920.

Очевидно, что переход от одного вычислительного ядра к четырём сопровождался существенным повышением уровня энергетической эффективности, хотя стремительный прогресс в этой области обусловлен также и рядом других усовершенствований.

Разгон.

Был проведён комплекс мер по определению максимально возможного значения тактовой частоты процессора, при котором будет возможна стабильная работа системы. Процедура разгона включала в себя изменение базовой частоты, повышение напряжения питания процессора и уменьшение множителя частоты памяти с соответствующим температурным мониторингом. При каждом новом повышении тактовой частоты запускался тест стабильности Prime95.

Следуя стандартной процедуре, частоту Intel Core i5-661 удалось поднять до невероятных 4,5 ГГц при 1,4 В, что означает 50% повышение по сравнению со штатным значением 3,3 ГГц. В ходе манипуляций с базовой частотой (133 МГц) и множителем памяти было подобрано максимальное значение тактовой частоты процессора, при котором система функционировала стабильно. При достижении уровня 4,15 ГГц стало заметно, что CPU сильно греется, а стандартный кулер от Intel не успевает отводить тепло. В тесте на предельную нагрузку 661-я модель работала без сбоев, но нагревалась до 74°C. Перегрев был вызван тем, что в BIOS Setup материнской платы ASUS значение напряжения питания процессора было установлено в положении AUTO. Таким образом, к тому моменту, когда частота CPU достигла максимального уровня, напряжение питания ядра автоматически поднялось до 1,4 В против штатных 1,16 В (надо отдать должное интеллектуальным способностям утилиты). Что касается штатного кулера Intel, то подобного рода разгон предполагает обязательное применение более производительной модели.

Результат представлен на рисунке 7.(Приложение Л). Воодушевляющие результаты для Core i5-661 позволили предположить, что в случае с Core i3-530 удастся достичь того же уровня. Разгон Intel Core i3-530 позволил добиться его стабильной работы при значении базовой частоты 200 МГц и соответствующей тактовой частоте процессора 4,4 ГГц. Таким образом, и в этом случае удалось достичь почти 50% прироста производительности С повышением тактовой частоты до 4,4 ГГц BIOS автоматически поднял напряжение питания до 1,4 В. Для того, чтобы оценить, насколько точно и корректно утилита способна регулировать напряжение питания, был проведён эксперимент по определению минимального значения напряжения питания CPU, при котором система сможет функционировать стабильно. Вручную выставив значение 1,237 В (для 4,4 ГГц), была произведена перезагрузка системы, но её работа оказалась нестабильной. Методом подбора было найдено искомое значение - 1,387 В.

Полученный результат говорит о том, что при работе с процессорами Clarkdale утилита BIOS прекрасно справилась со своими обязанностями, продемонстрировав способности грамотно управлять напряжением питания процессора.

Результат представлен на рисунке 8. (Приложение М)Athlon II X4 635 разгонялся менее охотно. Тем не менее, его частоту удалось поднять со стандартных 2,9 ГГц (1,4 В) до 3,48 ГГц (1,45 В). При этом использовался мощный. Результат представлен на рисунке 9.(Приложение Н)

В таблице 10 (приложение П), в разогнанном состоянии (с использованием Dirt) процессоры Clarkdale просто "летают", демонстрируя производительность на уровне самых быстрых CPU.

Говоря о разгоне, нельзя обойти вниманием такой немаловажный момент, как сопутствующее ему повышенное энергопотребление. Полученные результаты говорят о том, что современные CPU обладают высоким потенциалом для разгона (хотя при этом он ограничивается максимальным уровнем напряжения и тепловыделения, т.е. процессор может в буквальном смысле сгореть). Как бы то ни было, разгон можно считать вполне оправданным, даже несмотря на неизбежное повышение расхода электроэнергии. Если посмотреть на результаты теста, можно заметить, что система на базе разогнанного Intel Core i3-530 потребляет энергии меньше, чем тестовая конфигурация с неразогнанным Intel Core i7-920. Таким образом, энергопотребление дорогих высокопроизводительных процессоров Intel или AMD и их более доступных собратьев в состоянии разгона находится в пределах одного диапазона. В самой процедуре разгона нет ничего сложного, разве что кулер нужно будет заменить на более мощный.

Оптимальный вариант.

Теперь можно дать оценку каждой из тестируемых моделей процессоров с точки зрения комплексного анализа её потребительских свойств. К этой чрезвычайно важной задаче следует отнестись со всей ответственностью, поскольку существует опасность допустить ошибку при расчётах, некорректно сформулировать мысль или исказить эмоциональную составляющую оценки.

Прежде всего, данные для каждого CPU по каждому бенчмарку были собраны воедино и переведены в процентную систему счисления, где в качестве базового уровня (100%) был взят классический Intel Pentium 4 670. В ситуациях, когда один тест включает в себя несколько модулей/сценариев, рассчитывалось средневзвешенное значение с учётом результатов по каждому из них. Таким образом соблюдался принцип равенства всех бенчмарков и результатов, полученных в каждом из них.

Индекс общей производительности получен методом простого учёта всех данных по всем тестам и не предполагает подробного анализа в аспекте приоритетности или других подобных "изысков". Вместе с тем тестовый пакет формировался с прицелом на максимально полный охват, поэтому итоговый рейтинг производительности позволяет получить достаточно полное представление о тестируемых CPU. Следующий этап анализа включает в себя сбор данных о стоимости CPU, содержащихся в официальных прайс-листах Intel и AMD (цены определялись по данным официальных сайтов). Стоимости указаны на момент их появления в розничной продаже. Если взять общую производительность по каждому CPU и поделить на цену, то полученные результаты будут выглядеть так, как показано в приложении П (таблица 11). Эти результаты позволяют получить достаточно полное представление об оценке каждого из процессоров с точки зрения производительности на доллар цены - и здесь CPU из семейства Athlon II выглядят лучше других. В этих условиях особую актуальность приобретает проблема оптимального соотношения цены и качества, поэтому был подготовлен график, отражающий именно этот аспект: соотношение "цена/производительность. Этот график удобен тем, что позволяет найти наиболее производительное решение в определённом ценовом диапазоне. За основу взят Pentium 4-670, как 100% производительности (Приложение Р, график 1).

Заключение

Итак, вследствие проведенного исследования необходимо отметить, что, ученые и инженеры успешно преодолевают барьеры на пути повышения производительности элементов и систем. Они предлагают различные пути решения встающих перед компьютерной отраслью проблем. Это и улучшение полупроводниковых техпроцессов, и совершенствование архитектуры высокочастотных микросхем, и внедрение перспективных технологий, и даже поиск путей модификации конструкций системных блоков.

За счёт того, что современные процессоры очень быстры, переключение между задачами обычно остаётся незаметным на взгляд пользователя. Однако существуют и приложения, прервать которые для передачи процессорного времени другим задачам в очереди достаточно сложно. В этом случае операционная система начинает подтормаживать, что нередко вызывает раздражение у человека, сидящего за компьютером. Также, нередко можно наблюдать и ситуацию, когда приложение, забрав ресурсы процессора, "зависает", и такое приложение бывает очень тяжело снять с выполнения, поскольку оно не отдаёт процессорные ресурсы даже планировщику операционной системы.

Подобные проблемы возникают в системах, оснащённых многоядерными процессорами, на порядок реже. Дело в том, процессоры с несколькими ядрами способны выполнять одновременно несколько вычислительных потоков, соответственно, для функционирования планировщика появляется больше свободных ресурсов, которые можно разделять между работающими приложениями. Фактически, для того, чтобы работа в системе с многоядерным процессором стала некомфортной, необходимо одновременное пересечение процессов, пытающихся захватить в безраздельное пользование все ресурсы CPU.

Исходя из проделанной работы, можно сделать следующие выводы:

ученые и инженеры успешно преодолевают барьеры на пути повышения производительности элементов и систем;

достигнутая степень интеграции позволяет строить параллельные системы, в которых число процессоров может достигать десятков тысяч;

ввиду того, что технология виртуальной многопоточности, Hyper-Threading присутствует в процессорах Intel уже очень продолжительно время, разработчики программного обеспечения к настоящему времени предлагают достаточно большое число программ, способных получить выигрыш от многоядерной архитектуры CPU;

основная цель будущей нанотехнологии, по всей вероятности, - создание структур, способных к эволюции и саморазвитию;

идея объединения нескольких ядер в одном процессоре продемонстрировала свою состоятельность на практике;

среди приложений, скорость работы которых на многоядерных процессорах будет увеличена, следует отметить утилиты для кодирования видео и аудио, системы 3D моделирования и рендеринга, программы для редактирования фото и видео, а также профессиональные графические приложения класса САПР;

Наиболее значимые практические результаты достигнуты в области молекулярной электроники. Она логически близка к традиционной полупроводниковой электронике. Методами молекулярной электроники из углеводородных соединений удается получить аналоги диодов и транзисторов, а следовательно, и основные булевы модули И, ИЛИ и НЕ, из которых затем можно строить схемы любой сложности. Подобный подход позволяет сохранить преемственность архитектурных решений.

Глоссарий

№ п/п	Понятие	Определение
1.	SpeedStep	Энергосберегающая технология Intel, в основе которой лежит динамическое изменение частоты и энергопотребления процессора в зависимости от используемого источника питания
2.	TDP	Величина, показывающая, на отвод какой тепловой мощности должна быть рассчитана система охлаждения процессора или другого полупроводникового прибора.
3.	Диэлектрик	Материал, плохо проводящий или совсем не проводящий электрический ток. Основное свойство диэлектрика состоит в способности поляризоваться во внешнем электрическом поле.
4.	Квантовый компьютер	Вычислительное устройство, работающее на основе квантовой механики.
5.	Легирование	Добавление в состав материалов примесей для изменения физических и химических свойств основного материала.
6.	Рендеринг	Термин в компьютерной графике, обозначающий процесс получения изображения по модели с помощью компьютерной программы.
7.	Репрезентативная выборка	Выборка, в которой все основные признаки генеральной совокупности, из которой извлечена данная выборка, представлены приблизительно в той же пропорции или с той же частотой, с которой данный признак выступает в этой генеральной совокупности.
8.	Термическое оксидирование	Процесс создания оксидной плёнки (диоксида кремния SiO2) на поверхности кремниевой подложки.
9.	Транзистор	Трёхэлектродный полупроводниковый электронный прибор, в котором ток в цепи двух электродов управляется третьим электродом.
10.	УФ-излучение	Электромагнитное излучение, занимающее диапазон между фиолетовым концом видимого излучения и рентгеновским излучением. Диапазон условно делят на ближний (380-200 нм) и дальний, или вакуумный (200-10 нм) ультрафиолет.
11.	Флуктуация	Любое колебание или любое периодическое изменение. В квантовой механике - случайные отклонения от среднего значения физических величин, характеризующих систему из большого числа частиц; вызываются тепловым движением частиц или квантовомеханическими эффектами.
12.	Фон-неймановское узкое место	Ограничение производительности из-за последовательного потока вычислений.
13.	Фотолитография	Метод получения рисунка на тонкой плёнке материала. Один из основных приёмов планарной технологии, используемой в производстве полупроводниковых приборов.
14.	Фоторезист	Полимерный светочувствительный материал.
15.	Эпитаксия	Закономерное ориентированное наращивание одного кристаллического материала на поверхности другого (подложки).

Список использованных источников

1. Байцер, Б. Архитектура вычислительных комплексов. [Текст] / Б. Байцер. - М.: Мир, 2010. - 241 с. - ISBN 5-3269-7763-7.

. Басманов А.С., Широков Ю.Ф. Микропроцессоры и однокристальные микроЭВМ: Номенклатура и функциональные возможности. [Текст] / Под А.С. Басманов, Ю.Ф. Широков. - М.: Энергоатомиздат, 2009.-127 с.- ISBN 5-6248-3548-4.

. Балашов Е.П., Григорьев В.Л., Петров Г.А. Микро- и миниЭВМ. [Текст] Е.П. Балашов, В.Л. Григорьев, Г.А. Петров.- Л.: Энергоатомиздат, 2009. -376 с.- ISBN 5-235-48355-4.

. Бачило А.Г., Ткаченко И.А. Два путешествия с компьютером [Текст] / А.Г. Бачило, И.А. Ткаченко - М.: Мол. гвардия, 2009. - 271 с. - ISBN 5-235-00912-6.

. Белунцов В.О. Железо ПК [Текст] / В.О. Белунцов. - СПб.: Десс, 2010. - 196 с. - ISBN: 5-9604-0006-7.

. Влох О.Г. Явления пространственной дисперсии в параметрической кристаллооптике [Текст] / О.Г. Влох.- М.: БИНОМ, 2010.- 212с.- ISBN 5-154789-25-7.

. Вуд А. Микропроцессоры в вопросах и ответах. [Текст] / А. Вуд.- М.: Энергоатомиздат, 2009. -185 с. - ISBN 5-57468-105-6.

. Быков С.Е. Производительность ПК [Текст] / С.Е. Быков. - СПб.: Десс, 2010. - 187 с. - ISBN: 5-8904-1876-7.

. Гивоне Д., Россер Р. Микропроцессоры и микрокомпьютеры: Вводный курс [Текст] / Д. Гивоне.- М.: Мир, 2011.- 463 с. - ISBN 5-6378-4782-1.

. Денисов Т.В. Обзор МП [Текст] / Т.В. Денисов. - М.: Наука, 2010.-102 с. - ISBN 5-862241-15-8.

. Еременко В.В. Магнитные и магнитоупругие свойства антиферромагнетиков и сверхпроводников [Текст] / В.В. Еременко, В.А. Сиренко. - К.: Наук. думка, 2010.- 294 с.- ISBN 5-489751-45-5.

. Кобаяси Н. Введение в нанотехологию [Текст] / Н. Кобаяси. - М.: БИНОМ, 2009. - 134 с. - ISBN 5-4021-4320-5.

. Корнеев В.В. Современные микропроцессоры. [Текст] / В.В. Корнеев. - М.: Нолидж, 2010. - 240 с. - ISBN 5-3456-1103-7.

. Кукин В.Н. Информатика: организация и управление [Текст] / В.Н. Кукин. - М.: Экономика, 2009. - 198 с. - ISBN 5-499246-45-5.

. Леонтьев В.П. Персональный компьютер. Карманный справочник [Текст] / В.П. Леонтьев. - М.:ОЛМА-ПРЕСС, 2011. - 239 с. - ISBN 5-793241-21-1.

. Майоров С.И. Информационный бизнес: коммерческое распространение и маркетинг [Текст] / С.И. Майоров. - М.: Финансы и статистика, 2011. - 256 с. - ISBN 5-293625-17-8.

. Мураховский В.И. Железо ПК. Новые возможности [Текст] / В.И. Мураховский. - СПб.: Питер, 2009. - 592 с. - ISBN: 5-469-01056-2.

. Нестеров П.В. Микропроцессоры. Архитектура и ее оценка. [Текст] / П.В. Нестеров. - М.: Высшая школа, 2010.- 104 с.- ISBN 5-93037-104-0.

. Петров А.А. Нанотехнологии. [Текст] / А.А. Петров. - М.: СОЛОН-Пресс, 2009. - 115 с. - ISBN 5-742941-25-7.

. Семененко В.А., Ступин Ю.В. Справочник по электронной вычислительной технике [Текст] / справ. пособие для проф. учеб. заведений / В.А. Семененко, Ю.В. Ступин. - М.: Машиностроение, 2011. - 224 с.- ISBN 5-217-02090-3.

. Соучек Б. Микропроцессоры и микроЭВМ [Текст] / Б. Соучек. - М.: Сов. радио, 2012. - 517 с. - ISBN 5-154-12874-4.

. Стин Э. Квантовые вычисления [Текст] / Э. Стин. - М.: РХД, 2009. - 111 с. -ISBN 5-4987-7168-4.

. Уокерли Дж. Архитектура и программирование микроЭВМ [Текст] / Дж. Уокерли. - М.: Мир, 2010. - 486 с. - ISBN 5-4779-0245-3.

. Фигурнов В.Э. IBM PC для пользователя [Текст] / В.Э. Фигурнов. - М.: ИНФРА М 2009. 475 с. - ISBN 5-2468-4452-2.

. Франк-Каменецкий М.Д. Биофизика молекулы ДНК: одно из новых аправлений [Текст] / М.Д. Франк-Каменецкий. - М.: ИНФРА-М, 2011-187 с. - ISBN 5-30-456875-7.

. Хасэгава Х. - Мир компьютеров в вопросах и ответах [Текст] / Х. Хасэгава. - М.: Мир, 2011 - 118с.- ISBN 5-03-000485-8.

. Хлебалина Е. Информатика: энциклопедия [Текст] / Е. Хлебалина. - М.: ИНФРА-М, 2011. - 460 с. - ISBN 5-169874-65-3.

. Хомоненко А.Д. Основы современных компьютерных технологий А.Д. Хомоненко. - СПб.: КОРОНА, 2012. - 446 с. - ISBN 5-7931-0019-9.

. Открытая электронная энциклопедия Wikipedia [Электронный ресурс] / Процессор - Режим доступа: #"787556.files/image001.gif">

Рисунок 1. Внешний вид монокристалла.

Приложение Б