Для того чтобы понять, как работает микропроцессор, зададим себе во­прос - а как он должен работать? Есть теория (в основном созданная пост­фактум: после того, как первые ЭВМ были уже построены и функционирова­ли), которая указывает, как именно строить алгоритмы, и что процессор в соответствии с этим должен делать. Мы, естественно, углубляться в это не будем, просто констатируем, что любой алгоритм есть последовательность неких действий, записанных в виде набора последовательно выполняемых команд (инструкций, операторов). При этом среди таких команд могут встре­чаться команды перехода, которые в некоторых случаях нарушают исходную последовательность выполнения операторов строго друг за другом. Среди прочих должны быть также команды ввода и вывода данных (программа должна как-то общаться с внешним миром?), а также команды выполнения арифметических и логических операций.

Команды должны где-то храниться, поэтому неотъемлемой частью всей сис­темы должно быть устройство памяти программ. Где-то надо складывать и данные, как исходные, так и результаты работы программы, поэтому должно быть устройство памяти данных. Так как команды и данные, в конечном сче­те, все равно есть числа, то память может быть общая, только надо уметь от­личать, где именно у нас команды, а где - данные. Это есть один из прин­ципов фон Неймана, хотя и в микроконтроллерах, о которых мы будем говорить в дальнейшем, традиционно используют не фон-неймановскую, а так называемую гарвардскую архитектуру, когда память данных и программ разделены (это разделение, впрочем, может в определенных пределах нару­шаться). Процессор, построенный по фон Нейману, более универсален, на­пример, он позволяет без особых проблем наращивать память, строить ее ие­рархически и более эффективно ее перераспределять прямо по ходу работы. Например, в системе Windows всегда предполагается, что компьютер имеет практически неограниченный объем памяти (измеряемый в терабайтах), а если ее реально не хватает, к делу подключается своп-файл на жестком дис­ке. В то же время микроконтроллерам подобная гибкость не особенно требу­ется - на их основе, как правило, строятся узлы, выполняющие конкретную задачу и работающие по конкретной программе, так что нужную конфигура­цию системы ничего не стоит предусмотреть заранее.

МП и МК

Кстати, а почему мы все время говорим то микропроцессоры (МП), то микро­контроллеры (МК)? Микроконтроллер отличается от микропроцессора тем, что он предназначен для управления другими устройствами, и поэтому имеет встроенную развитую систему ввода-вывода, но, как правило, относительно более слабое АЛУ. Микроконтроллерам очень хорошо подходит термин, кото­рый в советское время имел, правда, несколько иное значение- «микро-ЭВМ», еще точнее звучит английское «computer-on-chip», однокристальный компьютер. В самом деле, для построения простейшего вычислительного уст­ройства, которое могло бы выполнять что-то полезное, обычный микропроцес­сор, от i4004 до Pentium и Core Duo, приходится дополнять памятью, ПЗУ с за­писанной BIOS, устройствами ввода-вывода, контроллером прерываний, тактовым генератором с таймерами и т. п. - всем тем, что сейчас стало объе­диняться в т. н. «чипсеты». «Голый» МП способен только одно: правильно включиться, ему даже программу загрузки неоткуда взять.

В то же время для МК микропроцессор - это только ядро, даже не самая большая часть кристалла. Для построения законченной системы на типовом МК не требуется вообще ничего, кроме источника питания и периферийных исполняющих устройств, которые позволяли бы человеку определить, что сис­тема работает. Обычный МК может без дополнительных компонентов общать­ся с другими МК, внешней памятью, специальными микросхемами (вроде ча­сов реального времени или флэш-памяти), управлять небольшими (а иногда - и большими) матричными панелями, к нему можно напрямую подключать дат­чики физических величин (в том числе - чисто аналоговые, АЦП тоже часто входят в МК), кнопки, клавиатуры, светодиоды и индикаторы, короче- в микроконтроллерах сделано все, чтобы приходилось как можно меньше паять и задумываться над подбором элементов. За это приходится расплачиваться пониженным быстродействием (которое, впрочем, не так-то уж и важно в ти­повых задачах для МК) и некоторым ограничением в отдельных функциях - по сравнению с универсальными, но в сотни раз более дорогими и фомоздки-ми системами на «настоящих» МП. Вы можете мне не поверить, но процессо­ры для персональных компьютеров (ПК), о которых мы столько слышим, за­нимают в общем количестве выпускаемых процессоров лишь 5-6% - остальные составляют микроконтроллеры различного назначения.

В соответствии со сказанным основной цикл работы процессора должен быть таким: выборка очередной команды (из памяти), если необходимо - выбор­ка исходных данных для нее, выполнение команды, размещение результатов в памяти (опять же если это необходимо). Вся работа в этом цикле должна происходить автоматически па командам некоторого устройства управления, содержащего тактовый генератор - системные часы, по которым все син­хронизируется. Кроме того, где-то это все должно происходить - складиро­вание данных, кода команды, выполнение действий и т. п., так что процессор должен содержать некий набор рабочих регистров (по сути - небольшую по объему сверхбыструю память), определенным образом связанных как между собой, так и с устройством управления и АЛУ, которое неизбежно должно присутствовать.

Решающую роль в работе процессора играет счетчик команд. Он автоматиче­ски устанавливается на нуль в начале работы, что соответствует первой ко­манде, и автоматически же инкрементируется (то есть увеличивается на еди­ницу) с каждой выполненной командой. Если по ходу дела порядок команд нарушается, например, встречается команда перехода (ветвления), то в счет­чик загружается соответствующий адрес команды - ее номер от начала про­граммы. Если это не просто ветвление, а выполнение подпрограммы, которое предполагает в дальнейшем возврат к основной последовательности команд (к следующей команде после вызова подпрограммы), то перед переходом к выполнению подпрограммы текущее значение счётчика команд сохраняется в специально отведенной для этой цели области памяти - стеке. По команде окончания подпрограммы сохраненный адрес извлекается из стека, и выпол­нение основной программы продолжается. К счастью, нам самим не придется иметь дело со счетчиком команд, потому что все указания на этот счет со­держатся в командах, и процессор все делает автоматически.

Рис. 18.2. Блок-схема простейшего микроконтроллера

Блок-схема простейшего МК, содержащего процессорное ядро и минимум компонентов для «общения» с внешней средой, показана на рис. 18.2. Здесь мы включили в состав системы память программ, которая у ПК-процессоров находится всегда отдельно (если не считать относительно небольшого объе­ма быстродействующей кэш-памяти) - сами знаете, какой объем программ бывает в персональных компьютерах. В большинстве современных микро­контроллеров постоянное запоминающее устройство (ПЗУ) для программ входит в состав чипа и обычно составляет от V-2 до 8-32 кбайт. Хотя есть модели и с 256 килобайтами встроенной памяти, но 2-8 кбайт для подав­ляющего большинства применений вполне достаточно. Встроенное опера­тивное запоминающее устройство (ОЗУ) для хранения данных в том или ином объеме также имеется во всех современных микроконтроллерах, ти­пичный размер такого ОЗУ - от 128-256 байт до 1-4 кбайт. В большинст­ве универсальных контроллеров есть и некоторое количество встроенной энергонезависимой памяти для хранения констант- обычно столько же, сколько и ОЗУ данных. Но к памяти мы еще вернемся в этой главе, а пока продолжим про процессоры.

Подробности

в первых моделях микропроцессоров (включая и интеловские процессоры для ПК - от 8086 до 80386) процессор выполнял команды строго последователь­но: загрузить команду, определить, что ей нужны операнды, загрузить эти опе­ранды (по адресу регистров, которые их должны содержать; адреса эти, как правило, хранятся сразу после собственно кода команды или определены за­ранее), потом проделать нужные действия, складировать результаты… До на­шего времени дошла архитектура суперпопулярных еще недавно микрокон­троллеров 8051, выпускающихся и по сей день различными фирмами (Atnnel, Philips), которые выполняли одну команду аж за 12 тактов (в некоторых совре­менных аналогах, впрочем, это число меньше). Для ускорения работы стали делить такты на части (например, срабатывать по переднему и заднему фрон­там), но действительный прорыв произошел с внедрением конвейера. Со вре­мен Генри Форда известно, что производительность конвейера зависит только от времени выполнения самой длинной операции - если поделить команды на этапы и выполнять их одновременно разными аппаратными узлами, то можно добиться существенного ускорения (хотя и не во всех случаях). В рас­сматриваемых далее микроконтроллерах Atmel AVR конвейер двухступенча­тый: когда очередная команда загружается и декодируется, предыдущая уже выполняется и пишет результаты. В AVR это позволило выполнять большин­ство команд за один такт (кроме команд ветвления программы).

Главное устройство в МП, которое связывает все узлы в единую систему - внутренняя шина данных. По ней все устройства обмениваются сигналами. Например, если МП требуется обратиться к внешней, дополнительной памя­ти, то при исполнении соответствующей команды на шину данных выставля­ется нужный адрес, от устройства управления поступает через нее же запрос на обращение к нужным портам ввода/вывода. Если порты готовы, адрес по­ступает на выходы портов (то есть на соответствующие выводы контролле­ра), затем по готовности принимающий порт выставляет на шину принятые из внешней памяти данные, которые загружаются в нужный регистр, после чего шина данных свободна. Для того чтобы все устройства не мешали друг другу, все это строго синхронизировано, при этом каждое устройство имеет, во-первых, собственный адрес, во-вторых, может находиться в трех состоя­ниях - работать на ввод, на вывод или находиться в третьем состоянии, не мешая другим работать.

Под разрядностью МП обычно понимают разрядность чисел, с которыми ра­ботает АЛУ, соответственно, такую же разрядность имеют и рабочие регист­ры. Например, все ПК-процессоры от 1386 до последних инкарнаций Pentkim были 32-разрядными, некоторые последние модели от Intel и AMD стали 64-разрядными. Большинство микроконтроллеров общего назначения- 8-раз­рядные, но есть и 16-, и 32-разрядные. При этом внутренняя шина данных может иметь и больше разрядов - например, чтобы одновременно переда­вать и адреса и данные.

Распределение рынка МК в первые годы тысячелетия было таким: немного меньше половины выпускаемых изделий составляют 8-разрядные кристаллы, а вторую половину поделили между собой 16- и 32-разрядные, причем доля последних неуклонно растет за счет 16-разрядных. Выпускаются даже 4-разрядные, потомки первого 14004, которые занимают не более 10% рынка, но, что любопытно, эта доля снижается очень медленно.

Заметки на полях

Обычно тактовая частота универсальных МК невелика (хотя инженеру 1980-х, когда ПК работали* на частотах не выше 6 МГц, она показалась бы огром­ной) - порядка 8-16 МГц, иногда до 20 МГц или несколько более. И это всех устраивает - дело в том, что обычные МК и не предназначены для разработ­ки быстродействующих схем. Если требуется быстродействие, то использует­ся другой класс интегральных схем - ПЛИС, «профаммируемые логические интефальные схемы». Простейшая ПЛИС представляет собой набор никак не связанных ме>кду собой логических элементов (наиболее сложные из них мо­гут включать в себя и некоторые законченные узлы, вроде триггеров и генера­торов), которые в процессе программирования такого чипа соединяются в нуж1|1ую схему. Комбинационная логика работает гораздо быстрее тактируемых контроллеров, и для построения различных логических схем в настоящее вре­мя применяют только ПЛИС, от использования дискретных элементов («рас-сыпухи») в массовых масштабах уже давно отказались. Еще одно преимуще­ство ПЛИС- статическое потребление энергии для некоторых серий составляет единицы микроватт, в отличие от МК, которые во включенном со­стоянии потребляют достаточно много (если не находятся в режиме энерго­сбережения). В совокупности с более универсальными и значительно более простыми в обращении, но менее быстрыми и экономичными микроконтролле­рами, ПЛИС составляют основу большин9твд массовых электронных изделий, которые вы видите на прилавках. В этой книге мы, конечно, рассматривать ПЛИС не будем - в любительской практике, в основном из-за дороговизны соответствующего инструментария и высо1кого порога его освоения, они не ис­пользуются, и для конструирования oди^|oчныx экземпляров приборов даже для профессиональных применений их ис111ользовать нецелесообразно.

Если подробности внутреннего функционирования МП нас волнуют не очень (центральный узел - АЛУ мы уже «изобретали» в главе 15, и этого доста­точно, чтобы понимать, что именно происходит внутри процессорного ядра), то обмен с внешней средой нас как раз интересует во всех деталях. Для этого служат порты ввода/вывода (I/0-port, от input/output). В этом термине имеет­ся некоторая неопределенность, так как те, кто программировал для ПК на ассемблере, помнят, что в ПК портами ввода/вывода (ПВВ) назывались реги­стры для управления всеми устройствами, кроме непосредственно процес­сорного ядра. В микроконтроллерах то же самое называют «регистрами вво­да/вывода» (РВВ) - это регистры для доступа ко встроенным компонентам контроллера, внешним по отношению к вычислительному ядру. А это все узлы, которыми непосредственно управляет пользователь - от таймеров и последовательных портов до регистра флагов и управления прерываниями. Кроме ОЗУ, доступ к которому обеспечивается специальными командами, все остальное в контроллере управляется через РВВ, и путать с портами вво­да-вывода их не следует.

ПВВ в МК служат для обмена с «окружающей средой» (управляются они, естественно, тоже внутренними регистрами ввода-вывода). На схеме рис. 18.2 показано 3 ПВВ - А, В и С; в реальных МК их может быть и боль­ше, и меньше. Еще важнее число выводов этих портов, которое чаще всего совпадает с разрядностью процессора (но не всегда, как это было у 8086, ко­торый имел внутреннюю 16-разрядную структуру, а внешне выглядел 8-разрядным). Если мы заставим 8-разрядные порты «общаться», например, с внешней памятью, то на двух из них можно выставить 16-разрядный адрес, а на оставшемся - принимать данные. А как быть, если портов два или вооб­ще один? (К примеру, в микроконтроллере АТхххх2313 портов формально два, но один усеченный, так что общее число линий составляет 15). Для того чтобы даже в такой ситуации это было возможно, все внешние порты в МП всегда двунаправленные. Скажем, если портов два, то можно сначала выста­вить адрес, а затем переключить порты на вход и принимать данные. Естест­венно, для этого порты должны позволять работу на общую шину - то есть либо иметь третье состояние, либо выход с общим коллектором для объеди­нения в «монтажное ИЛИ».

Варианты для обоих случаев организации выходной линии порта показаны на рис. 18.3, где приведены упрощенные схемы выходных линий микрокон­троллеров семейства 8048 - когда-то широко использовавшегося предшест­венника популярного МК 80S1 (например, 8048 был выбран в качестве кон­троллера клавиатуры в IBM PC). В современных МК построение портов несколько сложнее (в частности, вместо резистора там полевой транзистор), но для уяснения принципов работы это несущественно.

По первому варианту (рис. 18.3, а) в МК 8048 построены порты 1 и 2. Когда в порт производится запись, то логический уровень поступает с прямого выхо­да защелки на статическом D-триггере на вход схемы «И», а с инверсного - на затвор транзистора VT2. Если этот уровень равен логическому нулю, то транзистор VT1 заперт, а VT2 открыт, на выходе также логический ноль. Ес­ли уровень равен логической единице, то на время действия импульса «За­пись» транзистор VT1 открывается, а транзистор VT2 запирается (они одина­ковой полярности). Если на выходе присутствует емкость (а она всегда имеется в виде распределенной емкости проводников и емкости входов дру­гих компонентов), то через открытый VT1 протекает достаточно большой ток заряда этой емкости, позволяющий сформировать хороший фронт перехода из О в 1. Как только импульс «Запись» заканчивается, оба транзистора от­ключаются, и логическая единица на выходе поддерживается резистором R1. Выходное сопротивление открытого транзистора VT1 примерно 5 кОм, а ре­зистора - 50 кОм. Любое другое устройство, подключенное к этой шине, при работе на выход может лишь либо поддержать логическую единицу, включив свой подобный резистор параллельно R1, либо занять линию своим логическим нулем - это, как видите, и есть схема «монтажное ИЛИ». При работе на вход состояние линии просто считывается во время действия им­пульса «Запись» со входного буфера (элемент «В» на рис. 18.3, а).

Второй вариант (рис. 18.3, б), по которому устроен порт О, есть обычный вы­ходной каскад КМОП с третьим состоянием, то есть такой порт может рабо­тать на выход, только полностью занимай линию, остальные подключенные к линии устройства при этом должны смиренно внимать монополисту, воспри­нимая сигналы. Это обычно не создает особых трудностей и схемотехниче­ски даже предпочтительно ввиду симметрии выходных сигналов и высокого сопротивления для входных. Единственная сложность возникает при сопря­жении такого порта с линией, работающей по первому варианту, так как при логической единице на выходе могут возникнуть электрические конфликты, если кто-то попытается выдать в линию логический ноль (ток от источника пойдет через два распахнутых транзистора).

Рис. 18.3. Упрощенные схемы портов ввода/вывода МК 8048: а - портов 1 и 2; б - порта О

Для обеспечения работы трехстабильного порта по схеме «монтажное ИЛИ» применяют хитрый прием: всю линию «подтягивают» к напряжению питания с помощью внешнего резистора (во многих МК существует встроенный от­ключаемый резистор, установленный аналогично R1 в схеме рис. 18.3, а), и нормальное состояние всех участвующих трехстабильных портов - работа на вход в третьем состоянии. В этом режиме на линии всегда будет логиче­ская единица. На выход же линию переключают только, когда надо выдать логический ноль. В этом случае, даже при одновременной активности не­скольких портов, конфликтов не возникнет.

Современные процессоры имеют форму небольшого прямоугольника, который представлен в виде пластины из кремния. Сама пластина защищена специальным корпусом из пластмассы или керамики. Под защитой находятся все основные схемы, благодаря им и осуществляется полноценная работа ЦП. Если с внешним видом все предельно просто, то, что касается самой схемы и того, как устроен процессор? Давайте разберем это подробнее.

В состав ЦП входит небольшое количество различных элементов. Каждый из них выполняет свое действие, происходит передача данных и управления. Обычные пользователи привыкли отличать процессоры по их тактовой частоте, количеству кэш-памяти и ядрам. Но это далеко не все, что обеспечивает надежную и быструю работу. Стоит уделить отдельное внимание каждому компоненту.

Архитектура

Внутренняя конструкция ЦП часто отличается друг от друга, каждому семейству присущ свой набор свойств и функций – это и называется его архитектурой. Пример конструкции процессора вы можете наблюдать на изображении ниже.

Но многие под архитектурой процессора привыкли подразумевать немного другое значение. Если рассматривать ее с точки зрения программирования, то она определяется по его возможности выполнять определенный набор кодов. Если вы покупаете современный CPU, то скорее всего он относится к архитектуре x86.

Ядра

Основная часть CPU называется ядром, в нем содержатся все необходимые блоки, а также происходит выполнение логических и арифметических задач. Если вы посмотрите на рисунок ниже, то сможете разобрать как выглядит каждый функциональный блок ядра:

  1. Модуль выборки инструкций. Здесь осуществляется распознавание инструкций по адресу, который обозначается в счетчике команд. Число одновременного считывания команд напрямую зависит от количества установленных блоков расшифровки, что помогает нагрузить каждый такт работы наибольшим количеством инструкций.
  2. Предсказатель переходов отвечает за оптимальную работу блока выборки инструкций. Он определяет последовательность исполняемых команд, нагружая конвейер ядра.
  3. Модуль декодирования. Данная часть ядра отвечает за определения некоторых процессов для выполнения задач. Сама задача декодирования очень сложная из-за непостоянного размера инструкции. В самых новых процессорах таких блоков встречается несколько в одном ядре.
  4. Модули выборки данных. Они берут информацию из оперативной или кэш-памяти. Осуществляют они именно выборку данных, которая необходима на этот момент для исполнения инструкции.
  5. Управляющий блок. Само название говорит уже о важности данного компонента. В ядре он является главнейшим элементом, поскольку производит распределение энергии между всеми блоками, помогая выполнять каждое действие вовремя.
  6. Модуль сохранения результатов. Предназначен для записи после окончания обработки инструкции в RAM. Адрес сохранения указывается в исполняющейся задаче.
  7. Элемент работы с прерываниями. ЦП способен выполнять сразу несколько задач благодаря функции прерывания, это позволяет ему останавливать ход работы одной программы, переключаясь на другую инструкцию.
  8. Регистры. Здесь хранятся временные результаты инструкций, данный компонент можно назвать небольшой быстрой оперативной памятью. Часто ее объем не превышает несколько сотен байт.
  9. Счетчик команд. Он хранит в себе адрес команды, которая будет задействована на следующем такте процессора.

Системная шина

По системной шине CPU соединяются устройства входящие в состав ПК. К ней напрямую подключен только он, остальные элементы подсоединяются через разнообразные контроллеры. В самой шине присутствует множество сигнальных линий, через которые происходит передача информации. Каждая линия имеет свой собственный протокол, обеспечивающий связь по контроллерам с остальными подключенными компонентами компьютера. Шина имеет свою частоту, соответственно, чем она выше, тем быстрее совершается обмен информацией между связующими элементами системы.

Кэш-память

Быстродействие ЦП зависит от его возможности максимально быстро выбирать команды и данные из памяти. За счет кэш-памяти сокращается время выполнения операций благодаря тому, что она играет роль временного буфера, обеспечивающего мгновенную передачу данных CPU к ОЗУ или наоборот.

Основной характеристикой кэш-памяти является ее различие по уровням. Если он высокий, значит память более медленная и объемная. Самой скоростной и маленькой считается память первого уровня. Принцип функционирования данного элемента очень прост – CPU считывает из ОЗУ данные и заносит их в кэш любого уровня, удаляя при этом ту информацию, к которой обращались давно. Если процессору нужна будет эта информация еще раз, то он получит ее быстрее благодаря временному буферу.

Сокет (разъем)

Благодаря тому, что процессор имеет собственный разъем (гнездовой или щелевой), вы можете легко заменить его при поломке или модернизировать компьютер. Без наличия сокета ЦП просто бы впаивался в материнскую плату, усложняя последующий ремонт или замену. Стоит обратить внимание – каждый разъем предназначен исключительно для установки определенных процессоров.

Часто пользователи по невнимательности покупают несовместимые процессор и материнскую плату, из-за чего появляются дополнительные проблемы.

Сложно в это поверить, но современный процессор является самым сложным готовым продуктом на Земле – а ведь, казалось бы, чего сложного в этом куске железа?

Как и обещал – подробный рассказ о том, как делают процессоры… начиная с песка. Все, что вы хотели знать, но боялись спросить)


Я уже рассказывал о том, «Где производят процессоры » и о том, какие «Трудности производства » на этом пути стоят. Сегодня речь пойдет непосредственно про само производство – «от и до».

Производство процессоров

Когда фабрика для производства процессоров по новой технологии построена, у нее есть 4 года на то, чтобы окупить вложенные средства (более $5млрд) и принести прибыль. Из несложных секретных расчетов получается, что фабрика должна производить не менее 100 работающих пластин в час.

Вкратце процесс изготовления процессора выглядит так: из расплавленного кремния на специальном оборудовании выращивают монокристалл цилиндрической формы. Получившийся слиток охлаждают и режут на «блины», поверхность которых тщательно выравнивают и полируют до зеркального блеска. Затем в «чистых комнатах» полупроводниковых заводов на кремниевых пластинах методами фотолитографии и травления создаются интегральные схемы. После повторной очистки пластин, специалисты лаборатории под микроскопом производят выборочное тестирование процессоров – если все «ОК», то готовые пластины разрезают на отдельные процессоры, которые позже заключают в корпуса.

Уроки химии

Давайте рассмотрим весь процесс более подробно. Содержание кремния в земной коре составляет порядка 25-30% по массе, благодаря чему по распространённости этот элемент занимает второе место после кислорода. Песок, особенно кварцевый, имеет высокий процент содержания кремния в виде диоксида кремния (SiO 2) и в начале производственного процесса является базовым компонентом для создания полупроводников.

Первоначально берется SiO 2 в виде песка, который в дуговых печах (при температуре около 1800°C) восстанавливают коксом:

Такой кремний носит название «технический » и имеет чистоту 98-99.9%. Для производства процессоров требуется гораздо более чистое сырье, называемое «электронным кремнием » - в таком должно быть не более одного чужеродного атома на миллиард атомов кремния. Для очистки до такого уровня, кремний буквально «рождается заново». Путем хлорирования технического кремния получают тетрахлорид кремния (SiCl 4), который в дальнейшем преобразуется в трихлорсилан (SiHCl 3):
Данные реакции с использованием рецикла образующихся побочных кремнийсодержащих веществ снижают себестоимость и устраняют экологические проблемы:
2SiHCl 3 SiH 2 Cl 2 + SiCl 4
2SiH 2 Cl 2 SiH 3 Cl + SiHCl 3
2SiH 3 Cl SiH 4 + SiH 2 Cl 2
SiH 4 Si + 2H 2
Получившийся в результате водород можно много где использовать, но самое главное то, что был получен «электронный» кремний, чистый-пречистый (99,9999999%). Чуть позже в расплав такого кремния опускается затравка («точка роста»), которая постепенно вытягивается из тигля. В результате образуется так называемая «буля» - монокристалл высотой со взрослого человека. Вес соответствующий - на производстве такая дуля весит порядка 100 кг.

Слиток шкурят «нулёвкой»:) и режут алмазной пилой. На выходе – пластины (кодовое название «вафля») толщиной около 1 мм и диаметром 300 мм (~12 дюймов; именно такие используются для техпроцесса в 32нм с технологией HKMG, High-K/Metal Gate). Когда-то давно Intel использовала диски диаметром 50мм (2"), а в ближайшем будущем уже планируется переход на пластины с диаметром в 450мм – это оправдано как минимум с точки зрения снижения затрат на производство чипов. К слову об экономии - все эти кристаллы выращиваются вне Intel; для процессорного производства они закупаются в другом месте.

Каждую пластину полируют, делают идеально ровной, доводя ее поверхность до зеркального блеска.

Производство чипов состоит более чем из трёх сотен операций, в результате которых более 20 слоёв образуют сложную трёхмерную структуру – доступный на Хабре объем статьи не позволит рассказать вкратце даже о половине из этого списка:) Поэтому совсем коротко и лишь о самых важных этапах.

Итак. В отшлифованные кремниевые пластины необходимо перенести структуру будущего процессора, то есть внедрить в определенные участки кремниевой пластины примеси, которые в итоге и образуют транзисторы. Как это сделать? Вообще, нанесение различных слоев на процессорную подложу это целая наука, ведь даже в теории такой процесс непрост (не говоря уже о практике, с учетом масштабов)… но ведь так приятно разобраться в сложном;) Ну или хотя бы попытаться разобраться.

Фотолитография

Проблема решается с помощью технологии фотолитографии - процесса избирательного травления поверхностного слоя с использованием защитного фотошаблона. Технология построена по принципу «свет-шаблон-фоторезист» и проходит следующим образом:
- На кремниевую подложку наносят слой материала, из которого нужно сформировать рисунок. На него наносится фоторезист - слой полимерного светочувствительного материала, меняющего свои физико-химические свойства при облучении светом.
- Производится экспонирование (освещение фотослоя в течение точно установленного промежутка времени) через фотошаблон
- Удаление отработанного фоторезиста.
Нужная структура рисуется на фотошаблоне - как правило, это пластинка из оптического стекла, на которую фотографическим способом нанесены непрозрачные области. Каждый такой шаблон содержит один из слоев будущего процессора, поэтому он должен быть очень точным и практичным.

Иной раз осаждать те или иные материалы в нужных местах пластины просто невозможно, поэтому гораздо проще нанести материал сразу на всю поверхность, убрав лишнее из тех мест, где он не нужен - на изображении выше синим цветом показано нанесение фоторезиста.

Пластина облучается потоком ионов (положительно или отрицательно заряженных атомов), которые в заданных местах проникают под поверхность пластины и изменяют проводящие свойства кремния (зеленые участки - это внедренные чужеродные атомы).

Как изолировать области, не требующие последующей обработки? Перед литографией на поверхность кремниевой пластины (при высокой температуре в специальной камере) наносится защитная пленка диэлектрика – как я уже рассказывал, вместо традиционного диоксида кремния компания Intel стала использовать High-K-диэлектрик. Он толще диоксида кремния, но в то же время у него те же емкостные свойства. Более того, в связи с увеличением толщины уменьшен ток утечки через диэлектрик, а как следствие – стало возможным получать более энергоэффективные процессоры. В общем, тут гораздо сложнее обеспечить равномерность этой пленки по всей поверхности пластины - в связи с этим на производстве применяется высокоточный температурный контроль.

Так вот. В тех местах, которые будут обрабатываться примесями, защитная пленка не нужна – её аккуратно снимают при помощи травления (удаления областей слоя для формирования многослойной структуры с определенными свойствами). А как снять ее не везде, а только в нужных областях? Для этого поверх пленки необходимо нанести еще один слой фоторезиста – за счет центробежной силы вращающейся пластины, он наносится очень тонким слоем.

В фотографии свет проходил через негативную пленку, падал на поверхность фотобумаги и менял ее химические свойства. В фотолитографии принцип схожий: свет пропускается через фотошаблон на фоторезист, и в тех местах, где он прошел через маску, отдельные участки фоторезиста меняют свойства. Через маски пропускается световое излучение, которое фокусируется на подложке. Для точной фокусировки необходима специальная система линз или зеркал, способная не просто уменьшить, изображение, вырезанное на маске, до размеров чипа, но и точно спроецировать его на заготовке. Напечатанные пластины, как правило, в четыре раза меньше, чем сами маски.

Весь отработанный фоторезист (изменивший свою растворимость под действием облучения) удаляется специальным химическим раствором – вместе с ним растворяется и часть подложки под засвеченным фоторезистом. Часть подложки, которая была закрыта от света маской, не растворится. Она образует проводник или будущий активный элемент – результатом такого подхода становятся различные картины замыканий на каждом слое микропроцессора.

Собственно говоря, все предыдущие шаги были нужны для того, чтобы создать в необходимых местах полупроводниковые структуры путем внедрения донорной (n-типа) или акцепторной (p-типа) примеси. Допустим, нам нужно сделать в кремнии область концентрации носителей p-типа, то есть зону дырочной проводимости. Для этого пластину обрабатывают с помощью устройства, которое называется имплантер - ионы бора с огромной энергией выстреливаются из высоковольтного ускорителя и равномерно распределяются в незащищенных зонах, образованных при фотолитографии.

Там, где диэлектрик был убран, ионы проникают в слой незащищенного кремния – в противном случае они «застревают» в диэлектрике. После очередного процесса травления убираются остатки диэлектрика, а на пластине остаются зоны, в которых локально есть бор. Понятно, что у современных процессоров может быть несколько таких слоев - в таком случае на получившемся рисунке снова выращивается слой диэлектрика и далее все идет по протоптанной дорожке - еще один слой фоторезиста, процесс фотолитографии (уже по новой маске), травление, имплантация… ну вы поняли.

Характерный размер транзистора сейчас - 32 нм, а длина волны, которой обрабатывается кремний - это даже не обычный свет, а специальный ультрафиолетовый эксимерный лазер - 193 нм. Однако законы оптики не позволяют разрешить два объекта, находящиеся на расстоянии меньше, чем половина длины волны. Происходит это из-за дифракции света. Как быть? Применять различные ухищрения - например, кроме упомянутых эксимерных лазеров, светящих далеко в ультрафиолетовом спектре, в современной фотолитографии используется многослойная отражающая оптика с использованием специальных масок и специальный процесс иммерсионной (погружной) фотолитографии.

Логические элементы, которые образовались в процессе фотолитографии, должны быть соединены друг с другом. Для этого пластины помещают в раствор сульфата меди, в котором под действием электрического тока атомы металла «оседают» в оставшихся «проходах» - в результате этого гальванического процесса образуются проводящие области, создающие соединения между отдельными частями процессорной «логики». Излишки проводящего покрытия убираются полировкой.

Финишная прямая

Ура – самое сложное позади. Осталось хитрым способом соединить «остатки» транзисторов - принцип и последовательность всех этих соединений (шин) и называется процессорной архитектурой. Для каждого процессора эти соединения различны – хоть схемы и кажутся абсолютно плоскими, в некоторых случаях может использоваться до 30 уровней таких «проводов». Отдаленно (при очень большом увеличении) все это похоже на футуристическую дорожную развязку – и ведь кто-то же эти клубки проектирует!

Когда обработка пластин завершена, пластины передаются из производства в монтажно-испытательный цех. Там кристаллы проходят первые испытания, и те, которые проходят тест (а это подавляющее большинство), вырезаются из подложки специальным устройством.

На следующем этапе процессор упаковывается в подложку (на рисунке – процессор Intel Core i5, состоящий из CPU и чипа HD-графики).

Привет, сокет!

Подложка, кристалл и теплораспределительная крышка соединяются вместе – именно этот продукт мы будем иметь ввиду, говоря слово «процессор». Зеленая подложка создает электрический и механический интерфейс (для электрического соединения кремниевой микросхемы с корпусом используется золото), благодаря которому станет возможным установка процессора в сокет материнской платы – по сути, это просто площадка, на которой разведены контакты от маленького чипа. Теплораспределительная крышка является термоинтерфейсом, охлаждающим процессор во время работы – именно к этой крышке будут примыкать система охлаждения, будь то радиатор кулера или здоровый водоблок.

Сокет (разъём центрального процессора) - гнездовой или щелевой разъём, предназначенный для установки центрального процессора. Использование разъёма вместо прямого распаивания процессора на материнской плате упрощает замену процессора для модернизации или ремонта компьютера. Разъём может быть предназначен для установки собственно процессора или CPU-карты (например, в Pegasos). Каждый разъём допускает установку только определённого типа процессора или CPU-карты.

На завершающем этапе производства готовые процессоры проходят финальные испытания на предмет соответствия основным характеристикам – если все в порядке, то процессоры сортируются в нужном порядке в специальные лотки – в таком виде процессоры уйдут производителям или поступят в OEM-продажу. Еще какая-то партия пойдет на продажу в виде BOX-версий – в красивой коробке вместе со стоковой системой охлаждения.

The end

Теперь представьте себе, что компания анонсирует, например, 20 новых процессоров. Все они различны между собой – количество ядер, объемы кэша, поддерживаемые технологии… В каждой модели процессора используется определенное количество транзисторов (исчисляемое миллионами и даже миллиардами), свой принцип соединения элементов… И все это надо спроектировать и создать/автоматизировать – шаблоны, линзы, литографии, сотни параметров для каждого процесса, тестирование… И все это должно работать круглосуточно, сразу на нескольких фабриках… В результате чего должны появляться устройства, не имеющие права на ошибку в работе… А стоимость этих технологических шедевров должна быть в рамках приличия… Почти уверен в том, что вы, как и я, тоже не можете представить себе всего объема проделываемой работы, о которой я и постарался сегодня рассказать.

Ну и еще кое-что более удивительное. Представьте, что вы без пяти минут великий ученый - аккуратно сняли теплораспределительную крышку процессора и в огромный микроскоп смогли увидеть структуру процессора – все эти соединения, транзисторы… даже что-то на бумажке зарисовали, чтобы не забыть. Как думаете, легко ли изучить принципы работы процессора, располагая только этими данными и данными о том, какие задачи с помощью этого процессора можно решать? Мне кажется, примерно такая картина сейчас видна ученым, которые пытаются на подобном уровне изучить работу человеческого мозга. Только если верить стэнфордским микробиологам, в одном человеческом мозге находится больше «транзисторов», чем во всей мировой IT-инфраструктуре. Интересно, правда?

BONUS

Хватило сил дочитать до этого абзаца?) Поздравляю – приятно, что я постарался не зря. Тогда предлагаю откинуться на спинку кресла и посмотреть всё описанное выше, но в виде более наглядного видеоролика – без него статья была бы не полной.

Эту статью я писал сам, пытаясь вникнуть в тонкости процесса процессоростроения. Я к тому, что в статье могут быть какие-то неточности или ошибки - если найдете что-то, дайте знать. А вообще, чтобы окончательно закрепить весь прочитанный материал и наглядно понять то, что было недопонято в моей статье, пройдите по этой ссылке . Теперь точно всё.


Успехов!

Современные компьютеры поражают разносторонностью своего использования. Если раньше они использовались, в основном, для математических расчетов, позднее для программирования работы автоматов и роботов, то сейчас любой пользователь может просматривать и редактировать на своем персональном компьютере изображения, видео, аудио, не говоря уже о сложном редактировании текстовых, табличных документов и баз данных.

Основной «рабочей лошадкой», обрабатывающей большие массивы данных, производящий миллионы операций в секунду – центральный процессор.

Из этого материала вы узнаете об устройстве и принципах работы современных процессоров, основных параметрах центральных процессоров (и какой из этих параметров важнее), факторов, ускоряющих и тормозящих его работу.

Устройство центрального процессора

Каждый современный процессор состоит из устройств нескольких типов.

  • Исполнительные устройства - осуществляют основные вычисления.
  • Устройства управления - организуют получение и обработку данных и команд исполнительными устройствами в правильной последовательности.
  • Регистры (быстрые ячейки памяти) - хранят промежуточные результаты.
  • Шина данных – передают нужную информацию между процессором и прочими комплектующими.
  • Кэш процессора – хранит часто используемые данные для ускорения доступа процессора к ним. Кэш представляет из себя ячейки быстрой памяти, расположенные на кристалле процессора.
  • Дополнительные вычислительные модули - отвечают за выполнение специальных задач (обработка видео, редактирование 3D-графики).

Параметры процессора, влияющие на производительность

Главным параметром, влияющим на производительность центрального процессора, является его разрядность, характеристика, указывающая количество одновременно обрабатываемых битов информации. Более высокая разрядность позволяет обрабатывать массивы данных большего размера (либо данные обрабатываются быстрее при неизменном размере обрабатываемых данных, либо увеличивается точность расчетов).

В процессоре есть три составляющих, производительность которых непосредственно зависит от разрядности:

  • Шина данных
  • Внутренние регистры
  • Шина адреса памяти

Шина данных

Шина данных представляет из себя пучок проводников для передачи и приема электрических сигналов. Чем больше сигналов одновременно проходит через шину данных, тем больше информации поступает к исполнительным устройствам и обрабатывается ими. Разрядность в случае шины данных показывает ее пропускную способность - чем выше разрядность, тем больше информации проходит через шину в единицу времени.

Шина адреса памяти

Шина адреса памяти - набор проводников, передающих адреса ячеек памяти, в которые записывается или из которых считывается информация.

Чем больше проводников в шине адреса, тем больше ячеек оперативной памяти доступно центральному процессору.

Если шину данных можно сравнить автотрассой, где разрядность указывает на количество полос движения, то шина адреса памяти больше напоминает нумерацию зданий на одной улице, чем выше разрядность шины адреса памяти, тем большее количество адресов можно прописать.

Внутренние регистры

Внутренние регистры – ячейки сверхбыстрой оперативной памяти, встроенные непосредственно в процессор и используемые для хранения промежуточных результатов вычислений. Разрядность внутренних регистров показывает, какое количество битов информации процессор может обработать за один прием (такт).

Тактовая частота

Еще одним параметром, от которого во многом зависит быстродействие компьютера, является тактовая частота процессора (измеряется в гигагерцах, ГГц).

Тактовые колебания создаются кристаллом кварца в металлическом контейнере (тактовый резонатор ), на который подается напряжение. Под действием напряжения в кристалле образуются колебания электротока. Они подаются на тактовый генератор , который преобразует их импульсы и передает на шины данных и адреса. Тем самым синхронизируется работа всех составляющих центрального процессора, шин и оперативной памяти. Можно сказать, что тактовый генератор отбивает ритм, чтобы все компоненты работали слаженно и синхронно.

Период тактовой частоты (такт) – наименьшая единица для измерения времени работы процессора (т.е. на любую операцию центральный процессор тратит как минимум один такт). При обмене данных с другими комплектующими компьютера (в первую очередь, с оперативной памятью) процессор может потратить больше одного такта (причем большая их часть будет тактами ожидания из-за более медленных, по сравнению с процессором, шин передачи данных и микрочипов оперативной памяти)

Является ли тактовая частота решающим параметром при выборе процессора? Нет. Более высокая тактовая частота будет весомым бонусом только при прочих равных параметрах процессора. В некоторых случаях процессоры с более низкой тактовой частотой превосходили своих «быстрых» оппонентов как в быстродействии, так и в общей производительности.

В последние 10-12 лет очень большое распространение получило такое явление, как «оверклокинг» - повышение быстродействия компонентов компьютера за счёт использования их форсированных режимах работы. В русском языке больше прижился термин «разгон». Итак, как разгоняют процессор? Самое простое – увеличить тактовую частоту. Для этого на тактовый резонатор подается большее напряжение, количество колебаний в кварцевом кристалле увеличивается, соответственно, увеличивается и количество импульсов в единицу времени, передаваемых тактовым генератором. Для такого разгона есть несколько ограничений:

  • Повышается количество энергии, потребляемое процессором (если вы намерены разгонять свой компьютер, учитывайте это, выбирая блок питания)
  • С увеличением подаваемой энергии на кристалл, увеличивается и количество энергии отдаваемое им. Проще говоря, он нагревается сильнее, и это лишнее тепло необходимо отводить (обычно для этого устанавливают более мощную систему охлаждения).
  • С увеличением подаваемой электроэнергии увеличиваются электромагнитные помехи, в первую очередь, на шины данных и адреса. Количество тактов, конечно, увеличивается, но количество данных, которые передаются от процессора к памяти и обратно, уменьшается.

Почему процессоры перегреваются и как это предотвратить

Каждый процессор состоит из огромного количества микроскопических радиоэлементов. Чем их больше и чем выше тактовая частота процессора, тем больше процессор потребляет энергии. Мобильные процессоры для портативных компьютеров, планшетов и коммуникаторов рассчитаны на пониженное энергопотребление (до 35 Вт). Модели для настольных компьютеров потребляют от 130 Вт и больше. При этом большое количество тепла выделяется во вне, и, чтобы это тепло отвести от поверхности чипа, необходима хорошая система охлаждения.

При выборе системы охлаждение одним из важнейших параметров является значение TDP (Total Dissipated Power , общая рассеиваемая мощность).

Существует достаточно много способов снижения энергопотребления. Вот некоторые из них:

  • Отключение модулей, понижение тактовой частоты, понижение рабочего напряжения при снижении нагрузки на процессор (для процессоров Intel - технология SpeedStep, для процессоров AMD – технология Cool&Quiet).
  • Применение в производстве новых, прогрессивных материалов.
  • Применение процессоров, работающих с пониженным напряжением питания (Low Voltage, Ultra Low Voltage). Потребляемая мощность изменяется пропорционально напряжению.

Способы повышения производительности процессоров

  • Ускорение системной шины. Чем быстрее процессор получает данные и команды от запоминающих устройств ПК, тем меньше времени он тратит на ожидание, а значит и на выполнение программ.
  • Быстрая многоуровневая кэш-память. Процессоры сохраняют промежуточные результаты вычислений во встроенной кэш-памяти (cache memory). Ее тактовая частота равна частоте самого процессора, поэтому она гораздо быстрее системной памяти. Большинство современных процессоров имеют кэш-память первого (Level 1, L1), второго (Level 2, L2) и третьего (Level 3, L3) уровней. Кэш-память первого уровня относительно мала (несколько сот килобайт). Кэши второго и третьего уровня больше (до нескольких мегабайт) и медленнее кэш-памяти первого уровня, но все равно работают с более высокой скоростью, чем системная оперативная память. Данные, поступающие из кэша, обеспечивают максимальную загруженность процессора, избавляя его от необходимости ожидания отклика от системной памяти.
  • Конвейерная обработка, т.е. последовательное прохождение команд через различные компоненты ЦП. Преимущество такого метода обработки данных в том, что при наличии конвейера процессор занимается не одной командой в каждый момент времени, а несколькими.
    В конвейерной обработке используются алгоритмы предварительной выборки команд и данных. При загрузке команды блок предвыборки (prefetch) пытается предугадать, какие команды и данные потребуются дальше. Таким образом, конвейер загружается быстрее, поскольку не тратится время на ожидание результатов выполнения предыдущих команд.
  • Распараллеливание вычислений с помощью нескольких физических вычисли-тельных ядер. Современные многоядерные процессоры имитируют присутствие в системе двух, четырех и более отдельных процессоров. Если исполняемая про-грамма имеет функцию распараллеливания вычислений, разделяя их на несколько потоков (Threads), эти вычисления могут быть выполнены одновременно.
  • Поддержка алгоритмов обработки данных мультимедиа, работающих по принципу SIMD (Simple Instruction - Multiple Data, то есть одна команда - множество данных). Процессоры, поддерживающие подобные технологии, быстрее обрабатывают большие объемы данных, требующих многократного исполнения одинаковых команд. У процессоров Intel - технологии MMX и SSE, у процессоров AMD - 3DNow!

Алгоритм работы современного процессора

В данной главе мы рассмотрим достаточно упрощенную схему работы центрального процессора с описанием функций основных компонентов.

  • Запрос команды из памяти. Блок выборки пытается найти подходящую команду последовательно сначала в кэш-памяти первого уровня (L1), второго уровня (если команды нет в кэше L1), третьего уровня (если команды нет в кэш памяти L1 и L2). Если команды нет в кэше процессора, команда загружается из системной памяти через шину данных, последовательно проходя кэш всех трех уровней. По этому же алгоритму запрашиваются данные для выполнения этой команды.
  • Из блока выборки команда передается в декодер. В декодере команда разбивается на несколько микроопераций такого размера, что их можно выполнить за 1 такт работы исполнительных устройств. Последовательность микроопераций помещается в кэш. Блок предвыборки анализирует последовательность микроопераций, чтобы определить, какие команды понадобятся далее.
  • Планировщик выбирает из кэша-памяти блок микроопераций и формирует последовательность их выполнения. Команды, выполнение которых не зависят от выполнения других команд, исполняются параллельно на различных исполнительных устройствах: ALU (arithmetic-logic unit, арифметико-логическое устройство) для целых чисел, FPU (floating point unit, модуль операций с плавающей точкой), ALU для команд SSE и т.д. На данном этапе возможны ошибки предвыборки (например, неправильно выбранная следующая команда или неверно подобранные адреса данных в памяти), что влечет за собой очистку конвейера и переход к шагу 1 нашей схемы.
  • Проверяется корректность исполнения команды, результат помещается в кэш-память и предается по шине данных в системную память.

Как работает процессор в компьютере?

Когда вы нажимаете какую-нибудь клавишу, то электрический сигнал бежит по проводникам на контроллер клавиатуры. Это ясно любому. Но дальше – самое сложное. Далее, чтобы понять суть процессов, необходимо ввести понятие прерывания. Прерывание – это процесс отправления сигнала процессору, чтобы то приготовился на этот сигнал отреагировать. Процессор, если этот сигнал принимает, прекращает текущую операцию и возвращается к ней после исполнения прервавшей команды. Прерывания могут исходить от разных устройств или программ: диска, приложения, запущенного в Windows, клавиатуры с мышью и т.д. Реализация механизма прерываний – неотъемлемая часть архитектуры процессора.

Но вернёмся к нашим баранам. Так вот, нажав на клавишу, мы с клавиатуры посылаем сигнал по одной из 16 линий запроса этого самого прерывания, которые называются «ирками» (IRQ – interrupted request lines). Кстати, семь из них постоянно наблюдают за выделенными для этого механизма составляющими системы, в том числе и клавиатурой (точнее, его контроллером). И далее…

  • Контроллер передаёт сигнал в подсистему под названием контроллер прерываний, который работает как начальник военного штаба, постоянно контролируя процесс вмешательства в работу процессора 256-тью видами возможных прерываний, которые требуют внимания ЦП.
  • Другие электрические цепочки прерываний следят за шиной ввода-вывода, которая содержит в себе слоты расширения компьютера. Кстати, карты расширения, которые можно ставить в или могут использовать одну и ту же «ирку», так как запросы на эти карты или от этих слотов будут управляться функцией Plug and Play (о ней чуть позже).
  • Далее, контроллер прерываний посылает сигнал на один из штырьков, торчащих из основания процессора. Этот штырёк-контакт имеет своё название – INTR (INterrupT Request) и часто используется для таких вот сигналов прерываний. К слову сказать, есть ещё один контакт на «пузе» процессора, который носит название NMI (NonMaskable Interrupt – немаскируемое прерывание – это высокоуровневое аппаратное прерывание, которое нельзя замаскировать или запретить (например, прерывание по исчезновению питания или по нажатии заветных клавиш ); при его возникновении процессор всегда прерывает текущую работу).
  • Процессор приостанавливает текущую работу, записывая прерванную задачу в некую область под названием стек. Эта область или адрес памяти потом напомнит процессору, что в очереди на исполнение стоит эта задача.
  • Центральный процессор проверяет другой штырёк на предмет, какую кнопку вы нажали. Но перед тем, как вы увидите на экране последствие нажатой кнопки или клавиши, процессор проверит раздел памяти под названием таблица дескрипторов прерываний (IDT ). Если быть точным, ЦП выдаёт определённые инструкции в одну из ячеек IDT , которая и ассоциируется с нажатой нами клавишей. Сразу после этого инструкции под названием программа обслуживания прерываний (ISR) только-только сообщает процессору, что же он должен сделать, когда мы эту злополучную клавишу нажимаем. Кстати, вот этот тернистый путь позволяет заменить обычные инструкции (просто отобразить на экране нажатую клавишу) на операции, характерные именно для исполняемой программы (клавиша S в Word это латинская s , а в игре – движение назад или «присесть»).
  • Итак, ISR закончила свою работу и посылает процессору инструкцию RET (возврат от прерывания). Она и призывает процессор вернуться к отложенной им задаче. ЦП обращается в адрес памяти и продолжает работать с последней инструкцией отложенной задачи.

Вот как работает процессор, когда вы просто набираете одну лишь букву в любом редакторе.