Архитектуры х64 и х86: в чем разница
![]()
Архитектуры х64 и х86 являются одними из наиболее широко используемых типов архитектур системы команд (АСК или ISA – Instruction Set Architecture), созданными Intel и AMD. ISA определяет поведение машинного кода и то, как программное обеспечение управляет процессором.
ISA – это аппаратный и программный интерфейс, определяющий, что и как может делать ЦП.
Прочитав эту статью, вы узнаете разницу между архитектурами х64 и х86.
Что из себя представляет архитектура х86?
х86 – это тип ISA для компьютерных процессоров, разработанный Intel в 1978 году. Архитектура х86 основана на микропроцессоре Intel 8086 (отсюда и название) и его модификации 8088. Изначально это была 16-битная система команд для 16-битных процессоров, а позже она выросла до 32-битной системы команд.
Количество битов показывает, сколько информации ЦП может обработать за цикл. Так, например, 32-разрядный ЦП передает 32 бита данных за тактовый цикл.
Благодаря своей способности работать практически на любом компьютере, от обычных ноутбуков до домашних ПК и серверов, архитектура х86 стала достаточно популярной среди многих производителей микропроцессоров.
Наиболее значительным ограничением архитектуры х86 является то, то она может обрабатывать максимум 4096 Мб ОЗУ. Поскольку общее количество поддерживаемых комбинаций равно 2 32 (4 294 967 295), то 32-разрядный процессор имеет 4,29 миллиарда ячеек памяти. В каждой ячейке хранится 1 байт данных, а в сумме это примерно 4 Гб доступной памяти.
На сегодняшний день термин х86 обозначает любой 32-разрядный процессор, способный выполнять систему команд х86.
Что из себя представляет архитектура х64?
х64 (сокращение от х86-64) – это архитектура системы команд, расширенная до 64-битного кода. В ее основе лежит архитектура х86. Впервые она была выпущена в 2000 году. Она представляла два режима работы – 64-битный режим и режим совместимости, который позволяет пользователям запускать 16-битные и 32-битные приложения.
Поскольку вся система команд х86 остается в х64, то старые исполняемые файлы работают практически без потери производительности.
Архитектура х64 поддерживает гораздо больший объем виртуальной и физической памяти, чем архитектура х86. Это позволяет приложениям хранить в памяти большие объемы данных. Кроме того, х64 увеличивает количество регистров общего назначения до 16, обеспечивая тем самым дополнительную оптимизацию использования и функциональность.
Архитектура х64 может использовать в общей сложности 2 64 байта, что соответствует 16 миллиардам гигабайт (16 эксабайт) памяти. Гораздо большее использование ресурсов делает эту архитектуру пригодной для обеспечения работы суперкомпьютеров и машин, которым требуется доступ к огромным ресурсам.
Архитектура х64 позволяет ЦР обрабатывать 64 бита данных за тактовый цикл, что намного больше, чем может себе позволить архитектура х86.
х86 VS х64
Несмотря на то, что оба эти типа архитектуры основаны на 32-битной системе команд, некоторые ключевые отличия позволяют их использовать для разных целей. Основное различие между ними заключается в количестве данных, которые они могут обрабатывать за каждый тактовый цикл, и в ширине регистра процессора.
Процессор сохраняет часто используемые данные в регистре для быстрого доступа. 32-разрядный процессор на архитектуре х86 имеет 32-битные регистры, а 64-разрядный процессор – 64-битные регистры. Таким образом, х64 позволяет ЦП хранить больше данных и быстрее к ним обращаться. Ширина регистра также определяет объем памяти, который может использовать компьютер.
В таблице ниже продемонстрированы основные различия между системами команд архитектур х86 и х64.
Что лучше — x86 или ARM?

Две самые популярные процессорные архитектуры в мире — ARM и x86. Очевидно, что простого ответа на вопрос из заголовка нет. Но в этом тексте мы кратко перечислим плюсы и минусы обеих платформ и их перспективы на ближайшее будущее.
В чем разница
Приоритет процессоров x86 — максимальная производительность, а у ARM — высокая энергоэффективность. Совместить оба этих свойства в одном виде процессоров пока не получается. Поэтому первые чаще всего используют в настольных ПК, а вторые — в мобильных устройствах. На этот счет есть разные мнения, но в целом, эксперты сходятся во мнении, что разница в энергоэффективности все-таки есть.
Также важно помнить, что эти два типа процессоров сильно отличаются, поэтому одно и то же ПО не сможет работать с обоими одновременно. Каждая программа должна быть разработана под конкретный тип процессора. А теперь рассмотрим каждый тип подробнее.
x86
Этот тип архитектуры был создан в 1978 году и относится к разновидности CISC (Complex Instruction Set Computing). Если упрощенно, он предполагает, что в процессоре есть инструкции для большинства задач. Он применяется в настольных ПК, ноутбуках и других устройствах, которым нужна максимальная производительность без экономии на питании.
Так как история развития этих процессоров дольше, чем у ARM, они имеют больший набор команд. Это делает их очень сложными и продвинутыми, позволяющими выполнять множество сложных вычислений за короткое время. Здесь лучше виртуализация, предусмотрены разнообразные защитные методики. В случае с ARM-процессором, командный ассортимент пока более скудный, но разрыв постепенно сокращается. Причина — уменьшение техпроцесса и развитие производственных технологий.
Кроме повышенных энергопотребления и генерации тепла к минусам можно отнести сложность и запутанность команд из-за долгой истории развития.
ARM
ARM был создан в 1985 году британской компанией Acorn и принадлежит к типу RISC (Reduced Instruction Set Computing). Здесь другой подход — процессор содержит минимальное количество необходимых для работы команд. За счет этого инструкции здесь проще и меньше.
Перед разработчиками ARM стояла цель создать архитектуру, свободную от недостатков x86. Можно точно сказать, что им удалось сделать крайне эффективную и недорогую архитектуру. Популярности ARM-процессоров на рынке мобильных устройств способствовало не только это. Вот ряд дополнительных преимуществ :
- они дешевле в производстве и развертывании;
- архитектура ARM позволяет крупным поставщикам создать свои собственные решения на ARM-архитектуре для разных ниш;
- гибкие возможности настройки.
Кроме того, эффективное потребление энергии и отсутствие перегрева делают такие процессоры оптимальным выбором для серверных задач, а также для использования в маршрутизаторах и высокопроизводительных решениях хранения данных.
Если же говорить о недостатках, то они заключаются в следующем — из-за минимизации размеров и фокуса на автономности, данные обрабатываются медленнее и менее производительно, чем x86. Кроме того, если какая-то существующая часть ИТ-инфраструктуры построена на решениях от x86, следует учитывать это при выборе ARM. Одно и то же ПО на обоих решениях не запустится, для одного из них его точно придется адаптировать.
Таким образом, позволим себе сделать осторожный прогноз: похоже, все идет к победе ARM-архитектуры, но утверждать это с вероятностью в 100 % пока нельзя. В любом случае, на сегодняшний день ARM точно не выглядит универсальным решением для любых задач.
Разбираемся в архитектурах: x86, ARM и RISK-V
![]()
О микропроцессорных архитектурах слышали даже те, кто особо не интересуется компьютерными технологиями. Особенно на фоне последних новостей, например, когда Apple начали устанавливать в свои ноутбуки собственные процессоры на архитектуре ARM. Так что такое архитектура, чем отличаются x86 и ARM и что еще за RISC-V? Расскажем подробнее в нашем материале.
Архитектура x86
В первую очередь давайте выясним, что в принципе стоит понимать под словом «архитектура». В общем понятии этого термина:
Архитектура — набор свойств и качеств, присущих какому-либо семейству процессоров.
При этом не стоит путать термин с «микроархитектурой» — он, как правило, определяет внутреннюю организацию процессора на более глубоком уровне. Например, практически все процессоры Intel имеют архитектуру x86, а вот микроархитектура меняется с каждым новым поколением — Palm Cove (2018), Sunny Cove (2019) и так далее.
![]()
На x86 созданы процессоры, начиная от Intel 8086 и заканчивая Core i7/Core i5/Core i3, Xeon. С 2001 также фигурирует название x86-64 — это расширенная архитектура с поддержкой 64-битных регистров.
Таким образом, архитектура — это общий принцип того, как устроен, на каких принципах и с какой системой команд работает процессор. Проще говоря, если вы хотите заставить процессор выполнить какую-то задачу, ее нужно для начала объяснить. Но как именно, сколько и каких команд для этого потребуется — это и определяет архитектура.
Еще несколько десятилетий назад команды для процессоров прописывались буквально вручную через единицы и нули. Это было невероятно долго и утомительно, поэтому спустя какое-то время появился машинный язык программирования — Ассемблер. С его помощью можно было реализовывать простейшие действия вроде сложения, вычитания и так далее уже небольшими командами. Если кто-то из вас изучал Ассемблер в университете, то вы знаете, что писать на нем какие-то программы — задача не из простых.
![]()
В итоге инженеры решили, а что если сделать так, чтобы команда вмещала как можно больше полезных действий, могла выполнять и загрузку из памяти, и какую-то арифметическую операцию. Так появилась CISC (complex instruction set computing) архитектура. Почему мы ее упоминаем? x86 — это самый яркий пример CISC-архитектуры.
Соответственно, многое, что актуально для CISC, будет актуально и для x86, а именно:
- нефиксированная длина команды;
- малое количество регистров общего назначения;
- большое количество различных машинных команд;
- развитый механизм адресации операндов.
В данном случае архитектура определяет не только некоторые конструктивные особенности (число регистров), но и способ взаимодействия с процессором — систему команд.
Архитектура x86 обеспечивает большие удобства для программистов — множество предподготовленных команд позволяли выполнять определенные действия за минимальное количество строк кода — а это существенная экономия времени и сил. Все эти команды сохранили в ROM-память. Например, в Intel 8086 было «зашито» 98 команд. Программистам было достаточно лишь вызывать нужные.
![]()
Архитектура x86 поддерживает несколько режимов работы. Изначально был реализован только реальный режим. Самый простой способ его охарактеризовать — вся память доступна всем. Любое приложение, в том числе и вредоносное, могло получить доступ к любым данным, даже системным.
Решением этой проблемы стало появление защищенного режима, а точнее — колец защиты. Нулевой уровень — самый привилегированный и имеет неограниченный доступ. Этот уровень получили лишь системные процессы. Четвертый уровень в свою очередь имеет минимальный доступ к памяти — его получают всевозможные пользовательские процессы.
![]()
Также одной из особенностей х86 является технология SSE (Streaming SIMD Extensions) — набор инструкций, разработанный Intel для вычислений с плавающей точкой. Скалярные процессоры обрабатывают один элемент данных за одну инструкцию (SISD), а векторные способны обрабатывать уже несколько элементов данных (SIMD). Для ускорения процесса вычислений в архитектуре появились так называемые SIMD-расширения. Они позволяли, например, сразу перемножать четыре пары чисел за одну команду.
Если не вдаваться в технические подробности, набор инструкций SSE, а в последствие AVX, позволил повысить производительность до восьми раз в определенных алгоритмах.
![]()
С 2005 года архитектура x86 также поддерживает виртуализацию. Это сокрытие фактической реализации через предоставление искусственных «виртуальных» ресурсов. Большинству обычных пользователей виртуализация знакома по таким продуктам, как VMWare и VirtualBox, когда на базе своей ОС вы могли запускать другие операционные системы.
На архитектуре x86 работают практически все десктопные процессоры от Intel и AMD. Несмотря на такое преобладание, x86 и CISC-архитектура в целом имеет ряд минусов.
Главная проблема — это неоднородность инструкций. Они могут иметь разную длину и структуру, из-за чего требуется больше тактов на обработку и больше обращений к памяти. Соответственно, для повышения производительности приходится улучшать аппаратную часть. Это выливается в увеличение не только стоимости, но и тепловыделения.
Именно поэтому, несмотря на все попытки, процессоры на x86-архитектуре так и не смогли пристроить в мобильную электронику. Одной из попыток является линейка процессоров Atom от Intel — некоторые модели встраивались даже в смартфоны и планшеты.
![]()
Однако еще в середине 70-х годов инженеры задумывались над проблемой сложных команд. Так появился новый архитектурный подход RISC и одна из его реализаций – ARM.
Архитектура ARM
В философии RISC (англ. Reduced Instruction Set Computer — «компьютер с сокращенным набором команд») инженеры решили устранить главный недостаток CISC. Команды сделали фиксированной длины, но при этом увеличили число регистров, чтобы иметь большее пространство для работы с данными и реже обращаться к памяти.
![]()
С точки зрения программирования стало сложнее, поскольку из-за унификации команд одно и то же действие в RISC требует больше инструкций, чем в CISC.
![]()
Однако с другой стороны единая длина для всех команд позволила существенно снизить требования к аппаратной начинке процессора. Это в свою очередь привело к удешевлению, пониженному энергопотреблению и тепловыделению.
Стоит понимать, что RISC — это всего лишь концепция, архитектурный подход. Преимущества этого подхода сразу же приметили в британской компании ARM Limited. Они внесли различные усовершенствования в эту концепцию и уже в 1985 году представили свой первый процессор ARM1. В последствие под ARM начали понимать авторскую лицензируемую архитектуру процессоров.
Поскольку изначально ARM задумывалась как усовершенствование архитектуры RISC, то для ранних чипов были характерны некоторые общие черты:
- фиксированный размер команд;
- большое число регистров общего назначения;
- специализированные команды для операций с памятью — чтения или записи.
Однако постепенно разработчики ARM вносили все больше изменений и модификаций, отклоняясь от классической концепции RISC. Например, из 31 регистра программисту доступно всего 16, что не так уж и много. Также в некоторых случаях одна команда в ARM может выполнять не только обработку данных (например, сложение) но и сдвиг. Это позволяет частично уменьшить сложность кода, но за счет увеличения сложности самих команд. Еще одно важная особенность ARM — это развитый набор видов адресации, который изначально не задумывался в концепции RISC архитектуры.
Помимо этого в ARM имеется условное исполнение. Проще говоря, каждая команда может исполняться или не исполняться в зависимости от определенных предустановок (установленных флагов).
Современные мобильные процессоры — это сложная система на кристалле. Помимо ARM-ядер используются всевозможные узкоспециализированные чипы. Например, NEON Data Engine — это, по сути, аналог расширения SSE для архитектуры x86.
![]()
Что же получается, архитектура ARM — это более дешевый и унифицированный, но за счет этого менее производительный вариант, чем процессоры на x86-архитектуре? В каком-то смысле — да. Принципиально другой подход к формированию команд и некоторые другие конструктивные особенности сделали ARM отличным вариантом для процессоров мобильной электроники. Однако граница между архитектурами становится все менее явной.
Во-первых, в x86-процессорах уже используется разбиение длинных инструкций на более мелкие. Фактически, в CISC-процессорах применяется своеобразное RISC-ядро, что позволяет повысить производительность. Во-вторых, производительность ARM процессоров постепенно догоняет x86 — Apple M1 и его вариации один из самых ярких примеров. Соответственно, процессоры на этой архитектуре, как и x86, уже могут использоваться в ноутбуках и даже ПК. Почему ARM может стать будущей архитектурой для персональных компьютеров мы рассказали в отдельном материале.
Ключевое отличие этих двух архитектур заключается в системе команд, что свою очередь приводит к различным конструктивным различиям, вроде числа регистров и дополнительных модулей.
Архитектура x86, несмотря на сложные команды и требовательность к аппаратной части, все еще остается одним из лучших решений в соотношении цены и производительности. Переходы на новые техпроцессы и многоядерность позволяют и дальше использовать х86 для высокопроизводительной техники вроде ноутбуков, персональных компьютеров и серверов.
В свою очередь ARM хоть и задумывалась изначально как RISC-подобная, со временем обросла множеством усовершенствований. Это дает приближенную к десктопным процессорам производительность, но, как можно заметить с теми же чипами M1 и M2, еще и больший размер кристалла и тепловыделение. Например, площадь чипа Apple M2 доходит до 155 мм 2 , что сравнимо с площадью чипа Intel Core i7 8700K.
![]()
Архитектура RISC-V
Как мы выяснили, ARM и x86 — это своеобразные противоположности, у каждой из которых свои достоинства и недостатки. Архитектура x86 не подходит для мобильной электроники, но ARM требует лицензирования. Если вы захотите спроектировать свой процессор на архитектуре ARM, вам придется заплатить от одного миллиона долларов. Так что же делать?
Над этим вопросом задумались в отделении информатики Калифорнийского университета в Беркли и в 2010 году представили RISC-V. Первая и самая главная отличительная черта — это полностью открытая архитектура, а значит, вы можете использовать ее абсолютно бесплатно.
![]()
RISC-V — это также улучшенная версия классической RISC. Набор команд не представляет собой какую-либо новую технологию, поскольку RISC-V основана на идеях компьютерной архитектуры, которым уже не менее 40 лет. Да, фактически RISC-V — это реализация того самого подхода под названием RISC, который инженеры придумали еще несколько десятилетий назад.
Главное достоинство RISC-V в том, что архитектура не подвергается чрезмерной оптимизации, поэтому подходит для самых разнообразных вычислительных задач. Базовая RISC-V содержит минимальный набор инструкций — всего 47, но при необходимости программисты могут самостоятельно расширять его для решения конкретно своей задачи. Это модульная структура — то есть вы можете взять только то, что вам необходимо.
![]()
RISC-V и ARM-архитектуры основаны на одном подходе — RISC (Reduced Instruction Set Computer). В связи с этим они обе подходят для микроэлектроники. Однако ARM — платная и по ходу своего развития претерпела множество изменений. Представьте себе автомобиль, который поддался тюнингу — он стал быстрее и мощнее, но за это приходится платить.
RISC-V в свою очередь — это нетронутый, «стоковый» автомобиль. Да, он не такой быстрый, но бесплатный и, самое главное, вы сами можете выбирать, что в нем «тюнинговать». RISC-V с успехом применяется в простейших микропроцессорах — там, где не нужна высокая производительность.
Самый известный пример — это контроллеры для SSD-дисков Western Digital. Компания Alibaba развивает чипы на RISC-V в рамках дочерней компании T-Head. Также уже выпущено больше десяти различных контроллеров на базе этой архитектуры. Число участников международной организации RISC-V перевалило за сотню — все эти компании видят для себя перспективы в этой архитектуре.
![]()
Что в итоге
Архитектура x86 — это яркий представитель CISC-архитектур: большие и сложные команды, требовательность к аппаратной части и высокое энергопотребление. ARM и RISC-V — это представители лагеря RISC-архитектур: упрощенные команды фиксированной длины, небольшое энергопотребление и меньшая требовательность к аппаратной части.
Архитектура ARM — это полностью коммерческое решение, поэтому оно предлагает высочайшую производительность и целую линейку готовых ядер для разных нужд. RISC-V в свою очередь — это базовый конструктор, на основе которого можно проектировать нетребовательные к производительности системы.
Современные процессорные архитектуры
В статье кратко описаны современные процессорные архитектуры, перечислены их особенности и преимущества.
В ЗАКЛАДКИ
Процессорная архитектура
В ходе развития компьютерных технологий были разработаны различные вычислительные системы. Многие из них забыты, а влияние некоторых было весьма значимым. Наметились стратегические тенденции в развитии вычислительной техники и сформировались компьютерные архитектуры. На текущий момент существует несколько основных архитектур и значительное количество процессоров на их основе.
Процессорную архитектуру можно трактовать как комбинацию вычислительной архитектуры и её реализацию в процессоре (в кремнии), то есть рассматривать в аспекте программирования и аппаратно-технических (и технологических) решений. Нужно отметить, что кардинальное отличие архитектур и их несовместимость обнаруживаются именно на уровне машинного кодирования или низкоуровневого программирования (ассемблирования).
С программной точки зрения, процессорная архитектура определяет набор регистров, команд, их структуру и способ выполнения, в результате чего, с одной стороны, программы, собранные для процессоров одной архитектуры, могут выполняться практически на всех процессорах одинаковой (или подобной) архитектуры, а с другой – не смогут работать на процессорах иной архитектуры. Для работы на разных платформах производители программного обеспечения вынуждены выпускать специально скомпилированные (или портированные – перенесённые) для них версии. Примером может служить операционная система Ubuntu Server (ядро Linux), для которой производитель, компания Canonical, кроме основной версии для архитектуры Intel x86 (AMD64), выпустила версии для архитектур ARM, IBM Power и s390x [1]. Также в качестве примера можно привести компанию Microsoft, которая изначально распространяла операционную систему Windows исключительно для архитектуры х86, но с недавнего времени, следуя требованиям рынка и отрасли, объявила о сотрудничестве с компанией Qualcomm [2] и выпустила версию операционной системы Windows 10, работающую на устройствах с процессорами архитектуры ARM (Qualcomm Snapdragon 835) [3]. Из российских ОС следует отметить многоплатформенную операционную систему Astra Linux Special Edition компании АО «НПО РусБИТех», которая существует в версиях для архитектур x86-64 (релиз «Смоленск»), ARM (релиз «Новороссийск»), MIPS (релиз «Севастополь»), IBM System Z (релиз «Мурманск»), POWER (релиз «Керчь») и «Эльбрус» (релиз «Ленинград») [4].
С аппаратной точки зрения, архитектура процессора – это набор составных частей, компонентов и технологий, присущих линейке процессоров. Аппаратная часть постоянно совершенствуется, как по микроархитектуре, так и по технологическому процессу. Выпускаются новые поколения процессоров с целью увеличения производительности и функциональности. Так, на рынке существуют процессоры Intel нескольких поколений: Coffee Lake (восьмое поколение), Kaby Lake (седьмое поколение), Skylake (шестое поколение) и другие. Несмотря на смену микроархитектуры (аппаратной части), они остаются программной архитектурой x86, и на них работает всё ранее написанное для этой архитектуры программное обеспечение, за некоторым исключением, если разработчик ПО использовал недокументированные методы, вызовы и процедуры.
Поэтому, с точки зрения практического применения процессоров, основной является программная архитектура. На текущий момент актуальные и распространённые архитектуры – это CISC, RISC, VLIW.
Архитектура CISC
Первоначально почти все производители первых микропроцессоров использовали архитектуру с расширенным набором команд – CISC (Complex Instruction Set Computer). Причина этого в том, что разработчики пытались уменьшить так называемый семантический разрыв между тем, что компьютеры способны делать, и тем, что требуют языки программирования высокого уровня, пытаясь заменить одной инструкцией многочисленные машинные коды. Также в то время на рынке коммерческих вычислений доминировали мини-компьютеры PDP компании DEC и мейнфреймы компании IBM, которые были основаны на архитектуре CISC. Среди микропроцессоров типичными представителями данной архитектуры стали процессоры компании Intel. На начальном этапе развития микропроцессоров (семидесятые годы прошлого века) были и другие процессоры подобной архитектуры производства компаний Motorola, Zilog, MOS Technology и т.д. Но именно благодаря коммерческой привлекательности микропроцессоров Intel эта архитектура стала самой популярной на текущий момент и практически единственной для персональных компьютеров. Даже компания Apple в своих компьютерах Apple Macintosh в итоге перешла от процессоров PowerPC к процессорам Intel.
Первый процессор Intel, обозначивший начало эпохи микропроцессоров, – микросхема Intel 4004 (рис. 1) – появился в 1971 году [5].
Это был первый коммерческий процессор, реализованный в одной микросхеме. Следует отметить, что сотрудники Intel не догадывались, какое грандиозное открытие они совершили. Эта микросхема вызвала большой интерес и значительный спрос. Компания Intel стала наращивать функциональность, разрядность и повышать частоту микропроцессора. В 1978 году был представлен 16-битный процессор Intel 8086, положивший начало архитектуре x86, или Intel x86. Популярность микроархитектуры х86 была столь велика, что аналогичные процессоры стали выпускать другие производители.
В 1985 году компания Intel выпустила первый 32-битный процессор Intel 386 (рис. 2).
Таким образом сформировалось понятие архитектуры Intel Architecture 32-bit (IA-32), она же Intel х86, или просто x86 [6].
В дальнейшем она стала 64-битной и получила название x86-64, или AMD64, так как впервые 64-битное расширение архитектуры х86 представила компания AMD. Нужно отметить, что Intel x86 не следует путать с Intel Architecture 64-bit (IA-64), которая является принципиально другой архитектурой VLIW, о чём будет сказано позже.
Формально все процессоры х86 являются процессорами CISC-архитектуры.
Итак, x86 – это типичный представитель CISC-архитектуры. Таким образом, в современной интерпретации, говоря CISC, подразумеваем х86, и наоборот.
Для архитектуры CISC характерно:
1) малое количество регистров общего назначения;
2) большое количество различных машинных команд, каждая из которых выполняется за несколько тактов процессора;
3) различные форматы команд с разной длиной;
4) преобладание двухадресной системы команд;
5) развитой механизм адресации операндов.
Основными плюсами данной архитектуры можно считать простоту и эффективность программирования (несколько команд могут быть заменены одной более сложной), а также большое историческое наследие в виде множества написанных для неё программ.
Данная архитектура на текущий момент является основной для настольных и серверных систем.
Производительность
Разработчики вычислительных систем постоянно стремятся к повышению их производительности, определяющим показателем которой является количество инструкций, выполненных за единицу времени.
Общую формулу производительности можно представить в виде:
P = N ⁄ t, (1)
где P – производительность, N – количество инструкций, t – время выполнения.
Добавив количество тактов, необходимых для выполнения инструкций (n), формулу (1) можно представить следующим образом:
P = N ⁄n × n ⁄t. (2)
Первая часть произведения – это количество инструкций, выполняемых за один такт, а вторая – количество тактов процессора за единицу времени, то есть тактовая частота процессора. Таким образом, как следует из выражения (2), для увеличения производительности процессора нужно либо поднимать тактовую частоту, либо увеличивать число инструкций, выполняемых за один такт.
Самый простой способ увеличения скорости вычислений – повышение тактовой частоты процессора. Однако на этом пути существуют некоторые технологические ограничения, не позволяющие постоянно наращивать частоту. Поэтому большинство проектировщиков для повышения производительности при данной тактовой частоте процессора применяют параллелизм – исполнение двух и более инструкций одновременно.
Параллелизм может быть на уровне команд и уровне процессоров. В случае параллелизма на уровне команд происходит запуск большего количества команд в секунду. В случае параллелизма на уровне процессоров над одним заданием работают одновременно несколько процессоров. Каждый подход имеет свои преимущества, и в современных системах используются оба подхода.
Конвейер

Первоначально с целью повышения быстродействия при той же тактовой частоте в центральный процессор была введена конвейерная архитектура (Pipelining).
Обычно для выполнения каждой команды требуется осуществить некоторое количество однотипных операций, таких как выборка команды, дешифрация команды, выборка операнда, выполнение команды и запись результата.
Выполнение каждой из этих операций сопоставляют с одной ступенью конвейера (рис. 3).
На рисунке видно, как работает конвейер во времени. В момент времени 5 происходит выполнение уже пяти команд одновременно. Если принять время цикла равным 2 нс, тогда для выполнения инструкции (прохождения через конвейер) потребуется 10 нс. В результате конвейерной обработки, когда каждый такт конвейер выдаёт результат, время выполнения инструкции будет 2 нс.
Архитектура RISC

Повышение производительности CISC-микропроцессоров из-за особенностей архитектуры приводило к росту количества транзисторов, в результате чего кристаллы становились всё более сложными и дорогостоящими в производстве. Вопросы закрывались конструктивно-технологическими решениями, но в конечном итоге по экономическим соображениям уже не давали адекватного роста производительности.
CISC-архитектура в первозданном своём виде достигла потолка производительности. Применение конвейера для повышения производительности требовало использования простых и быстрых команд. Необходимость дальнейшего роста производительности привела к использованию архитектуры RISС (Reduced Instruction Set Computer), что означает «компьютер с сокращённым набором команд» (табл. 1).
Архитектура была разработана в рамках проекта Berkeley RISC. В 1980 году группа разработчиков приступила к созданию процессора, не ориентированного на интерпретацию, в котором инструкции должны выполняться процессорным ядром без использования микрокода. Исследования работы процессора Motorola 68000 показали, что программы попросту не использовали подавляющее большинство инструкций, заложенных в процессор. Работал принцип 80/20, то есть большее время выполнения типовых программ (80–90%) приходится на относительную малую часть команд процессора (10–20%). Планировалось создать процессор, который бы содержал лишь самые необходимые инструкции. При этом не только уменьшилось общее количество процессорных инструкций, принципиальное отличие заключается в том, что любая инструкция платформы RISC является простой и выполняется за один такт (по крайней мере, должна выполняться), тогда как на выполнение СISC-инструкции могло уходить несколько десятков тактов. При этом длина команды является фиксированной.
Основные особенности RISC-процессоров [7]:
- Сокращённый набор команд.
Первый «настоящий» RISC-процессор имел всего 31 команду. В дальнейшем их количество постепенно росло и достигло 100–200 инструкций в зависимости от реализации процессора. Но это всё равно в несколько раз, а то и на порядок меньше инструкций CISC-процессоров. - Большинство команд выполняется за один такт.
Все команды выполняются непосредственно аппаратным обеспечением, то есть напрямую без интерпретации микрокомандами. Устранение уровня интерпретации повышает скорость выполнения команд. В компьютерах типа CISC более сложные команды разбиваются на несколько шагов, которые потом выполняются как последовательность микрокоманд. - Большое количество регистров общего назначения.
Доступ к памяти происходит относительно медленно. Если слово было загружено из памяти, оно может храниться в регистрах до тех пор, пока не потребуется. Возвращение слова из регистра в память весьма нежелательно, и лучший способ избежать лишних изменений – это наличие достаточного количества регистров. - Наличие жёстких многоступенчатых конвейеров.
Компьютер должен запускать как можно большее количество команд в секунду. Важным фактором повышения производительности является параллелизм, поскольку запустить на выполнение большое количество команд за короткий промежуток времени можно только в случае, если есть возможность одновременного выполнения нескольких команд. Параллелизм на уровне команд (одновременный запуск) обеспечивается многоступенчатыми конвейерами. - Все команды имеют простой формат, и используются немногие способы адресации.
Команды легко декодируются, и к памяти обращаются только команды загрузки и сохранения. - Наличие вместительной раздельной кэш-памяти.
Это необходимо для уменьшения обращений к памяти и тем самым обеспечения необходимого быстродействия для заполнения регистров и конвейеров. - Использование оптимизирующих компиляторов, которые анализируют исходный код и частично меняют порядок следования команд.
Упрощение набора команд призвано сократить конвейер, что позволяет избежать задержек на операциях условных и безусловных переходов. Однородный набор регистров упрощает работу компилятора при оптимизации исполняемого программного кода. Кроме того, RISC-процессоры отличаются меньшим энергопотреблением и тепловыделением.
Уже первые микропроцессоры RISC значительно опережали процессоры CISC по производительности. Учитывая это, можно было предположить, что они должны были занять доминирующее положение на рынке. Но этого не произошло, по крайней мере, по двум причинам. Во-первых, компьютеры RISC несовместимы с архитектурой Intel x86, а многие компании уже вложили значительные средства в программное обеспечение для продукции Intel. И во-вторых, компания Intel сумела воплотить те же идеи в своей архитектуре. Здесь следует отметить, что упомянутый ранее процессор Intel 386 был последним процессором Intel с так называемой классической CISC-архитектурой. Столкнувшись с ограничениями по повышению производительности, компания Intel в процессоре следующего поколения Intel 486 применила RISC-ядро и добавила другие элементы RISC-архитектуры, такие как кэш-память и конвейеры. Теперь процессорное ядро стало выполнять самые простые (и обычно самые распространённые) команды за один цикл, а по обычной технологии CISC интерпретируются более сложные команды. В результате обычные команды выполняются быстро, а более сложные и редкие – медленно. Хотя при таком смешанном подходе производительность ниже, чем в архитектуре RISC, новая архитектура CISC имеет ряд преимуществ, поскольку, с одной стороны, появилась возможность повышения производительности, а с другой, можно использовать старое программное обеспечение без изменений.
Эта гибридная структура привела современные процессоры x86 к тому, что бо́льшую часть площади кристалла занимают элементы, предназначенные для переделки CISC-инструкций в RISC-инструкции, разрешения конфликтов, прогнозирования переходов, исправления последствий неправильных прог-нозов и для решения других подобных задач. Для реальной вычислительной работы остаётся только небольшое количество элементов.
Реализацией RISC-архитектуры являются процессоры ARM, MIPS, PowerPC, SPARC и R1000 – российский процессор с 64-битной архитектурой SPARC v.9 производства АО «МЦСТ».
Суперскалярность
Вычислительные операции могут быть скалярными и векторными.
При выполнении инструкции скалярным процессором обрабатывается один или два операнда (скаляра). В векторных операциях в качестве операндов выступают упорядоченные массивы данных – векторы.
В векторном процессоре, в отличие от обычного, который также может выполнять однотипные операции с множеством данных (инструкция SIMD – Single Instruction Multiple Date), все операции выполняются в одном блоке суммирования, который имеет конвейерную структуру. Примером являются процессоры компании Cray Research, начиная с модели Cray 1, выпущенной в 1974 году.
Скалярный процессор выполняет операции последовательно одна за другой. Последним скалярным процессором компании Intel была модель 80486 – 32-битный микропроцесcор x86 четвёртого поколения, выпущенный в 1989 году. Он имел пятиступенчатый конвейер [8]. Следующий процессор Intel Pentium имел уже два таких конвейера.
Схема с двумя конвейерами представлена на рис. 4.
После выборки из памяти двух инструкций каждая помещается в один из конвейеров. Чтобы выполняться параллельно, инструкции не должны конфликтовать из-за ресурсов и ни одна из них не должна зависеть от результата выполнения другой. Как и в случае с одним конвейером, либо компилятор должен гарантировать отсутствие конфликтов при выполнении инструкций, либо это выявляется и устраняется дополнительным оборудованием непосредственно в ходе выполнения инструкции.
Специальные компиляторы для процессора Intel Pentium объединяли совместимые команды в пары и генерировали программы, которые могли выполняться быстрее, чем в предыдущих версиях процессоров. В некоторых случаях, например при операциях с целыми числами, при той же тактовой частоте программы на процессоре Intel Pentium исполнялись вдвое быстрее, чем на процессоре Intel 486. Выигрыш достигался благодаря второму конвейеру.
Дальнейшее увеличение конвейеров было весьма сложно и громоздко в технической реализации, поэтому был использован другой подход – один конвейер с большим количеством функциональных блоков – суперскалярная архитектура.
Суперскалярный процессор реализует параллелизм на уровне инструкций, это обеспечивается за счёт включения в конвейер нескольких функциональных узлов. В 1987 году для обозначения данного подхода был введён термин «суперскалярная архитектура». На рис. 5 показан конвейер с пятью функциональными блоками.
VLIW-процессоры
Архитектура VLIW (Very Long Instruction Word – сверхдлинное командное слово) основывается на явно выраженном параллелизме вычислений, заложенном в систему команд процессора, – EPIC (Explicitly Parallel Instruction Computing – вычисления с явным параллелизмом команд).
Основной принцип организации этой архитектуры сводится к тому, чтобы перенести нагрузку с периода исполнения в период компиляции. Суперскалярный процессор в ходе исполнения переупорядочивает команды, подменяет регистры, распределяет функциональные блоки и выполняет множество других функций, что ведёт к максимальной загрузке аппаратных ресурсов. В архитектуре VLIW эти задачи заранее решает компилятор, который располагает полной и достоверной информацией о регистрах процессора и генерирует оптимальный код, в котором нет конфликтов между регистрами. Кроме того, компилятор следит за загрузкой функциональных блоков и не запускает команды, в которых предполагается обращение к занятым функциональным блокам.
Поток команд в суперскалярном процессоре планируется динамически аппаратным планировщиком с ограничениями по времени и ресурсам. В архитектуре VLIW компилятор планирует поток команд статически и в принципе не ограничен временны́ми и аппаратными ресурсами, что позволяет генерировать оптимальный исполнительный код. В результате на вход VLIW-процессора поступает последовательность больших команд, состоящих из нескольких простых операций, которые могут выполняться параллельно разными функциональными блоками (рис. 6). 
В отличие от суперскалярной архитектуры VLIW-процессор имеет простой, а значит, и более быстрый исполнительный конвейер с минимальным количеством ступеней (рис. 7). 
Итогом такого подхода, с одной стороны, являются следующие преимущества архитектуры [9].
- Прежде всего, это более тщательное планирование выполнения программы и оптимизация кода, что даёт лучшее заполнение исполнительных устройств и выполнение большего количества операций за такт.
- В связи с переносом функциональности на компилятор в процессоре меньше места тратится на функциональные блоки, отвечающие за управление, и больше площади остаётся непосредственно на вычислительные ресурсы, такие как регистры, исполнительные устройства и кэш-память.
- Это, в свою очередь, приводит к упрощению конструкции процессора и технологического процесса его производства, уменьшению количества транзисторов и понижению тепловыделения.
С другой стороны, необходимо учитывать некоторые особенности.
- Сложный компилятор, разработка, поддержка и оптимизация которого довольно ресурсоёмки, требует постоянных доработок и оптимизации и целиком лежит в зоне ответственности разработчика процессора.
- Компилятор должен иметь точную информацию об архитектуре процессора – регистрах и исполнительных устройствах. Таким образом, возникает необходимость компиляции кода для каждого типа процессора при изменении в его архитектуре.
- Возрастает время компиляции, что, в принципе, не является проблемой при наличии высокопроизводительных рабочих станций у программистов.
- Становится сложно учесть динамику исполнения программы при наличии условных ветвлений на основе входящих динамических данных.
Несмотря на ограничения, связанные с несовместимостью процессоров VLIW с классической архитектурой, они незаменимы в случае, когда необходимо добиться высочайшей производительности. Примерами VLIW-процессора являются Intel Itanium архитектуры IA-64 (Intel Architecture 64-bit) и «Эльбрус» (архитектура «Эльбрус 2000») производства компании «МЦСТ».
Заключение
Развитие процессорных архитектур характеризуется постоянным стремлением к повышению производительности вычислительных систем. Каждая из указанных архитектур стремится компенсировать недостатки и ограничения других. И в то же время при улучшении одних характеристик могут ухудшиться другие. Поэтому все современные архитектуры находят применение в компьютерных системах, в зависимости от решаемых задач и условий применения. ●
Литература
1. Scale out with Ubuntu Server [Электронный ресурс] // Режим доступа : https://ubuntu.com/server.
2. Qualcomm Collaborates with Microsoft to Support Windows 10 Computing Devices on Next Generation Qualcomm Snapdragon Processors [Электронный ресурс] // Режим доступа : https://www.qualcomm.com/news/releases/2016/12/08/qualcomm-collaborates-microsoft-support-windows-10. .
3. Windows 10 на архитектуре ARM [Электронный ресурс] // Режим доступа : https://docs.microsoft.com/ru-ru/windows/uwp/porting/apps-on-arm.
4. Операционная система специального назначения Astra Linux ® Special Edition [Электронный ресурс] // Режим доступа : https://astralinux.ru/products/astra-linux-special-edition/.
5. The Story of the Intel® 4004. Intel’s First Microprocessor. Its invention, introduction, and kasting influence [Электронный ресурс] // Режим доступа : https://www.intel.ru/content/www/ru/ru/history/museum-story-of-intel-4004.html.
6. Intel ® 64 and IA-32 Architectures Software Developer’s Manual [Электронный ресурс] // Режим доступа : https://software.intel.com/sites/default/files/managed/a4/60/253665-sdm-vol-1.pdf.
7. Sivarama P. Dandamudi. Guide to RISC Processors: For Programmers and Engineers. – USA : Springer Science+Business Media, Inc., 2005.
8. Embedded Intel486™ Processor Family Developer’s Manual. – USA : Intel Corporation, 1997.
9. An Introduction To Very-Long Instruction Word (VLIW) Computer Architecture [Электронный ресурс] // Режим доступа : http://twins.ee. nctu.edu.tw/courses/ca_08/literature/11_vliw.pdf.
Авторы – сотрудники фирмы «Адвантикс»
Телефон: (495) 232-1693
E-mail: info@advatix-pc.ru