Курсовая: Новые технологии в организации PC - текст курсовой. Скачать бесплатно.
Банк рефератов, курсовых и дипломных работ. Много и бесплатно. # | Правила оформления работ | Добавить в избранное
 
 
   
Меню Меню Меню Меню Меню
   
Napishem.com Napishem.com Napishem.com

Курсовая

Новые технологии в организации PC

Банк рефератов / Радиоэлектроника

Рубрики  Рубрики реферат банка

закрыть
Категория: Курсовая работа
Язык курсовой: Русский
Дата добавления:   
 
Скачать
Архив Zip, 512 kb, скачать бесплатно
Заказать
Узнать стоимость написания уникальной курсовой работы

Узнайте стоимость написания уникальной работы

- 31 - МОиПО Рязанская Государственная Радиотехническая Академия ФВТ Кафедра ЭВМ Курсовой проект по АСВТ На тему “Новые технологии в организации PC ” Выполнил студент гр .742 Девятк ин Проверил Локтюхин Рязань , 2000 1. Типоразмеры (форм-факторы ) материнских плат На сегодняшний день существует четыре преобладающих типоразмера материнских плат – AT, ATX, LPX и NLX. Кроме того , есть уменьшенные варианты формата AT (Baby-AT), ATX (Mini-ATX, microATX) и NLX (microNLX). Более того , недавно выпущено расширение к спецификации microATX, добавляющее к этому списку новый форм-фактор – FlexATX. Все эти спецификации , определяющие форму и размеры материнских плат , а также расположение компо н ентов на них и особенности корпусов , и описаны ниже . AT Форм-фактор АТ делится на две , отличающиеся по размеру модификации - AT и Baby AT. Размер полноразмерной AT платы достигает до 12" в ширину , а это значит , что такая плата вряд ли поместится в большин ство сегодняшних корпусов . Монтажу такой платы наверняка будет мешать отсек для дисководов и жестких дисков и блок питания . Кроме того , расположение компонентов платы на большом расстоянии друг от друга может вызывать некоторые проблемы при работе на боль ш их тактовых частотах . Поэтому после материнских плат для процессора 386, такой размер уже не встречается . Таким образом единственные материнские платы , выполненные в форм-факторе AT, доступные в широкой продаже , это платы соответствующие форматы Baby AT. Размер платы Baby AT 8.5" в ширину и 13" в длину . В принципе , некоторые производители могут уменьшать длину платы для экономии материала или по каким-то другим причинам . Для крепления платы в корпусе в плате сделаны три ряда отверстий . Все AT платы имеют общие черты . Почти все имеют последовательные и параллельные порты , присоединяемые к материнской плате через соединительные планки . Они также имеют один разъем клавиатуры , впаянный на плату в задней части . Гнездо под процессор устанавливается на передней с тороне платы . Слоты SIMM и DIMM находятся в различных местах , хотя почти всегда они расположены в верхней части материнской платы . Сегодня этот формат плавно сходит со сцены . Часть фирм еще выпускает некоторые свои модели в двух вариантах – Baby AT и ATX, но это происходит все реже и реже . Тем более , что все больше новых возможностей , предоставляемых операционными системами , реализуются только на ATX материнских платах . Не говоря уже просто об удобстве работы – так , чаще всего на Baby AT платах все коннек т оры собраны в одном месте , в результате чего либо кабели от коммуникационных портов тянутся практически через всю материнскую плату к задней части корпуса , либо от портов IDE и FDD – к передней . Гнезда для модулей памяти , заезжающие чуть ли не под блок пи т ания . При ограниченности свободы действий внутри весьма небольшого пространства MiniTower, это , мягко говоря , неудобно . Вдобавок , неудачно решен вопрос с охлаждением – воздух не поступает напрямую к самой нуждающейся в охлаждении части системы – процессор у . LPX Еще до появления ATX, первым результатом попыток снизить стоимость PC стал форм-фактор LPX. Предназначался для использования в корпусах Slimline или Low-profile. Задача была решена путем новаторского предложения - введения стойки . Вместо того , чтобы вставлять карты расширения непосредственно в материнскую плату , в этом варианте они помешаются в подключаемую к плате вертикальную стойку , параллельно материнской плате . Это позволило заметно уменьшить высоту корпуса , поскольку обычно именно высота карт р асширения влияет на этот параметр . Расплатой за компактность стало максимальное количество подключаемых карт - 2-3 штуки . Еще одно нововведение , начавшее широко применяться именно на платах LPX - это интегрированный на материнскую плату видеочип . Размер к о рпуса для LPX оставляет 9 х 13'', для Mini LPX - 8 x 10''. После появления NLX, LPX начал вытесняться этим форм-фактором . ATX Неудивительно , что форм-фактор ATX во всех его модификациях становится все более популярным . В особенности это касается плат для процессоров на шине P6. Так , к примеру , из готовящихся к выпуску в этом году материнских плат LuckyStar для этих процессоров 4 будут исполнены в формате Mini-ATX, 3 – ATX, и всего лишь одна – Baby AT. А если еще учесть , что материнских плат для Socket7 с е годня делается гораздо меньше , хотя бы по причине куда меньшего числа новых чипсетов для этой платформы , то ATX одерживает убедительную победу . И никто не может сказать , что она необоснованна . Спецификация ATX, предложенная Intel еще в 1995 году , нацелена как раз на исправление всех тех недостатков , что выявились со временем у форм-фактора AT. А решение , по сути , было очень простым – повернуть Baby AT плату на 90 градусов , и внести соответствующие поправки в конструкцию . К тому моменту у Intel уже был опыт работы в этой области – форм-фактор LPX. В ATX как раз воплотились лучшие стороны и Baby AT и LPX: от Baby AT была взята расширяемость , а от LPX – высокая интеграция компонентов . Вот что получилось в результате : · Интегрированные разъемы портов ввода-выв ода . На всех современных платах коннекторы портов ввода-вывода присутствуют на плате , поэтому вполне естественным выглядит решение расположить на ней и их разъемы , что приводит к довольно значительному снижению количества соединительных проводов внутри ко р пуса . К тому же , заодно среди традиционных параллельного и последовательного портов , разъема для клавиатуры , нашлось место и для портов PS/2 и USB. Кроме всего , в результате несколько снизилась стоимость материнской платы , за счет уменьшения кабелей в ком п лекте . · Значительно увеличившееся удобство доступа к модулям памяти . В результате всех изменений гнезда для модулей памяти переехали дальше от слотов для материнских плат , от процессора и блока питания . В результате наращивание памяти стало в любом случ ае минутным делом , тогда как на Baby AT материнских платах порой приходится браться за отвертку . · Уменьшенное расстояние между платой и дисками . Разъемы контроллеров IDE и FDD переместились практически вплотную к подсоединяемым к ним устройствам . Это по зволяет сократить длину используемых кабелей , тем самым повысив надежность системы . · Разнесение процессора и слотов для плат расширения . Гнездо процессора перемещено с передней части платы на заднюю , рядом с блоком питания . Это позволяет устанавливать в слоты расширения полноразмерные платы - процессор им не мешает . К тому же , решилась проблема с охлаждением - теперь воздух , засасываемый блоком питания , обдувает непосредственно процессор . · Улучшено взаимодействие с блоком питания . Теперь используется один 20-контактный разъем , вместо двух , как на AT платах . Кроме того добавлена возможность управления материнской платой блоком питания – включение в нужное время или по наступлению определенного события , возможность включения с клавиатуры , отключение опе р ационной системой , и т.д . · Напряжение 3.3 В . Теперь напряжение питания 3.3 В , весьма широко используемое современными компонентами системы , (взять хотя бы карты PCI!) поступает из блока питания . В AT-платах для его получения использовался стабилизатор , установленный на материнской плате . В ATX-платах необходимость в нем отпадает . Конкретный размер материнских плат описан в спецификации во многом исходя из удобства разработчиков – из стандартной пластины (24 х 18 ’ ’ ) получается либо две платы ATX (12 x 9. 6 ’ ’ ), либо четыре – Mini-ATX (11.2 х 8.2 ’ ’ ). Кстати , учитывалась и совместимость со старыми корпусами - максимальная ширина ATX платы , 12 ’ ’ , практически идентична длине плат AT, чтобы была возможность без особых усилий использовать ATX плату в AT корпусе. Однако , сегодня это больше относится к области чистой теории – AT корпус еще надо умудриться найти . Также , по мере возможности крепежные отверстия в плате ATX полностью соответствуют форматам AT и Baby AT. microATX Форм-фактор ATX разрабатывался еще в пор у расцвета Socket 7 систем , и многое в нем сегодня несколько не соответствует времени . Например , типичная комбинация слотов , из расчета на которую составлялась спецификация , выглядела как 3 ISA/3 PCI/1 смежный . Несколько неактуально не сегодняшний день , н е так ли ? ISA, отсутствие AGP, AMR, и т.д . Опять же , в любом случае , 7 слотов не используются в 99 процентах случаев , особенно сегодня , с такими чипсетами как MVP4, SiS 620, i810, и прочими готовящимися к выпуску подобными продуктами . В общем , для дешевых P C ATX – пустая трата ресурсов . Исходя из подобных соображений в декабре 1997 года и была представлена спецификация формата microATX, модификация ATX платы , рассчитанная на 4 слота для плат расширения . По сути , изменения , по сравнению с ATX, оказались мини мальными . До 9.6 x 9.6 ’ ’ уменьшился размер платы , так что она стала полностью квадратной , уменьшился размер блока питания . Блок разъемов ввода /вывода остался неизменным , так что microATX плата может быть с минимальными доработками использована в ATX 2.01 к орпусе . NLX Со временем , спецификация LPX, подобно Baby AT, перестала удовлетворять требованиям времени . Выходили новые процессоры , п оявлялись новые технологии . И она уже не была в состоянии обеспечивать приемлемые пространственные и тепловые условия для новых низкопрофильных систем . В результате , подобно тому , как на смену Baby AT пришел ATX, так же в 1997 году , как развитие идеи LPX, учитывающее появление новых технологий , появилась спецификация форм-фактора NLX. Формата , нацеленного на применение в низкопрофильных корпусах . При ее создании брались во внимание как технические факторы (например , появление AGP и модулей DIMM, интеграция аудио /видео компонентов на материнской плате ), так и необходимость обеспечить большее удобство в обслуживании . Так , для сборки /разборки многих систем на базе этого форм-фактора отвертка не требуется вообще. основные черты материнской платы NLX, это : · Ст ойка для карт расширения , находящаяся на правом краю платы . Причем материнская плата свободно отсоединяется от стойки и выдвигается из корпуса , например , для замены процессора или памяти . · Процессор , расположенный в левом переднем углу платы , прямо напр отив вентилятора . · Вообще , группировка высоких компонентов , вроде процессора и памяти , в левом конце платы , чтобы позволить размещение на стойке полноразмерных карт расширения . · Нахождение на заднем конце платы блоков разъемов ввода /вывода одинарной (в области плат расширения ) и двойной высоты , для размещения максимального количества коннекторов . Вообще , стойка – очень интересная вещь . Фактически , это одна материнская плата , разделенная на две части – часть , где находятся собственно системные компон енты , и подсоединенная к ней через 340 контактный разъем под углом в 90 градусов часть , где находятся всевозможные компоненты ввода /вывода – карты расширения , коннекторы портов , накопителей данных , куда подключается питание . Таким образом , во первых повыш а ется удобство обслуживания - нет необходимости получать доступ к ненужным в данный момент компонентам . Во вторых , производители в результате имеют большую гибкость – делается одна модель основной платы , и стойка под каждого конкретного заказчика , с интегр а цией на ней необходимых компонентов . Вообще , вам это описание ничего не напоминает ? Стойка , крепящаяся на материнскую плату , на которую выносятся некие компоненты ввода /вывода , вместо того , чтобы быть интегрированными на материнскую плату , и все это служи т для упрощения обслуживания , придания большей гибкости производителям , и т.д .? Правильно , через некоторое время после выхода спецификации NLX появилась спецификация AMR, описывающая подобную же идеологию для ATX плат . В отличие от довольно строгих прочих спецификаций , NLX обеспечивает производителям куда большую свободу в принятии решений . Размеры материнской платы NLX колеблются от 8 х 10 ’ ’ до 9 х 13.6 ’ ’ . NLX корпус должен уметь управляться как с этими двумя форматами , так и со всеми промежуточными . Обы ч но платы , вписывающиеся в минимальные размеры , обозначаются как Mini NLX. Стоит также упомянуть небезынтересную подробность : у NLX корпуса порты USB располагаются на передней панели – очень удобно для идентификационных решений типа e.Token. Осталось тольк о добавить , что по спецификации некоторые места на плате обязаны оставаться свободными , обеспечивая возможности для расширения функций , которые появятся в будущих версиях спецификации . Например , для создания на базе форм-фактора NLX материнских плат для с е рверов и рабочих станций . WTX Рисунок 1 Рисунок 2 Однако , с другого стороны , мощные рабочие станции и серверы спецификации AT и ATX тоже не вполне устра ивают . Там свои проблемы , где стоимость играет не самую главную роль . На передний план выходят обеспечение нормального охлаждения , размещение больших объемов памяти , удобная поддержка многопроцессорных конфигураций , большая мощность блока питания , размеще н ие большего количество портов контроллеров накопителей данных и портов ввода /вывода . Так в 1998 году родилась спецификация WTX. Ориентированная на поддержку двухпроцессорных материнских плат любых конфигураций , поддержку сегодняшних и завтрашних технологи й видеокарт и памяти . Особое внимание , пожалуй , стоит уделить двум новым компонентам - Board Adapter Plate (BAP)и Flex Slot. В этой спецификации разработчики попытались отойти от привычной модели , когда материнская плата крепится к корпусу посредством рас положенных в определенных местах крепежных отверстий . Здесь она крепится к BAP, причем способ крепления оставлен на совести производителя платы , а стандартный BAP крепится к корпусу . Помимо обычных вещей , вроде размеров платы (14 х 16.75''), характеристик блока питания (до 850 Вт ), и т.д ., спецификация WTX описывает архитектуру Flex Slot - в каком-то смысле , AMR для рабочих станций . Flex Slot предназначен для улучшения удобства обслуживания , придания дополнительной гибкости разработчикам , сокращению выход а материнской платы на рынок . Выглядит Flex Slot карта примерно так : рис . 2 На подобных картах могут размещаться любые PCI, SCSI или IEEE 1394 контроллеры , звук , сетевой интерфейс , параллельные и последовательные порты , USB, средст ва для контроля за состоянием системы . Образцы WTX плат должны появиться в районе июня , а серийные образцы - в третьем квартале 1999 года . FlexATX И наконец , подобно тому , как из идей , заложенных в Baby AT и LPX появился ATX, так же развитием спецификаци й microATX и NPX стало появление форм-фактора FlexATX. Это даже не отдельная спецификация , а всего лишь дополнение к спецификации microATX. Глядя на успех iMac, в котором , по сути , ничего нового кроме внешнего вида и не было , производители PC решили также пойти по этому пути . И первым стал как раз Intel, в феврале на Intel Developer Forum объявивший FlexATX – материнскую плату , по площади процентов на 25-30 меньшую , чем microATX. Теоретически , с некоторыми доработками , FlexATX плата может быть использована в корпусах , соответствующих спецификациям ATX 2.03 или microATX 1.0. Но для сегодняшних корпусов плат хватает и без этого , речь шла как раз о вычурных пластиковых конструкциях , где и нужна такая компактность . Там , на IDF, Intel и продемонстрировал нескол ь ко возможных вариантов подобных корпусов . Фантазия дизайнеров разгулялась на славу – вазы , пирамиды , деревья , спирали , каких только не было предложено . Несколько оборотов из спецификации , чтобы углубить впечатление : «эстетическое значение» , «большее удовл е творение от владения системой» . Неплохо для описания форм-фактора материнской платы PC? Flex – на то он и flex. Спецификация чрезвычайна гибка , и оставляет на усмотрение производителя множество вещей , которые прежде строго описыва лись . Так , производитель сам будет определять размер и размещение блока питания , конструкцию карты ввода /вывода , переход на новые процессорные технологии методы достижения низкопрофильного дизайна . Практически , более-менее четко определены только габариты – 9 х 7.5''. Кстати , по поводу новых процессорных технологий – Intel на IDF демонстрировал систему на FlexATX плате с Pentium III, который вплоть до осени пока заявлен только как Slot-1, в спецификации подчеркивается , что FlexATX платы только для Socket п р оцессоров ... 2. Шина AGP (Accelerated Graphic Port) Появление разных там 3D ускорителей привело к тому , что ребром встал вопрос : что делать ? Либо увеличивать количество дорогой памяти непосредственно на видеокарте , либо хранить часть информации в дешевой системной памяти , но при этом каким-нибудь образом организовать к ней быстрый доступ . Как это практически всегда бывает в компьютерной индустрии , вопрос решен не был . Казалось бы , вот вам простейшее решение : переходите на 66-мегагерцовую 64-разрядную шину PCI с огромной пропускной способностью , так нет же . Intel на базе того же стандарта PCI R2.1 разрабатывает новую шину - AGP (R1.0, затем 2.0), которая отличается от своего "родителя " в следующем : 1. шина способна передавать два блока данных за один 66 MH z цикл (AGP 2x); 2. устранена мультиплексированность линий адреса и данных (напомню , что в PCI для удешевления конструкции адрес и данные передавались по одним и тем же линиям ); 3. дальнейшая конвейеризация операций чтения /записи , по мнению разработчиков , позволяет устранить влияние задержек в модулях памяти на скорость выполнения этих операций . В результате пропускная способность шины была оценена в 500 МВ /сек , и предназначалась она для того , чтобы видеокарты хранили текстуры в системной памяти , соответ ственно имели меньше памяти на плате , и , соответственно , дешевели. Парадокс в том , что видеокарты все-таки предпочитают иметь БОЛЬШЕ памяти , и ПОЧТИ НИКТО не хранит текстуры в системной памяти , поскольку текстур такого объема пока (подчеркиваю - пока ) практически нет . При этом в силу удешевления памяти вообще , карты особенно и не дорожают . Однако практически все считают , что будущее - з а AGP, а бурное развитие мультимедиа-приложений (в особенности - игр ) может скоро привести к тому , что текстуры перестанут влезать и в системную память . Поэтому имеет смысл , особо не вдаваясь в технические подробности , рассказать , как же это все работает. Итак , начнем с начала , то есть с AGP 1.0. Шина имеет два основных режима работы : Execute и DMA. В режиме DMA основной памятью является память карты . Текстуры хранятся в системной памяти , но перед использованием (тот самый execute) копируются в локальную п амять карты . Таким образом , AGP действует в качестве "тыловой структуры ", обеспечивающей своевременную "доставку патронов " (текстур ) на передний край (в локальную память ). Обмен ведется большими последовательными пакетами . В режиме Execute локальная и сис темная память для видеокарты логически равноправны . Текстуры не копируются в локальную память , а выбираются непосредственно из системной . Таким образом , приходится выбирать из памяти относительно малые случайно расположенные куски . Поскольку системная пам я ть выделяется динамически , блоками по 4К , в этом режиме для обеспечения приемлемого быстродействия необходимо предусмотреть механизм , отображающий последовательные адреса на реальные адреса 4-х килобайтных блоков в системной памяти . Эта нелегкая задача вы п олняется с использованием специальной таблицы (Graphic Address Re-mapping Table или GART), расположенной в памяти. При этом адреса , не попадающи е в диапазон GART (GART range), не изменяются и непосредственно отображаются на системную память или область памяти устройства (device specific range). На рисунке в качестве такой области показан локальный фрейм-буфер карты (Local Frame Buffer или LFB). Т о чный вид и функционирование GART не определены и зависят от управляющей логики карты . Шина AGP полностью поддерживает операции шины PCI, поэтому AGP-траффик может представлять из себя смесь чередующихся AGP и PCI операций чтения /записи . Операции шины AGP являются раздельными (split). Это означает , что запрос на проведение операции отделен от собственно пересылки данных. Такой подход позволяет AGP- устройству генерировать очередь запросов , не дожидаясь завершения текущей операции , что также повышает быстродействие шины . В 1998 году спецификация шины AGP получила дальнейшее развитие - вышел Revision 2.0. В результате использования новых низковольтных электрических спецификаций появилась возможность осуществлять 4 транзакции (пересылки блока данных ) за один 66-мегагерцовый такт (AGP 4x), что означает пропускную способность шины в 1GB/сек ! Единственное , чего не хватает для полного счастья , так это чтоб ы устройство могло динамически переключаться между режимами 1х , 2х и 4х , но с другой стороны , это никому и не нужно . Однако потребности и запросы в области обработки видеосигналов все возрастают , и Intel готовит новую спецификацию - AGP Pro (в настоящее вр емя доступен Revision 0.9) - направленную на удовлетворение потребностей высокопроизводительных графических станций . Новый стандарт не видоизменяет шину AGP. Основное направление - увеличение энергоснабжения графических карт . С этой целью в разъем AGP Pro добавлены новые линии питания. Предполагается , что будет существовать два типа карт AGP Pro - High Power и Low Power. Карты High Power могут потреблять от 50 до 110W. Естественно , такие карты нуждаются в хорошем охлаждении . С этой целью спецификация требует наличия двух свободных слотов PCI с component side (стороны , на которой размещены основные чипы ) карты. При этом данные слоты могут использоваться картой как дополнительные крепления , для подвода дополнительного питания и даже для обмена по шине PCI! При этом на использование этих слотов накладываются лишь незначительные ограничения . При использовании слотов для по двода дополнительного питания : · Не использовать для питания линии V I/O; · Не устанавливать линию M66EN (контакт 49В ) в GND (что вполне естественно , так как это переводит шину PCI в режим 33 MHz). При использовании слота для обмена по шине : · Подси стема PCI I/O должна разрабатываться под напряжение 3.3V c возможностью функционирования при 5 V. Поддержка 64-разрядного или 66 MHz режимов не требуется . Карты Low Power могут потреблять 25-50W, поэтому для обеспечения охлаждения спецификация требует на личия одного свободного слота PCI. При этом все retail-карты AGP Pro должны иметь специальную накладку шириной соответственно в 3 или 2 слота , при этом карта приобретает вид достаточно устрашающий. При этом в разъем AGP Pro можно устанавливать и карты AGP. 3. Registered DIMM SDRAM Я думаю , что все знают , что модули оперативной памяти обычного компьютера вставлена в разьёмы SIMM или DIMM. Есть также ещё пока мало распространённые RIMM, ну а про RDIMM совсем мал о , что слышно . Для начала надо сказать , что разработчиком памяти стандарта RDIMM являются IBM и Intel. Модули памяти для RDIMM SDRAM поддерживаются чипсетом BX, соответсвуют спецификации PC-100 и являются усовершенствованными , а точнее Регистровыми (Regis tered) DIMM SDRAM . Основное отличие RDIMM от обычных DIMM SDRAM заключается в пропускной способности (bandwith): 800 и 1600 Мбайт /сек (последняя цифра особенно нравится , так как первой уже наступают на пятки мощные 3D-приложения ) и называются соответсвен н о SDR (Single Data Rate) и DDR (Dual Data Rate) RDIMM SDRAM. Не путать DDR SDRAM с DR DRAM (отличается работой на ча cтототе до 800 MHz, выйдет во 2 квартале и будет дороже за счёт обязательного лицензирования ). Итак , IBM анонсировала модули такой памяти о бьёмом 256 Мбайт , сделанной по технологии 0.20 мкм и имеющие плотность чипов в 4 раза больше , чем у обычных , что сделало возможным создание буферизированного 256 Мбайтного модуля памяти . Кстати , по заявлению той же IBM нет никаких преград для увеличения п л отности записи в 8 раз выше обычной , а значит , есть теоритическая возможность создания буферизированных 512 Мбайтных модулей . Теперь рассмотрим архитектуру DDR RDIMM SDRAM на примере 64 Мбайтных модулей . Для осуществления эффективного ввода /вывода данных устанавливаются конденсаторы (рядом с каждым чипом ). Эти конденсаторы сделаны из новейших диэллектрических материалов . Сама IBM уже применяет модули RDIMM 64-256 Мбайт , а также небуферизированные модули обьемом 512 Мбайт в своих Hi-End системах серии Netf i niti. SDR RDIMM DDR RDIMM Время прерывания (циклов ) (Burst length ) 2, 4, 8 2, 4, 8 Тип прерывания (Burst type) Последовательное чередование (sequential interleave) последовательное чередование (sequential interleave) Число тактов для работы с памятью (CAS latency) 2, 3, 4 2, 2.5, 3 Режим работы Нормальный , Режим записи (single write), Реж им тестирования (test mode) Нормальный , Режим сброса операций DLL, Режим тестирования (test mode), Режим расширенного регистрирования (Extended register mode set), Включение /выключение операций DLL Из таблицы мы видим , что SDR является упрощенным вариантом DDR RDIMM SDRAM. Особенности DDR заключаются в следующем : · Работа на частоте 125, 133 и 143 MHz за 2, 2,5 и 3 такта (CAS latency = 3), в зависимости от разновидности модулей · Однотактовое формирование сигнала RAS (Signal-pulsed RAS interface) · Встроенный блок DLL (Delay Locked Loop), который синхронизирует вывод информации с частотой ее ввода · Возможность отключения блока DLL через функцию расширенного режима регистрирования (например для экономии питани я ) · Удвоенная скорость обмена данных (DDR) · Двунаправленный поток данных · Полная синхронизация · Программируемый тип и длина прерываний · Прерывание операций чтения (специальной командой прерывания ) и записи . Смена операций осуществляется посл едовательно · Четыре банка (Bank) памяти · Способность работы при пониженном потреблении питания · Операции чтения и записи выполняются за 4 и 8 циклов (соответственно ), операция контроля затрачивает удвоенное количество циклов на соответствующую опе рацию · Произвольный доступ к столбцам (в памяти ) · Ждущий режим и режим пониженного питания · 4096/8192 циклов обновления для 64 и 256 мб модулей · Автоматические , контролируемые команды дозарядки (Automatic and controlled precharge command). Энер гия , подаваемая на модуль памяти может быть неодинаковой . · Вольтаж : 3,3В Данный набор характеристик не является окончательным перечнем характеристик DDR SDRAM для RDIMM, а потому может быть модифицирован в будущих стандартных DDR SDRAM, однако благодар я таким нововведения получаем : проускная способность на пин составляет 200 Мбайт (200Мбайт /пин ). 4. Новые технологии памяти : DDR SDRAM Уже давно , еще со времен 486 процессоров , отставание скорости системной шины PC от скорости убыстряющихся CPU все более увеличивалось . Именно тогда Intel впервые отказался от частоты процессоров , синхронной с частотой системной шины , и применил технологию умножения частоты FSB. Этот факт отразился даже в названии - 486DX2. Хотя частота системной шины осталась той же , несмо т ря на название , производительность процессора выросла почти вдвое . В дальнейшем разброд в тактовой частоте различных системных компонентов только увеличивался : в то время , как частота системной шины выросла сначала до 66 МГц , а затем и до 100, шина PCI ос талась все на тех же давних 33 МГц , для AGP стандартной является 66 МГц и т.д . Шина памяти же до самого последнего времени оставалась синхронной с системной шиной (название обязывает - Synchronous DRAM, SDRAM). - Так появились спецификации PC66, затем PC10 0, потом , с несколько большими организационными усилиями , PC133 SDRAM. Однако за то время , за которое частота шины памяти увеличилась на треть и , соответственно , на столько же возросла ее пропускная способность (с 800 Мбайт /с до 1,064 Мбайт /с ), частота пр оцессоров увеличилась в два с половиной раза - с 400 МГц до 1 ГГц . Наблюдается некоторый дисбаланс , не так ли ? Пропускная способность PC133 SDRAM составляет лишь 1,064 Мбайт /с , тогда как сегодняшним PC требуется по крайней мере : 1 Гбайт /с для процессора с частотой системной шины 133 МГц , столько же - для графической шины AGP 4X, 132 Мбайт /с для 33 МГц шины PCI. То есть , около 2.1 Гбайт /с - как и говорилось только что , дисбаланс более чем в два раза . Однако дальнейшее увеличение частоты SDRAM при современно м техническом уровне оснащения ее производителей невозможно : уже 166 МГц SDRAM получается слишком дорогой , особенно с учетом сегодняшних объемов оперативной памяти в PC. Этот момент сыграл не слишком приятную шутку с Direct Rambus DRAM. В то же время отка з ываться от синхронизации шины памяти с системной шиной по ряду причин не хотелось бы . Технологии , пытающиеся залатать SDRAM путем добавления кэша SRAM, вроде ESDRAM, или же путем оптимизации ее работы , вроде VCM SDRAM, не помогли . На выручку пришла популя рная в последнее время в компонентах PC технология передачи данных одновременно по двум фронтам сигнала , когда за один такт передаются сразу два пакета данных . В случае с используемой сегодня 64-бит шиной - это два 8-байтных пакета , 16 байт за такт . Или , в случае с той же 133 МГц шиной , уже не 1,064, а 2,128 Мбайт /с . Те самые 2.1 Гбайт /с , что и требуются для сегодняшних PC. Причем по цене , мало отличающейся от обычной 133 МГц памяти : технология та же (включая методику упаковки чипов - TSOP, не microBGA, ка к у RDRAM), оборудование - то же , энергопотребление , практически не отличающееся от SDRAM, площадь чипа отличается лишь на несколько процентов . Именно это сочетание доступности с требующейся на сегодняшний день производительностью и заинтересовало в перву ю очередь прагматичную индустрию DRAM - точно так же в свое время они выбирали PC66, PC100, PC133… Однако в отличие от этих спецификаций , в название которых входила тактовая частота шины памяти , так же , как и в отличие от спецификации Direct Rambus DRAM, г де за основу берется результирующая частота (тактовая частота , помноженная на те же два пакета на такт , что и у DDR SDRAM) - PC600, PC700, PC800, компании , разрабатывавшие DDR SDRAM, а точнее , маркетинговые отделы этих компаний , избрали ту систему (помнит е мультфильм про относительность единиц измерения - 48 попугаев ?), которая позволила получить максимальную цифру в названии - они выбрали пиковую пропускную способность и получили PC1600 для 100 МГц и PC2100 для 133 МГц чипов DDR SDRAM. Впрочем , эта систем а названий придумана совсем недавно , хотя чипы DDR SDRAM производятся уже достаточно давно : образцы 64 Мбит чипов появились почти два года назад - в середине 1998 г . Именно к тому времени , в декабре 1998 г ., когда Intel уже продолжительное время поддержив а л RDRAM, одобрена открытая спецификация DDR SDRAM, не требующая от производителей , использующих ее , никаких лицензионных отчислений . Как и в случае с PC133 SDRAM, основными сторонниками новой спецификации выступили IBM и VIA, к тому времени четко ориентир о вавшиеся на альтернативные RDRAM архитектуры . Несколькими месяцами спустя , в мае , одобрена спецификация 184-контактных модулей DIMM, а также закончена работа над спецификацией DDR SGRAM. Примерно через полтора года DDR SDRAM доведен до стадии , когда произ водители DRAM в состоянии начать его коммерческое производство -появились уже образцы 133 МГц 64 Мбит чипов DDR SDRAM, соответствующие спецификации PC2100 и готовые к началу производства . Однако первыми чипы DDR использовали отнюдь не производители модуле й памяти . Производителям видеокарт проще - на карте они в праве применять что угодно , лишь бы на выходе был стандартный сигнал . Да и ширина шины памяти все же всегда была узким местом скорее для графических чипов , чем для центральных процессоров . Так что , п роизводители видеокарт гораздо раньше воспользовались появившейся в графических чипах поддержкой DDR SDRAM/SGRAM.- Уже через несколько месяцев после выхода первого такого чипа , GeForce 256, появились карты с DDR SDRAM и SGRAM чипами на борту . Стандартной скоростью чипов для первой волны DDR плат стали 150 и 166 МГц (результирующая частота - 300 и 333 МГц соответственно , пропускная способность шины , с учетом 128-бит разрядности - 4.8 и 5.2 Гбайт /с ). Можно с большой уверенностью предположить , что осеннее по к оление графических чипов будет ориентироваться на 183 МГц чипы (366 МГц , 6 Гбайт /с ), а в 2001 г . мы увидим массовый выход видеокарт с 200 МГц (400 МГц , 6.4 Гбайт /с ). Результат замены SDRAM/SGRAM на их вдвое более быстрый аналог не замедлил сказаться . Прои зводительность карт на системах с мощным центральным процессором при использовании приложений , оказывающих заметную нагрузку именно на шину памяти (например 32-бит цвет ), возрастает до полутора раз . Оценивая известную на сегодня информацию о планах разраб отчиков графических чипов на ближайший год , можно констатировать бесспорную победу DDR над RDRAM. После того как Intel со своим i740 успешно продвинул AGP и отказался от дальнейших попыток прямого влияния в этой области , ситуацией , к счастью , управляет ры н ок . Дорогой RDRAM оказался никому не нужен , тем более что 128-бит шина памяти выводит DDR SDRAM по производительности даже вперед двухканального RDRAM. А вот с модулями памяти DIMM DDR SDRAM положение несколько иное : их востребовать некому - весь вопрос в стал за чипсетами , обладающими поддержкой этого типа памяти и , соответственно , за материнскими платами на базе этих чипсетов . Первый пользовательский чипсет , обладающий поддержкой этого типа памяти , ожидался от VIA сначала осенью 99 г ., затем зимой 2000, в есной… Но вроде бы , наконец , ожидание подходит к концу . Уже во втором квартале должен выйти первый чипсет VIA, обладающий поддержкой DDR SDRAM - Apollo Pro266. Ко все той же 133 МГц системной шине и AGP 4X добавится поддержка DDR SDRAM, а также V-Link - новой , ускоренной шины обмена информацией между северным и южным мостами чипсета , обеспечивающей пропускную способность 266 Мбайт /с (в два раза быстрее стандартной PCI). Кроме того , ожидается , что поддержка двухпроцессорных конфигураций , встроенная еще в Apollo Pro133A, станет официальной . Чуть позже , в третьем квартале , ожидается выход варианта Apollo Pro266 с интегрированным видеоядром PM266. Причем , в отличие от PM133 с хиленьким по меркам третьего квартала Savage4, в этот чипсет будет встроен вариант Savage2000 (GX4C). Его производительности для дешевых систем , являющихся нишевым рынком для интегрированных чипсетов , должно быть более чем достаточно. И в последнем квартале 2000 г . должен выйти первый серверный чипсет VIA, PX266V. Пока о нем известно мало , за исключением того , что там ожидается поддержка до 4 процессоров и двойная шина V-Link: к южному мосту и к подсистеме 64-бит 66 МГц PCI. На вторую половину этого года запланирован выход и DDR чипсета для Athlon - KX266, по своим возможностям аналогичного своему собрату для Pentium III - Apollo Pro266. Но на всякий случай , AMD предпочла вновь подстраховаться , выпустив в третьем квартале свой чипсет с поддержкой DDR SDRAM - AMD 760. Ожидается поддержка новой частоты системной шины EV6 - 133 МГц (266 МГц ), естественно , 133 МГц PC2100 DDR SDRAM, ATA100. Вскоре после AMD 760 должен последовать мультипроцессорный AMD 770 с аналогичными параметрами . Если у ж зашла речь о мультипроцессорных чипсетах , рассчитанных на серверные платформы , то нельзя не упомянуть еще двух игроков на этом рынке : Samsung со своим Caspian, разрабатываемым совместно с AMD, и ServerWorks со своей линейкой ServerSet, которая должна об з авестись DDR SDRAM чипсетом для процессоров Intel уже в первой половине этого года . Учитывая такие факторы как стоимость RDRAM, разницу в производительности RDRAM и DDR SDRAM и падение производительности подсистемы памяти RDRAM при увеличении объема памят и , подавляющее большинство производителей серверов намеревается предпочесть DDR SDRAM перед RDRAM. С этим желанием вынужден считаться даже Intel, который в своем следующем серверных чипсете под x86 (i870) планирует поддерживать именно DDR SDRAM. Да и поми м о Intel на рынке серверных чипсетов будет достаточно желающих поддержать DDR - кроме независимых разработчиков , на этом рынке выступят и сами производители серверов , разрабатывающие чипсеты под свои системы - IBM, NEC… Кварталом позже выхода соответствующ их чипсетов , ожидаются материнские платы на них . Так что первые платы , позволяющие использовать модули DDR SDRAM, должны выйти уже в третьем квартале 2000 г . И именно эти временные рамки указаны в планах различных производителей материнских плат . Первым и единственным неудобством для их пользователей должен стать новый форм-фактор модулей DIMM. К сожалению , ничто на свете не дается даром и увеличение пропускной способности памяти вдвое сопровождается изменением форм-фактора модулей . При сохранении тех же размеров модуля число контактов увеличилось со 168 до 184. Изменившееся положение ключа не позволит вставить модули DIMM DDR SDRAM в сегодняшние разъемы DIMM. Теперь о перспективах . Стандарт модулей DIMM DDR SDRAM предполагает испо льзование до 200 МГц чипов , с результирующей частотой 400 МГц и пропускной способностью 3.2 Гбайт /с - как у двухканального Direct Rambus DRAM. С того момента , когда DDR SDRAM исчерпает свои возможности , в 2003 г . должен стартовать DDR-II. Скорость DDR-II чипов , как предполагается , начнется со 100 МГц , но за счет того , что будет передаваться 4 пакета данных за такт , их пропускная способность также должна составить 3.2 Гбайт /с . Учитывая такую технологию работы (передачу 32 байтов за такт ) рост производитель н ости DDR-II чипов при росте тактовой частоты будет максимальным - в 4 раза : 150 МГц дадут уже 4.8 Гбайт /с , а 200 МГц - 6.4 Гбайт /с . Модули на этих чипах , как и модули на чипах DDR, также будут иметь свой собственный форм-фактор (230 контактов ), и требоват ь новых чипсетов . То же самое можно сказать и о чипах Advanced DRAM Technology, которые должны появиться примерно в то же время . До тех пор , еще три года , нам предстоит выбирать лишь между DDR SDRAM и Direct Rambus DRAM. Если Intel не будет силой влиять н а рынок (а он будет !), то результат , учитывая соотношение цена /производительность , выглядит вполне понятным - выигрывает DDR SDRAM. В противном случае ситуация становится непредсказуемой : трудно просчитать , что пересилит - финансовая мощь Intel, или здрав ы й смысл индустрии , и в какой пропорции проявят себя эти два компонента в конечном результате . В любом случае , если отстраниться от экстремистских точек зрения , то можно констатировать , что как бы ни сложилась ситуация , судьба DDR SDRAM сегодня видится в б олее радужных оттенках , нежели , скажем , год назад . За этот год успел выйти Athlon, AMD набрала вес , а VIA - сделала ставку на DDR SDRAM. Поэтому , что бы ни произошло на рынке решений от Intel, те , кто будет приобретать в конце этого года процессоры AMD, п р осто обречены на DDR SDRAM. А это , если ситуация с ценой на RDRAM не изменится кардинально до конца года , уже само по себе выглядит неплохим аргументом в пользу выбора решения от AMD/VIA для тех , кто предпочитает делать покупки , руководствуясь разумом , а н е рекламой . Платформы от ServerWorks, которая сегодня выступает для Intel в роли страховочного варианта , закрывая те области на серверном рынке x86, которые не в состоянии закрыть Intel, смогут выступить столь же достойным ответом на i840 с двумя каналами Rambus на рынке решений для рабочих станций и серверов , как чипсеты VIA - на рынке обычных пользовательских PC. По предварительным тестам прототипа Samurai, производительность системы на его основе равна производительности системы на базе i840, а порой и обгоняет ее . Это , с учетом цены модулей RIMM, которая вряд ли уменьшится в несколько раз в течение года , и объем памяти в серверах и рабочих станциях дает разницу в стоимости между решениями на базе DDR SDRAM и RDRAM в тысячи долларов при равной производ и тельности . Итог : производители DRAM не могут позволить себе не выпускать DDR SDRAM. Рынок для этого типа памяти существует , он весьма велик . Затрат для перехода на DDR SDRAM почти не требуется . Себестоимость изготовления чипов не слишком отличается от себ естоимости изготовления чипов SDRAM той же тактовой частоты . Стоимость RDRAM столь высока , что пользователи , даже при неудовлетворенном спросе на память , зачастую просто не могут позволить себе увеличить объем памяти в своих PC. Получился парадокс : если о т бросить PC133 SDRAM, как технологию , принадлежащую к предыдущему поколению , то на рынке общедоступной памяти просто нет предложения . Ну не считать же таковым безбожно дорогой RDRAM? При данных обстоятельствах воздержаться от выпуска DDR SDRAM было бы непр о стительной глупостью . Складывается , наконец , и вторая половина мозаики : чипсеты и материнские платы . Во второй половине 2000 г . на рынке будет вполне достаточно решений , полностью закрывающих поддержкой DDR SDRAM весь спектр рынка : чипсеты VIA и AMD - Hig h-End PC на базе Pentium III и Athlon, чипсеты AMD и Samsung - серверы и рабочие станции на базе Athlon, чипсеты ServerWorks - серверы и рабочие станции на базе Pentium III. 5. Технология памяти Direct Rambus Процессоры , как вы яснилось , развиваются гораздо быстрее , чем за ними поспевает RAM. Предвыборка , распараллеливание выполнения операций , конвейерные структуры - все это раскочегарило процессора так , что у них болше времени уходит на ожидание готовности памяти , чем на сам пр о цесс вычислений . Спасает кеш , но это тоже не панацея . Во-первых , он дорог , причем цена растет нелинейно при увеличении объема - с ростом кеша увеличивается процент брака , а это делает процессор дороже . Кеш второго уровня - уже не совсем то , что первого , о н работает на частоте шины процессора . Далее , кеш никак не спасает от операций , которые не отличаются локальностью обращений к памяти , или от обработки массивов , тривиально не укладывающихся в размер кеша . Никакой кеш не поможет и при обсчетах потоковой и н формации - будь то оцифровка звука ли , видеоввод , роутинг сетевого трафика . Bus-master, управление шиной силами внешних устройств , вообще идет мимо кеш-подсистемы процессора , прямо в память , причем большие потоки информации "мимо " процессора все равно огр а ничивают его производительность , так как мешают ему обращаться к памяти . В общем , сегодняшняя подсистема RAM не удовлетворяет потребностей компьютера ни с какой позиции . И главное - не меняя архитектуры , ее , конечно , можно ускорить . Процентов на 20-30. А нужно бы - раз в 5-10. Что тут делать ? И какие проблемы мешают ускорению памяти ? Во-первых , есть предел повышения частоты , на которой может работать память . При существующей технологии на считывание содержимого ячейки памяти нужно порядка 10 наносекунд , что не позволяет поднять частоту обращения выше 100Мгц . Во-вторых , увеличение разрядности памяти (включение ячеек параллельно , чтобы получить за одно считывание больше байт ) создает свои проблемы - как электрические (придется делать дикого размера микросх емы управления - по 200-300 ножек на корпус ), так и бытового характера . Чем больше разрядность , тем большими шагами можно наращивать память , что неудобно с точки зрения потребителя . Представляете , как тяжко пришлось бы покупателям , если бы модули SIMM вып у скались только шагами по 32 мегабайта ? Или если бы их пришлось ставить в машину не парами , а минимум - четверками ? В общем компания Rambus поглядела , и решила , что пора перепроектировать систему памяти в принципе . Отказаться от сегодняшней методики управления чипами , и сделать все с нуля. Сразу скажем - ей удалось . Хотя риск был велик - в основном , риск того , что за Rambus-ом не пойдут , и новый стандарт не приживется . Ан , пошли . Правда , еще не прижился , но производить новую память (модуль такой памяти , сделанный по технологии Direct Rambus, называется RIMM) принялись несколько крупнейших фирм , включая известнейшего памятестроителя Kingston и толстяка айбиэма. Новая технология отличается от старой решительно всем - только вот на вид почти точно такая же , ка к всем известные DIMM-ы . Direct Rambus вобрал в себя почти все новшества памятестроения , совместив их в аккуратно и вдумчиво спроектированной схеме . Новая схема · Общается с контроллером по мультиплексированной 800-мегагерцовой шине , что резко снижает н еобходимое число контактов и энергопотребление интерфейсных схем · Использует полностью параллельное соединение разъемов под модули SIMM, что гарантирует временн о е согласование сигналов , сколько бы модулей не было вставлено . Отсюда - возможность работы н а 800 Мгц . · Адресует модули независимо , что резко увеличивает число независимых банков памяти , а значит , позволяет выполнять частично перекрывающиеся во времени обращения чаще . · Позволяет делать конвейерные выборки из памяти , причем передача адреса м ожет выполняться одновременно с передачей данных . Отсюда - возможность сильного перекрытия запросов к памяти во времени . Контроллер может передать в память до 4-х запросов (причем возможно перемежать считывание и запись ), которые будут выполнены последова т ельно . Итого , на практике контроллер может выжать из шины памяти 95% ее максимальной теоретической производительности , которая равна 1.6 гигабайта в секунду (800мгц , два байта за такт ). Правда , на сегодня пиковая производительность реальных схем - 600 мег абайт в секунду , но это уже очень хорошо . А запас в гигабайт в секунду карман не тянет . Не успеешь глазом моргнуть , как новые процессоры , интеллектуальные дисковые и графические контроллеры используют его до корки , и попросят добавки . Определенной проблем ой новой технологии является притормаживание перехода на нее компании Intel. Гигант не торопится переключаться на RIMM-ы , объясняя это необходимостью плавного перехода . Как именно задержка обеспечивает плавность - мне не совсем ясно , но , безусловно , эволю ц ионные подходы - неизбежны . Если завтра все начнут делать материнские платы под RIMM-s, куда производители денут выпускающиеся мощным потоком DIMM-s и SIMM-s? Тем не менее , переход на RIMM-ы можно считать предопределенным . В других областях - от видеоконт роллеров до спец-компьютеров и встроенных систем RIMM-ы тоже делают первые шаги . К примеру , TI и S3 уже лицензировали технологию Direct Rambus, а значит , без работы ей не умереть . Предполагается , что в персональных компьютерах Direct Rambus RIMMs будут пр именяться в следующем году , к 2000-му году займут порядка 30, а в 2001-м и все 50% рынка . 6. Transmeta Crusoe. Ну вот и наступил тот день , когда оказались сняты покровы секретности , окружающие одну из самых таинственных компаний последних пяти лет , Transm eta, а также и их детище - процессор под кодовым названием Crusoe. Одно из ранних и общепринятых предположений полностью подтвердилось : Crusoe действительно не является конкурентом процессоров для настольных компьютеров от AMD и Intel - он самую малость о п оздал с этим , но зато его возможности по энергосбережению возможно делают его идеальным выбором для производителей портативных продуктов - от ноутбуков до HPC. Но к этому моменту мы вернемся чуть позже , когда речь пойдет о конкретных деталях чипов . А сейч а с посмотрим на более фундаментальные вещи , и первое , на что стоит обратить внимание в данном случае - это технология Code Morphing, позволяющая "на лету " преобразовывать x86 код во внутреннюю систему команд процессора . Crusoe относится к разряду VLIW проц ессоров . То есть , в отличие от привычных каждому пользователю PC чипов , работающих с CISC инструкциями , он в своей работе опирается на VLIW (very long instruction word), будучи в этом более близок к таким продуктам , как Merced или Elbrus 2000. (Последнее, пожалуй , особенно справедливо , если учесть , что глава Transmeta, Dave Dietzel, в свое время немало времени провел в Москве , контактируя с будущими создателями E2K). Так вот , вернемся к VLIW. Поскольку эта архитектура несовместима напрямую с x86, а отказыв аться от такого преимущества , каким является накопленный парк x86 программного обеспечения создателям Crusoe совсем не хотелось , и был разработан промежуточный , частично аппаратный , частично программный , невидимый для программ слой - Code Morphing, которы й во время выполнения программы , незаметно для нее преобразует ее x86 инструкции в инструкции VLIW. Плюсы и минусы такого подхода , по сравнению с традиционным , очевидны . Это : 1. Возможность достаточно радикально менять структуру процессора , подгоняя его к тем или иным требованиям - все равно все изменения его архитектуры для программ можно замаскировать на уровне Code Morphing. 2. Возможность вносить те или иные изменения в уже выпущенные процессоры , опять же на уровне преобразования кода . 3. Очень удобн ая вещь для работы с различными новыми наборами инструкций - SSE, 3DNow!, и т.д . Была бы лицензия. 4. Как ни крути , а эмуляция остается эмуляцией , со всеми вытекающими последствиями в плане производительности . В качестве примера можно посмотреть на душераз дирающие результаты эмуляции x86 программ на PowerPC. Но Transmeta неплохо поработала в этом направлении . Как это все работает ? Для начала надо сказ ать пару слов о логической структуре процессора . Ядро Crusoe состоит из пяти модулей четырех различных типов : два блока для операций с целыми числами , один для операций числами с плавающей запятой , один - для операций с памятью , и один - модуль переходов. Соответственно , и каждая VLIW инструкция ("молекула ", по терминологии Transmeta, длиной 64 или 128 бит ) может состоять из четырех RISC-подобных операций этих типов ("атомов "). Все атомы выполняются параллельно , каждый соответствующим модулем , молекулы иду т друг за другом , в строгом соответствии с очередью , в отличие от большинства сегодняшних суперскалярных x86 процессоров , где используется механизм внеочередного выполнения команд (out-of-order), это заметно упрощает внутреннюю структуру процессора , позвол я я отказаться от некоторых громоздких функциональных модулей (например , декодера инструкций , коих в x86 наборе не так уж и мало ). Для иллюстрации можно сравнить площадь мобильного 0.18 мкм Coppermine с суммарным объемом кэша 288 Кбайт с площадью TM5400 с с у ммарным кэшем 384 Кбайт - 106 квадратных милиметров против 73. Что , естественно , напрямую сказывается и на разнице в тепловыделении и энергопотреблении процессоров . Но вернемся вновь к принципу работы процессора . На вышеописанный уровень "молекулы ", по возможности максимально плотно упакованные "атомами ", попадают с уровня Code Morphing, где в них превращаются исходные инструкции (на данный момент речь идет только о x86, но в перспективе ничто не мешает сделать версию транслятора и для другого набора команд ). Вся окружающая среда с которой сталкивается процессор , начиная от BIOS и заканчивая операционной системой и программами , контактирует только с Co d e Morphing, не имея прямого доступа к самому ядру процессора . Очень удобно , учитывая , что даже уже у двух первых объявленных процессоров Transmeta это самое ядро - разное . Одним из методов увеличения производительности такого нетрадиционного способа работ ы , является очень логичная система кэширования . Каждая x86 инструкция , будучи оттранслированной один раз , сохраняется в специальном кэше , располагающемся в системной памяти , и в следующий раз , при необходимости ее выполнения , этап трансляции можно пропуст и ть , сразу достав из кэша необходимую цепочку молекул . Вдобавок , как обещает Transmeta, Code Morphing со временем еще и обучается : по мере выполнения программ , оптимизируя их для более быстрого выполнения , обращает внимание на наиболее часто выполняемые уч а стки кода , анализирует переходы в теле программы , и т.д . Первые процессоры Transmeta максимально ориентированы на рынок мобильных чипов (что , впрочем , не мешает компании уже поговаривать о серверном процессоре этой же архитектуры !), соответственно одним и з наиболее важных параметров процессора здесь является его энергопотребление . И если с младшим из сегодняшних чипов Transmeta, TM3120, с его 92 Кбайт кэша , особых проблем нет , то в TM5400 компания встроила механизм LongRun, функционально подобный технолог и и SpeedStep от Intel - возможность изменения тактовой частоты и напряжения на ядре процессора на лету . Причем , куда более гибко , чем это возможно в случае с двумя фиксированными значениями у SpeedStep. Если уж зашла речь о конкретных чипах , то давайте зай мемся этим вопросом более внимательно . Итак , на сегодняшний день объявлены два первых CPU, созданных по представленной Transmeta технологии . Первый , TM3120, нацелен на рынок HPC, второй , TM5400 куда больше подходит для рынка субноутбуков . Итак , по порядку : TM3120. Младший процессор в семействе , с тактовой частотой 333, 366, и 400 МГц . Обладает всего лишь 96 Кбайт разделенного кэша L1 (64 Кбайт под инструкции , 32 Кбайт - под данные ). Процессор рассчитан на напряжение 1.5 В . Содерж ит стандартные для серии PC-on-a-chip элементы : 66-133 МГц SDRAM контроллер с 3.3 В интерфейсом , рассчитанный на применение со стандартными для мобильных приложений модулями SO-DIMM. Частота памяти получается путем применения определенного делителя (от 1/ 2 до 1/15) к тактовой частоте процессора . Контроллер шины PCI также обладает стандартным 33 МГц PCI 2.1 совместимым интерфейсом , обеспечивая полноценную работу со всеми сегодняшними продуктами , могущими его использовать . Из поддержки периферии надо упомяну т ь контроллер флэш-памяти - если уж продукт ориентирован на рынок самых маленьких компьютеров , то без этого там никуда . Как любой нормальный процессор , предназначенный для работы с Windows (а в список проверенных ОС входят Microsoft Windows 95, Windows 98, Windows NT и Linux), TM3120 должен соответствовать системе управления энергопотреблением ACPI, что он успешно и делает , потребляя в системном состоянии Deep Sleep всего лишь 0.015 Вт . Разумеется , при выполнении мощных вычислений энергопотребление выраста е т на несколько порядков . Например , при проигрывании DVD оно доходит до 2.9 Вт , что тоже , впрочем , чертовски хорошо , если сравнивать , скажем , с мобильными процессорами Intel и AMD. Что касается старшего варианта , TM5400, то все вы шесказанное в основном относится и к нему , но с рядом поправок . Во-первых , до 500-700 МГц выросла скорость . Во вторых , что не менее важно , значительно увеличился и объем кэша - наряду с 128 Кбайтами (64+64) L1, появился и L2 - причем сразу 256 Кбайт . Здес ь , в зависимости от частоты , напряжение ядра плавает - от 1.2 до 1.6 В . Энергопотребление , впрочем , даже в случае проигрывания DVD доходит всего лишь до 1.8 Вт - в первую очередь сказывается LongRun. Что касается PC-on-a-chip возможностей , то здесь всего о дно пополнение , но такое , которое просто нельзя не заметить - к SDRAM контроллеру прибавился его DDR SDRAM собрат . Все что было сказано выше о скорости SDRAM, относится и к DDR. Все это замечательно , но как Crusoe ведет себя в реальной жизни ? Вполне непло хо для начала . Уже была продемонстрирована работа на компьютере на базе Crusoe заявленных операционных систем , без особых проблем работали реальные приложения - Power Point, Quake... Что касается производительности , то Transmeta поступила весьма разумно , решив предложить для этого собственный тест - Mobile Platform Benchmark. Впрочем , надо признать , весьма логичный , во главу угла ставящий соотношение производительность /энергопотребление . (Ну а то , что здесь выигрывает Crusoe - это , разумеется , проблемы ко н курентов ). По тестам , произведенным на нем самой Transmeta, TM5400, с варьировавшейся в течение теста (LongRun был включен ) от 266 до 533 МГц скоростью , на ряде задач шел вровень с мобильным Pentium III 500, на ряде отставал . Причем во всех задачах его эн е ргопотребление было в несколько раз ниже . Здесь можно привести еще один показатель , правда , опять со слов самой компании - 667 Мгц TM5400 по производительности примерно равен 500 МГц Pentium III. 7. VIA Joshua Всю свою историю , самой отличительной чертой процессоров Cyrix была их максимальная доступность . AMD всегда пыталась быть этаким средним классом , а Intel традиционно снимал сливки сверху . Этим стратегиям к концу 90-х годов полностью соответствовало и финансовое состояние компаний . Вдобавок , сильное в лияние оказал и еще один момент : вспыхнувшая в последние годы тенденция к резкому снижению стоимости PC не сделала Cyrix королем , как это можно было бы подумать . Напротив , в результате на этот рынок обратили серьезнейшее внимание Intel и AMD, развернувшие в последние два года там кровопролитную ценовую войну , что очень напоминало борьбу двух слонов в посудной лавке . Результат мы знаем . Летом , после достаточно продолжительной агонии своей линейки MII, National Semiconductor был вынужден оставить рынок x86 п роцессоров , шаг , который был вполне очевиден уже в конце 98 года . В течение второй половины прошедшего года ушли и другие компании , работавшие в той же нише : IDT и Rise. Но их уход отнюдь не означал , что спрос на процессоры , стоящие несколько два-три деся т ка долларов , внезапно испарился . Напротив , он остался , и даже , пожалуй , несколько вырос : все же последние несколько лет требования офисных пакетов застыли практически на одном и том же уровне , и этому уровню вполне соответствует производительность , обеспе ч иваемая подобными процессорами . Таким образом , спрос остался , а вот предложение фактически исчезло . Ситуация , которую надо было исправить . И здесь на выручку пришла VIA Technology, амбиции которой к началу прошедшего года выросли до немыслимых высот . Комп ания , вполне успешно конкурирующая в последнее время с Intel в области чипсетов , причем во многом за счет умения продавать именно дешевые продукты , решила попробовать применить эту стратегию в области процессоров . Самым простым путем к реализации этого пл а на была покупка компании , уже работающей в этой области . Тем более , что ситуация сложилась так , что VIA крайне был необходим доступ к патентам , имеющим отношение к шине GTL+. Этим летом она получила его , за счет приобретения двух групп разработчиков проце с соров - Cyrix у National Semiconductor и Centaur у IDT. Несмотря на то , что явным фаворитом VIA является Centaur, первым ее процессором все же станет процессор от Cyrix. О нем здесь речь и пойдет . Первые сведения о нем появились еще осенью 1997 года , на M icroProcessor Forum, традиционном месте для объявлений такого рода . Вице-президент Cyrix, Роберт Махер , описал ядро Cayenne - модифицированное ядро 6x86 линейки , обладающее поддержкой MMXFP - набора SIMD инструкций , разработанного самим Cyrix, модуль опер а ций с целыми числами оставался практически нетронутым , а вот модуль операций с числами с плавающей точкой должен был подвергнуться довольно значительным изменениям : появлялась конвейерная обработка и возможность обработки до двух операций с такими числами за такт . Новый сопроцессор должен был вывести процессор Cyrix почти на тот же уровень , что и Pentium II/Pentium III. То же самое можно сказать и работе Cayenne с MMX инструкциями . Что касается технических параметров нового процессора , то подразумевалось , что Cayenne начнет производиться во второй половине 1998 года с использованием 0.25 мкм техпроцесса (площадь чипа из 6.8 миллионов транзисторов должна была составить около 70 кв . мм ), в течение 98 года его скорость вырастет с 250 до 350 МГц (PR рейтинг - с 300 до 400 МГЦ ). А уже в 99 году ему на смену должен был придти Jalapeno. Тем не менее , прошел 98 год , прошла первая половина 99, Cyrix уже успел отказаться от собственного расширенного набора инструкций в пользу 3DNow!, а Cayenne все продолжал доводитьс я разработчиками , успев переименоваться сначала в Jedi, а потом , после появления претензий со стороны LucasFilm, и в Gobi. Что касается изменений , произошедших в дизайне процессора за это время , то известно только , что , как и предполагалось еще на MPR'97, у него появился кэш L2 на чипе , причем , достаточно внушительный - 256 Кбайт , как у сегодняшнего Coppermine. (А еще стоит вспомнить 64 Кбайт единого кэша L1 - вдвое больше , чем у того же Coppermine). В таком состоянии находились дела , когда Cyrix был приоб р етен VIA. К этому моменту процессор находился уже на грани появления на свет : достаточно сказать только , что незадолго до приобретения Cyrix он уже демонстрировался на Computex'99. Таким образом , покупая Cyrix, VIA кроме получения столь необходимых ей пат ентов получала доведенный до кондиции в течение двух лет дешевый , но достаточно производительный процессор - именно то , что ей и было надо . Так что , разогнав половину Cyrix, VIA все же оставила полторы сотни человек с тем , чтобы они в течение нескольких м е сяцев довели процессор до стадии , когда было бы возможным его коммерческое производство. К тому времени он уже начал принимать завершенные черты : четко определился интерфейс - Socket 370, частота системной шины (66/100/133 МГц ), техпроцесс - 0.18 мкм и , са мое главное , имя - Joshua. На самом деле , конечно , главное - это скорость , но вот с этим точной определенности не было . На момент написания этой статьи предполагается , что PR-рейтинг процессора будет составлять 433/466/500/533/566 МГц , причем , по видимому, на момент выхода будут доступны только два первых варианта из этой линейки . Возможность разгона оставляет достаточно смутные впечатления . С одной стороны - незафиксированный коэффициент умножения : прямо-таки рай после процессоров Intel и AMD. С другой ст ороны , процессор , который изначально рассчитан на напряжение 2.2В (и это для не столь уж больших 300 МГц для PR-рейтинга 433!), заставляет крепко задуматься о перспективах его разгона : похоже , это сделали уже до нас . С другой стороны , 0.18 мкм техпроцесс T SMC все же оставляет некоторую надежду . Что касается производительности , то , исходя из архитектуры процессора , стоит ожидать ее примерно на уровне Celeron, работающего тактовой частотой , соответствующей его PR-рейтингу - некоторые недостатки лишь слегка у лучшенной архитектуры несколько летней давности должен во многом вытянуть 256 Кбайт кэш L2, работающий на тактовой частоте процессора . В основном , конечно , это касается офисных приложений , где лишние 128 Кбайт L2 совсем не помешают . Что касается игр , то з д есь скажется значительно улучшенный со времен 6x86MX сопроцессор , и , разумеется , не стоит скидывать со счетов поддержку 3DNow! - сегодня под этот набор SIMD инструкций оптимизирована любая из выходящих мало-мальски серьезных игр и новые драйвера под любую видеокарту . И все это за очень (наши источники в VIA категорически подчеркивают это слово ) доступную цену . Учитывая , что по последним данным о планах Intel, прогресс линейки Celeron в этом году значительно замедлится , и его частота лишь слегка перешагнет за 600 МГц , то позиции VIA выглядят вполне надежными . 8. Merced Введение Merced - название 64-разрядного микропроцессора общего назначения , разрабатываемого в настоящее время фирмой Intel. Его выпуск начнется в середине 2000 года по 0.18-микронной технол огии . Опытное производство - в 1999 году . Процессор получил название от города Merced , расположенного недалеко от Сан -Хосе (США ). Merced станет первым процессором нового семейства IA-64. IA-64 - аббревиатура от Intel 64-bit Architecture - 64-разрядная Архитектура Intel. IA-64 воплощает концепцию EPIC (аббревиатура от Explicitly Parallel Instruction Computing - Вычислени я с Явным Параллелизмом Команд ). Концепция EPIC разработана совместно фирмами Intel и Hewlett-Packard, по их заявлениям , EPIC - концепция той же значимости , что CISC и RISC. В IA-64 используется новый 64-разрядный набор команд , разработанный также совмест н о фирмами Intel и HP (для него в официальных сообщениях Intel и HP вводится аббревиатура 64-bit ISA - 64-bit Instruction Set Architecture). Вдобавок , Merced будет полностью совместим с семейством x86 (В официальных сообщениях Intel семейство x86 обозначаю т аббревиатурой IA-32 - Intel 32-bit Architecture - 32-разрядная Архитектура Intel). В настоящее время доподлино известно о работах над двумя проце cсорами семейства IA-64: · уже упомянутый Merced, разрабатываемый в основном силами Intel · McKinley, кот орый разрабатывается в HP и появится в конце 2001 года Недавно были добавлены еще два названия : В 2002 должен появиться Madison, а за ним - Deerfield. Хронология событий Hewlett-Packard и Intel объявили о совместном исследовательском проекте в июне 1994 года . Ц ель проекта - создание более совершенных технологий в сфере "рабочих станций конца десятилетия , серверов и информационно-вычислительных продуктов масштаба предприятия ". Проект включал разработку "архитектуры 64-разрядного набора команд " и оптимизирующих к о мпиляторов . В 1996 году фирма HP выпустила свой первый 64-разрядный процессор общего назначения - PA-8000, представитель нового семейства PA-RISC 2.0. Естественно предположить , что PA-RISC 2.0 - результат совместного проекта "архитектуры 64-разрядного наб ора команд ", тем более , что в PA-8000 применены решения , которые в терминологии IA-64 называются "предикация " и "загрузка по предположению ". Но нет официальных данных , подтверждающих это предположение . 9 октября 1997 года фирма Intel объявила , что · про изводство Merced, первого представителя нового семейства 64-разрядных микропроцессоров , начнется в 1999 году по 0.18-микронному технологическому процессу фирмы Intel, который также создается ; · процессор предназначен для рабочих станций и серверов ; · M erced сможет выполнять программы для 32-разрядных процессоров Intel; · Intel обладает средой разработки программного обеспечения , полностью совместимого с IA-64, и "ключевые " независимые продавцы программного обеспечения уже используют эту среду для разр аботки операционных систем и приложений уровня предприятия ; 14 октября 1997 года , на Микропроцессорном Форуме в Сан-Хосе , Калифорния , фирмы Intel и HP впервые публично описали основы IA-64. Совместно выступили John Crawford, Intel Fellow and Director of M icroprocessor Architecture и Jerry Huck, Hewllet-Packard`s Manager and Lead Architect. Запись их речей можно найти на Web-сервере Intel, а демонстрировавшиеся слайды - на Web-сервере HP. Фирма Intel дополнила это выступление заявлениями для прессы . В тот же день на Микропроцессорном Форуме выступал Joel Birnbaum , Director of Hewlett-Packard Laboratories, Senior Vice President of Research and Development. Он вкратце рассказал о работах HP над процессорными архитектурами с 1980-х до альянса с Intel в 1994. По его словам , отправной точкой для альянса с Intel послужил проект , называемый сначала Wide-Word, а затем Super-Parallel Processor Architecture (SP-PA). Этот проект был выполнен в HP La b s под руководством Bill Worley, который одновременно возглавлял работы над PA-RISC. Согласно Joel Birnbaum, в проекте Wide-Word были проведены эксперименты со статическим параллелизмом и загрузкой по предположению , разработана "обобщенная предикация ", мех а низмы , позволяющие масштабировать количество функциональных устройств и их "скорость ". Также он объяснил , зачем фирме HP понадобилось заключать альянс с Intel, но это объяснение слишком обширно , чтобы приводить его здесь . 29 мая 1998 года фирма Intel сооб щила о переносе на год выпуска процессора Merced. Было объявлено , что серийное производство начнется в середине 2000 года . А опытное - в 1999 году . В официальном сообщении нет никаких сведений ни об архитектуре Merced, ни о технологии его производства . С 12 по 15 октября 1998 года проходил очередной Микропроцессорный Форум . От Intel выступал Stephen Smith с темой "IA-64 Processors: Features and Futures". Он сообщил несколько новых технических деталей , рассказал о перспективах семейства IA-64. EPIC , IA-64, Merced Концепция EPIC, согласно Intel и HP, обладает достоинствами VLIW, но не обладает ee недостатками . John Crawford перечислил следующие особенности EPIC: · Большое количество регистров . · Масштабируемость архитектуры до большого количеств а функциональных устройств . Это свойство представители фирм Intel и HP называют "наследственно масштабируемый набор команд " (inherently scaleable instruction set) · Явный параллелизм в машинном коде . Поиск зависимостей между командами производит не проце ссор , а компилятор . · Предикация (Predication). Команды из разных ветвей услового ветвления снабжаются предикатными полями (полями условий ) и запускаются параллельно . · Загрузка по предположению (Speculative loading). Данные из медленной основной памят и загружаются заранее . Ниже эти особенности EPIC объяснены подробнее . Представители Intel и HP назывют EPIC концепцией следующего поколения и противопоставляют ее CISC и RISC. По мнению Intel, традиционные архитектуры имеют фундаментальные свойства , огра ничивающие производительность . Производители RISC процессоров не разделяют подобного пессимизма . Кстати , в 1980-х , когда возникла концепция RISC, прозвучало много заявлений , что концепция CISC устарела , имеет фундаментальные свойства , ограничивающие произ в одительность . Но процессоры , причисляемые к CISC (например , семейство x86 фирмы Intel), широко используются до сих пор , их производительность растет . Дело в том , что все эти аббревиатуры - CISC, RISC, VLIW обозначают только идеализированные концепции . Реа льные микропроцессоры трудно классифицировать . Современные микропроцессоры , причисляемые к RISC, сильно отличаются от первых процессоров RISC архитектуры . То же относится и к CISC. Просто в наиболее совершенных процессорах заложено множество удачных идей в не зависимости от их принадлежности к какой-либо концепции . Регистры IA-64: · 128 64-разрядных регистров общего назначения (целочисленных ) · 128 80-разрядных регистров вещественной арифметики . · 64 1-pаз pядных п pедикатных pегист pов . Напомним , что наличие большого числа регистров названо John Crawford в числе основных черт EPIC. Действительно , 128 - много по сравнению с 8 регистрами общего назначения семейства x86. Но , например , MIPS R10000 содержит 64 целых и 64 вещественных 64-разря д ных регистров . Формат команды IA-64: · идентификатор команды , · три 7-разрядных поля операндов - 1 приемник и 2 источника (операндами могут быть только регистры , а их - 128=2^7) · особые поля для вещественной и целой арифметики · 6-разрядное предик атное поле (64=2^6) Команды IA-64 упаковываются (группируются ) компилятором в "связку " длиною в 128 pаз pядов . Связка соде pжит 3 команды и шаблон , в кото pом будут указаны зависимости между командами (можно ли с командой к 1 запустить параллельно к 2, или же к 2 должна выполниться только после к 1) , а также между другими связками (можно ли с командой к 3 из связки с 1 запустить параллельно команду к 4 из связки с 2). Перечислим все варианты составления связки из 3-х команд : i1 || i2 || i3 - все команды исполняются па pаллельно i1 & i2 || i3 - сначала i1, затем исполняются па pаллельно i2 и i3 i1 || i2 & i3 - па pаллельно исполняются i1 и i2, после них - i3 i1 & i2 & i3 - последовательно исполняются i1, i2, i3 Одна такая связка , состоящ ая из трех команд , соответствует набору из трех функциональных устройств процессора . Процессоры IA-64 могут содержать разное количество таких блоков , оставаясь при этом совместимыми по коду . Ведь благодаря тому , что в шаблоне указана зависимость и между с в язками , процессору с N одинаковыми блоками из трех функциональных устройства будет соответствовать командное слово из N*3 команд ( N связок ). Таким образом должна обеспечиваться масштабируемость IA-64. Несомненно , это красивая концепция . К сожалению , IA- 6 4 присущи и некоторые недостатки . · Tom R. Halfhill в статье журнала BYTE предполагает что без перекомпиляции код с одного процессора семейства IA-64 не будет эффективно исполняться на другом . · Уже упомянутый Jerry Huck отметил , что в IA-64 можно прои звольно (блоками по 3) увеличивать количество функциональных устройств , но при этом число регистров должно оставаться неизменным . · Также Jerry Huck предупредил , что размер кода для IA-64 будет больше , чем для RISC процессоров , потому что на 3 команды IA -64 приходится 128 bit, а длина RISC команды обычно равна 32 bit, то есть , в 128 битах содержатся 4 команды RISC. Вдобавок произошла путаница . На прошедшем во второй половине февраля 1998 года Форуме Разработчиков Intel ведущий инженер Carole Dulong сказа ла , что в такой архитектуре , как Merced, пропорция целочисленых , вещественных , специализированных устройств и устройств чтения /записи будет определяться сочетанием соответствующих команд в предполагаемом машинном коде . Тогда как на Микропроцессорном Форум е представители фирм Intel и HP объясняли , что процессоры семейства IA-64 будут содержать N одинаковых блоков по три функциональных устройства . Причем , можно предположить , что такой блок должен состоять из целочисленного устройства , устройства вещественной арифметики и устройства чтения /записи . Данные высказывания противоречат друг другу . Кстати , EPIC удивительно напоминает архитектру VelociTI семейства сигнальных процессоров TMS320C6x фирмы Texas Instruments. Примером может служить TMS320C6201. В этом проц ессоре довольно много регистров - 32 регистра общего назначения . 8 функциональных устройств - это много даже по меркам современных процессоров общего назначения . Команды TMS320C6201 упаковываются во VLIW-слова , состоящие из 8 команд и шаблона . В шаблоне у к азаны зависимости между командами - явный параллелизм . За такт может исполниться до 8 команд . Все команды снабжены полем условия - предикация . Помимо семейства IA-64 идут разработки еще нескольких универсальных процессоров с VLIW-подобной архитектурой . Н апример , в России группой Эльбрус с 1992 года разрабатывается микропроцессор E2k (Эльбрус -2000) . Научный руководитель группы Эльбрус член-корреспондент РАН Б.А . Бабаян утверждает , что отечественный E2k будет в два раза производительнее , чем McKinley (последователь Merced). По оценкам полученным на логической модели , производительность E2k составит 135 SPECint95 и 350 SPECfp95. Еще примеры : · В 1995 году была образована фирма Transmeta Ее руководителем является Dave Ditzel, который ранее , будучи сотрудником Sun, взаимодействовал с коллективом Эльбрус и имел доступ к информации по разрабат ываемому E2k. · Исследования VLIW в исследовательском центре IBM имени T.J. Watson начались в 1986. Кроме этого , сейчас появляется все больше сигнальных и "медийных " процессоров с архитектурой VLIW. Предикация Предикация - способ обработки условных ветвлений . Суть этого способа - компилятор указывает , что обе ветви выполняются на процессоре п араллельно . Ведь EPIC процессоры должны иметь много функциональных устройств . Опишем предикацию более подробно . Если в исходной программе встречается условное ветвление (по статистике - через каждые 6 команд ), то команды из разных ветвей помечаются разны ми предикатными регистрами (команды имеют для этого предикатные поля ), далее они выполняются совместно , но их результаты не записываются , пока значения предикатных регистров неопределены. Когда , наконец , вычисляется условие ветвления , предикатный регистр, соответствующий "правильной " ветви , устанавливается в 1, а другой - в 0. Перед записью результатов процессор будет проверять предикатное поле и записывать результаты только тех команд , предикатное поле которых содержит предикатный регистр , установленный в 1. Техника , подобная предикации , используется в RISC процессорах архитектуры ARM от Advanced RISC Machines Ltd. (Cambridge, UK) начиная с п ервых ARM в 1980-х . Кстати , фирма Intel обладает лицензией фир мы Advanced RISC Machines на производство , продажу и модификацию микропроцессоров семейства StrongARM (разработан фирмой DEC, также обладавшей лицензией на ARM). В уже упомянутых сигнальных процессорах серии TMS320 все команды снабжены полем условия . Такж е и некоторые команды HP PA-RISC снабжены полем условия . В IBM POWER3 могут выполняться по предположению команды из обеих ветвей . Описывая предикацию , представители Intel и HP ссылаются на исследовательскую работу A Comparison of Full and Partial Predicated Execution Support for ILP Processors , вып олненную Scott A. Mahlke, Richard E. Hank, James E. McCormick, David I. August, и Wen-mei W. Hwu из исследовательской группы IMPACT университет штата Иллинойс . Работа опубликована в трудах 22-го Международного Симпозиума по Вычислител ьной Архитектуре , прошедшего в 1995 году . В настоящее время некоторые из авторов трудятся в лабораториях HP. В этой работе изучалось применение предикации на гипотетическом процессоре , содержащем 8 функциональных устройств . Было показано , что предикацию м о жно применить (в среднем ) к половине условных ветвлений в программе . К сожалению , Intel и HP не объяснили , как в процессорах семейства IA-64 будет обрабатываться оставшаяся половина условных ветвлений . Современные же процессоры кроме предикации использую т предсказание и исполнение по предположению . Кстати , RISC процессоры довольно часто правильно предсказывают ветвь - в 95% случаев . Загрузка по предположению Этот механизм предназначен снизить простои процессора , связанные с ожидание м выполнения команд загрузки из относительно медленной основной памяти . Компилятор перемещает команды загрузки данных из памяти так , чтобы они выполнились как можно раньше . Следовательно , когда данные из памяти понадобятся какой-либо команде , процессор не будет простаивать . Перемещенные таким образом команды называются командами загрузки по предположению и помечаются особым образом . А непосредственно перед командой , использующей загружаемые по предположению данные , компилятор вставит команду проверки пред п оложения . Если при выполнении загрузки по предположению возникнет исключительная ситуация , процессор сгенерирует исключение только когда встретит команду проверки предположения . Если , например , команда загрузки выносится из ветвления , а ветвь , из которой о на вынесена , не запускается , возникшая исключительная ситуация проигнорируется . Обычно для борьбы с зависимостью от медленной памяти в процессорах применяются кэши 2-х , 3-х уровней . Например HP PA-8500 содержит кэш 1-го уровня емкостью в 1.5 Mb. Но , вдоб авок к этому , например в процессорах Sun UltraSPARC (SPARC version 9), IBM POWER3 и HP PA-8xxx есть команды , указывающие процессору , что именно (данные и команды ) загрузить в кэш 1-го уровня - это сильно напоминает загрузку по предположению . Оценки производительности Согласно заявлениям фирмы Intel , Merced достигнет наибольшей производительности в отрасли . Более точных оценок официально объявлено не было . Но затем фирма Intel анонсировала 32-разрядный Foster. Оказывается , он будет равен Merced в производительности на вещественных опера циях . И даже последователь Merced, McKinley, будет медленнее , чем Foster в 32-разрядной целочисленной арифметике . Таким образом , фирма Intel сама себя опровергла . Merced не будет чемпионом по производительности . Аналитики из MicroDesign Resources полагают , что производильность Merced с частотой 800 MHz на наборе команд IA-64 не превысит 45 SPECint95 и 70 SPECfp95, а на наборе ком анд x86 будет соответствовать Pentium с частотой 500 MHz. Производительность Pentium II на 450 MHz равна 17.2 SPECint95 и 12.9 SPECfp95. Получается , что при исполнении на Merced x86-кода производительность ухудшится в 3-5 раз . Уже сейчас Compaq/DEC Alpha 21264 на частоте 500 MHz выдает 27.7 SPECint95 и 58.7 SPECfp95. На Alpha можно исполнять x86-код с помощью бинарного транслятора FX!32. Производительность при этом уменьшается в среднем в 3 раза . Кстати , в 1997 году фи pма Intel закупила у DEC ряд лицензий , используемых в DEC Alpha. Intel была вынуждена сделать это , чтобы избежать судебного наказания за использование технологических решений DEC Alpha в своих продуктах . Ве pоятно , ноу-хау DEC Alpha оказали существенное влияние и на будущий Merced. Аналитик T ony Iams из D.H.Brown Association сообщает , что виденные им оценки производительности показывают , что UltraSPARC будет превосходить Merced в вещественной производительности , а целочисленная будет одинакова . По оценкам , UltraSPARC-III на частоте 600MHz пок ажет около 35 SPECint95 и 60 SPECfp95. В общем , считается , что конкурентами Merced станут DEC Alpha 21264, Sun UltraSPARC-III, IBM POWER3. Hо Alpha 21264 и POWER3 уже выпускаются , а выпуск UltraSPARC-III ожидается в 1999 году , тогда как Merced появится в 2000 году . Разрядность Merced станет в 2000 году пе pвым 64-pаз pядным микропроцессором pаз pаботки фи pмы Intel. Первый 64-разрядный микропроцессор общего назначения MIPS R4000 появился в 1992 году . Ныне MIPS широко используется в суперкомпьютерах, серверах , рабочих станциях и даже в игровых приставках (Nintendo и Sony). Также уже в течение нескольких лет ши pоко используются 64-pаз pядные микропроцессоры общего назначения DEC Alpha (1992 год ), PowerPC-620 (1994 год ), Sun UltraSPARC (1995 год ), HP PA- RISC 2.0 (1996 год ). Более того , в процессоре UltraSPARC присутсвуют 128-разрядные регистры . Тактовая частота Linley Gwennap предполагает , что тактовая частота первого Merced будет около 800 MHz. С 1997 года серийно выпускается Alpha 21164 с частотой 612 MHz. В октябре 1996 года был показан Exponential Technologies` PowerPC-750 MHz, а в феврале 1998 года фирма IBM продемонстрировала Xperimental PowerPC с частотой 1GHz. Технология производства Произвдство Mer ced начнется в 2000 году по 0.18 микронному технологическому процессу . Данный процесс ныне разрабатывается фирмой Intel. Уменьшение этой технологической ха pакте pистики позволяет снизить потребляемую мощность , поднять тактовую частоту , увеличить степень ин т еграции , а , следовательно , разместить на микропроцессоре большее количество исполняющих устройств , регистров , кэш-памяти . В настоящий момент все пе pечисленные выше 64-pаз pядные микропроцессоры п pоизводятся по технологиям 0.35 и 0.25 мкм ; Фи pма Intel выпус к ает по технологии 0.25 мкм свои 32-pаз pядные процессоры семейства x86; По словам Ronald Curry, Merced director of marketing, первый Merced будет выпускаться в картриджах , включающих ЦПУ , L2 кэш и интерфейс шины . Для Merced разрабатывается новая системная шина , использующая концепции шины Pentium-II. Совместимость До официального объявления Intel в 1997 году ожидалось , что архитектура , разрабатываемая совместно фирмами Intel и HP будет совместим по коду с семействами x86 и PA-RISC . Тепе pь выяснилось , что Merced, построенный по этой архитектуре , будет исполнять код только семейства x86. Концепции EPIC и CISC противоположны . В случае EPIC организация вычисления возложена в основном на компилятор , в случае CISC - на процессор . А тепе рь эти две концепции объединяются в одном процессоре . В статье из Microprocessor Report анализируются патенты Intel на некий 64-разрядный процессор с двумя наборами команд : 64-разрядным и набором команд x86. Можно предположить , что этот процессор - Merced. В патенте сказано , что процессор будет выполнять программы , в которых перемешаны кома н ды из набо pов x86 и IA-64, будут команды пе pехода из режима IA-64 в x86 и об pатно . Причем , по словам автора статьи , Linley Gwennap, "в некоторых местах документ создает впечатление , что Intel относится IA-64 просто как к 64-разрядному расширению x86, анал о гично новым 32-разрядным режимам появившимся в i386". В общем , относительно совместимости Merced с x86 ясно лишь , что эта совместимость будет , об этом неоднократно было заявлено представителями Intel. Заключение Основная особенность EPIC та же , что и VLIW - распараллеливанием потока команд занимается компилятор , а не процессор . Достоинства данного подхода : · упрощается архитектура процессора ; вместо распараллеливающей логики на EPIC процессоре можно разместить больше регистров , функциональных устро йств . · процессор не тратит время на анализ потока команд · возможности процессора по анализу программы во время выполнения ограничены сравнительно небольшим участком программы , тогда как компилятор способен произвести анализ по всей программе · если некоторая программа должна запускаться многократно , выгоднее распараллелить ее один раз (при компиляции ), а не каждый раз , когда она исполняется на процессоре . Недостатки : · Компилятор производит статический анализ программы , раз и навсегда планируя вы числения . Однако даже при небольшом изменении начальных данных путь выполнения программы сколь угодно сильно изменяется . · Очень увеличится сложность компиляторов . Значит , увеличится число ошибок в них , время компиляции . · Еще более увеличится сложност ь отладки , так как отлаживать придется оптимизированный параллельный код . · Производительность Merced будет всецело зависеть от качества компилятора . Компиляторы для IA-64 в настоящее время разрабатываются , об их качестве ничего не известно . П pедставляе тся , что pаз pаботка качественного pаспа pаллеливающего компилято pа для Merced - более сложная задача , чем pаз pаботка самого Merced. Сегодня известен , пожалуй , только один успешный коммерческий компилятор подобного типа - это компилятор для семейтва сигналь н ых процессоров TMS320C6x фирмы Texas Instruments. Этот компилятор разрабатывался довольно долгое время . Согласно заявлениям фирм Intel и HP, одно из достоинств EPIC - упрощение архитектуры , но IA-64 будет аппаратно поддерживать CISC систему команд семейст ва x86. П pоизводительность Merced 800 MHz на набо pе команд x86, вероятно , будет на у pовне Pentium 500 MHz. То есть , ста pое п pог pаммное обеспечение для п pоцессо pов x86 не будет эффективно исполняться на Merced. Запускать на нем DOS или Windows - чересчур д орого . Сама фирма Intel заявляет , что Merced предназначен для рабочих станций и серверов верхнего уровня . В этом секторе компьютерного рынка процессоры x86 не использовались , поэтому непонятно , зачем в Merced нужна совместимость с x86. Также вероятно , что наращивание числа исполняющих устройств - не столь тяжелая задача для RISC процессоров и не столь легкая для EPIC, как утверждается разработчиками EPIC и IA-64. Тем более , что так называемые RISC процессоры уже используют многие идеи , которые будут вопло щ ены в Merced. Повторим , что классификация процессоров на CISC, RISC и VLIW условна . Современные процессоры воплощают удачные идеи из всех перечисленных концепций . В Microprocessor Report за 26 января 1998 года высказывается предположение , что EPIC может бы ть добавлено в виде расширения в существующие RISC наборы команд ; измененный таким образом RISC процессор будет способен запускать старый код , а на программах скомпилированных для EPIC будет работать так же быстро , либо быстрее , чем IA-64 процессоры . Inte l и HP неоднократно заявляли , что Merced будет построен по революционной концепции EPIC. Но уже существуют процессоры , по всем признакам попадающие в категорию EPIC - отечественный Эльбрус -3 (1991г ), TMS320C6x (1997г ). Все же , Merced - это интересный эксп еримент в области разработки процессоров . И его ожидает трудная , но интересная судьба . Поэтому Intel и HP, призывая всю компьютерную индустрию переходить на Merced, сами стараются перестраховаться . Это утверждение подтве pждатся следующими фактами . Intel п р одолжает линию 32-разрядных x86-процессоров и , вдобавок , закупила лицензию у DEC на RISC-п pоцессо p Alpha; Hewllet-Packard, однов pеменно с pаз pаботкой EPIC, п pодолжает pаз pаботку новых супе pскаля pных RISC-п pоцессо pов се pии PA-RISC. Словарь термин ов CISC - аббревиатура от Complex Instruction Set Computer П pи pаз pаботке набора команд CISC заботились об удобстве п pог pаммиста / компилятора а не об эффективности исполнения команд п pоцессо pом . В систему команд вводили много сложных команд (производящих по несколько простых действий ). Часто эти команды представляли собой программы , написанные на микрокоде и записанные в ПЗУ процессора . Команды CISC имеют разную длину и время выполнения . Зато машинный код CISC процессоров - язык довольно высокого уровня. В наборе команд CISC часто присутсвуют , например , команды организации циклов , команды вызова подпрограммы и возврата из подпрограммы , сложная адресация , позволяющая реализовать одной командой доступ к сложным структурам данных . Основной недостаток CISC - б ольшая сложность реализации процессора при малой производительности . Примеры CISC процессоров - семейство Motorola 680x0 и процесссоры фирмы Intel от 8086 до Pentium II. Эти процессоры популярны и по сей день . Концепция CISC противопоставляется RISC. RI SC - аббревиатура от Reduced Instruction Set Computer Основными чертами RISC-концепции являются : · одинаковая длина команд · одинаковый формат команд - код команды ; регистр-приемник ; два регистра-источника · операндами команд могут быть только рег истры · команды выполняют только простые действия · большое количество регистров общего назначения (могут быть использованы любой командой ) · конвейер (ы ) · выполнение команды не дольше , чем за один такт · простая адресация К RISC процессорам при числяют MIPS, SPARC, PowerPC, DEC Alpha, HP PA-RISC, Intel 960, AMD 29000. RISC концепция предоставляет компилятору большие возможности по оптимизации кода . В настоящее время именно RISC процессоры наиболее распространены . Область их применения очень широ ка - от микроконтроллеров до суперкомпьютеров . RISC процессоры лидируют по производительности среди процессоров общего назначения . Существуют стандарты на RISC процессоры , например SPARC - Scalable Processor ARChitecture (текущая версия - 9, UltraSPARC), M IPS (текущая версия - IV, R10000), PowerPC; часто их называют открытыми архитектурами . VLIW - аббревиатура от Very Long Instruction Word VLIW - это набор команд , реализующий горизонтальный микрокод . Несколько (4 - 8) простых команд упаковываются компилят ором в длинное слово . Такое слово соответствует набору функциональных устройств . VLIW архитектуру можно рассматривать как статическую суперскалярную архитектуру . Имеется в виду , что распараллеливание кода производится на этапе компиляции , а не динамически во время исполнения . То есть , в машинном коде VLIW присутствует явный параллелизм . VLIW процессоры мало распространены . Наиболее известна была VLIW система фирмы Multiflow Computer, Inc. Эта фирма уже не существует . Многие бывшие инженеры из Multiflow Co mputer работают теперь в HP. В нашей стране довольно известен суперкомпьютер "Эльбрус -3", использующий VLIW концепцию . К VLIW можно причислить семейство сигнальных процессоров TMS320C6x фирмы Texas Instruments. C 1986 года ведутся исследования VLIW архитектуры в IBM's T. J. Watson Research Center . Несомненно , между EPIC и VLIW можно найти много общего . Список использованной литературы : 1. Подшивка журнала Компьютерра за 1997-2000 годы 2. Информация с Интернет-сайта IXBT 3. Журнал «Аппаратные средства PC » № 5, 1999 г.

1Архитектура и строительство
2Астрономия, авиация, космонавтика
 
3Безопасность жизнедеятельности
4Биология
 
5Военная кафедра, гражданская оборона
 
6География, экономическая география
7Геология и геодезия
8Государственное регулирование и налоги
 
9Естествознание
 
10Журналистика
 
11Законодательство и право
12Адвокатура
13Административное право
14Арбитражное процессуальное право
15Банковское право
16Государство и право
17Гражданское право и процесс
18Жилищное право
19Законодательство зарубежных стран
20Земельное право
21Конституционное право
22Конституционное право зарубежных стран
23Международное право
24Муниципальное право
25Налоговое право
26Римское право
27Семейное право
28Таможенное право
29Трудовое право
30Уголовное право и процесс
31Финансовое право
32Хозяйственное право
33Экологическое право
34Юриспруденция
 
35Иностранные языки
36Информатика, информационные технологии
37Базы данных
38Компьютерные сети
39Программирование
40Искусство и культура
41Краеведение
42Культурология
43Музыка
44История
45Биографии
46Историческая личность
47Литература
 
48Маркетинг и реклама
49Математика
50Медицина и здоровье
51Менеджмент
52Антикризисное управление
53Делопроизводство и документооборот
54Логистика
 
55Педагогика
56Политология
57Правоохранительные органы
58Криминалистика и криминология
59Прочее
60Психология
61Юридическая психология
 
62Радиоэлектроника
63Религия
 
64Сельское хозяйство и землепользование
65Социология
66Страхование
 
67Технологии
68Материаловедение
69Машиностроение
70Металлургия
71Транспорт
72Туризм
 
73Физика
74Физкультура и спорт
75Философия
 
76Химия
 
77Экология, охрана природы
78Экономика и финансы
79Анализ хозяйственной деятельности
80Банковское дело и кредитование
81Биржевое дело
82Бухгалтерский учет и аудит
83История экономических учений
84Международные отношения
85Предпринимательство, бизнес, микроэкономика
86Финансы
87Ценные бумаги и фондовый рынок
88Экономика предприятия
89Экономико-математическое моделирование
90Экономическая теория

 Анекдоты - это почти как рефераты, только короткие и смешные Следующий
— А что означают твои татуировки?
— Нарушение техники безопасности при работе со сварочным аппаратом.
Anekdot.ru

Узнайте стоимость курсовой, диплома, реферата на заказ.

Обратите внимание, курсовая по радиоэлектронике "Новые технологии в организации PC", также как и все другие рефераты, курсовые, дипломные и другие работы вы можете скачать бесплатно.

Смотрите также:


Банк рефератов - РефератБанк.ру
© РефератБанк, 2002 - 2016
Рейтинг@Mail.ru