Реферат: Анализ развития суперЭВМ - текст реферата. Скачать бесплатно.
Банк рефератов, курсовых и дипломных работ. Много и бесплатно. # | Правила оформления работ | Добавить в избранное
 
 
   
Меню Меню Меню Меню Меню
   
Napishem.com Napishem.com Napishem.com

Реферат

Анализ развития суперЭВМ

Банк рефератов / Радиоэлектроника

Рубрики  Рубрики реферат банка

закрыть
Категория: Реферат
Язык реферата: Русский
Дата добавления:   
 
Скачать
Архив Zip, 52 kb, скачать бесплатно
Заказать
Узнать стоимость написания уникального реферата

Узнайте стоимость написания уникальной работы

СРАВНИТЕЛЬНЫЙ АНАЛИЗ И ОЦЕНКА СОСТОЯНИЯ УРОВНЯ , ТЕНДЕНЦИЙ И ПЕРСПЕК ТИВ РАЗВИТ ИЯ СУПЕРЭВМ В настоящее время переход к новым поколениям вычислительных средств приобретает особую актуальность . Это связано с потребност ями решения сложных задач больших размерносте й . Непрерывный рост характеристик новых образ цов вооружений тр ебует разработки и с оздания принципиально новых вычислительных средс тв для поддержки их эффективного функциониров ания . В связи с этим , все более возраст ают требования к производительности и надежно сти вычислительных средств для решения военно -прикладных з а дач . Однопроцессорные вы числительные системы уже не справляются с решением большинства военно-прикладных задач в реальном времени , поэтому для повышения п роизводительности вычислительных систем военного назначения все чаще используются многопроцессорн ые в ы числительные системы (МВС ). Наибольший вклад в развитие вычислительны х средств всегда вносили технологические реше ния , при этом основополагающей характеристикой поколения вычислительных систем являлась элеме нтная база , так как переход на новую э лементную базу хорошо коррелируется с н овым уровнем показателей производительности и надежности вычислительных систем . Бурное развит ие технологии СБИС , разработка все новых и новых поколений микропроцессоров несколько п риостановило поиски принципиально новых архите к турных решений . В то же время становится очевидным , что чисто технологичес кие решения утратили свое монопольное положен ие . Так , например , в ближайшей перспективе заметно возрастает значение проблемы преодоления разрыва между аппаратными средствами и м етод а ми программирования . Данная проб лема решается чисто архитектурными средствами , при этом роль технологии является косвенно й : высокая степень интеграции создает условия для реализации новых архитектурных решений . При этом стало очевидным , что без кар динальн о й перестройки архитектурных п ринципов поддерживать интенсивные темпы развития средств вычислительной техники уже невозможн о. По самым оптимистическим прогнозам тактов ые частоты современных и перспективных СБИС могут быть увеличены в обозримом будущем до 5 ГГц . В то же время , достигнут ая степень интеграции позволяет строить парал лельные системы , в которых число процессоров может достигать десятков тысяч . В области повышения производительности вычислительных сис тем резерв технологических решений ограничивает с я одним порядком . Освоение же массового параллелизма и новых архитектурных решений содержит резерв повышения производител ьности на несколько порядков. Основными требованиями , предъявляемыми к многопроцессорным системам с массовым параллелиз мом , являются : н еобходимость высокой произ водительности для любого алгоритма ; согласование производительности памяти с производительностью вычислительной части ; способность микропроцессор ов согласованно работать при непредсказуемых задержках данных от любого источника и, наконец , машинно-независимое программирова ние. Увеличение степени параллелизма вызывает увеличение числа логических схем , что сопрово ждается увеличением физических размеров , в ре зультате чего возрастают задержки сигналов на межсоединениях . Этот фактор прив одит либо к снижению тактовой частоты , либо к созданию дополнительных логических ступеней и , в результате , к потере производительности . Рост числа логических схем также приводит к росту потребляемой энергии и отводимог о тепла . Кроме того , следует подчеркн у ть , что более высокочастотные логические схемы при прочих равных условиях потребл яют большую мощность на один вентиль . В результате возникает теплофизический барьер , об условленный двумя факторами : высокой удельной плотностью теплового потока , что требует п рименения сложных средств отвода тепла , и высокой общей мощностью системы , что вызывает необходимость использования сложн ой системы энергообеспечения и специальных по мещений. Другим фактором , влияющим на архитектуру высокопроизводительных вычислительных си сте м , является взаимозависимость архитектуры и а лгоритмов задач . Этот фактор часто приводит к необходимости создания проблемно-ориентированных систем , при этом может быть достигнута максимальная производительность для данного кл асса задач . Указанная взаим о зависимос ть является стимулом для поиска алгоритмов , наилучшим образом соответствующих возможным фо рмам параллелизма на уровне аппаратуры . А так как для написания программ используются языки высокого уровня , необходимы определенн ые средства автоматизации п роцессов распараллеливания и оптимизации программ. Классификация параллельных вычислительных си стем , предложенная Т.Джоном , основана на раздел ении МВС по двум критериям : способу постро ения памяти (общая или распределенная ) и с пособу передачи информации . Ос новные типы машин по классификации Т.Джона представлены в таблице 1. Здесь приняты следующие обозн ачения : p- элементарный процессор , M - элемент памяти , K- коммутатор , С - кэш-память. Параллельная вычислительная система с общ ей памятью и шинной организацие й обме на (машина 1) позволяет каждому процессору систе мы "видеть ", как решается задача в целом , а не только те части , над которыми он работает . Общая шина , связанная с памят ью , вызывает серьезные проблемы для обеспечен ия высокой пропускной способности кан а лов обмена . Одним из способов обойти эту ситуацию является использование кэш-памя ти (машина 2). В этом случае возникает пробле ма когерентности содержимого кэш-памяти и осн овной . Другим способом повышения производительнос ти систем является отказ от централ ь ной памяти (машина 3). Таблица 1 - Классифи кация МВС по типам памяти и передачи сообщений Типы передачи Типы памяти Сооб щений Общая память Общая и распредел енная Распределенная память Шинные соединения 1. 2. 3. Фиксированные перекрестные соединения 4. 5. 6. Ком мутационные структуры 7. 8. 9. Идеальной машиной является вычислите льная система , у которой каждый процессор имеет прямые каналы связи с другими проце ссорами , но в этом случае требуется чрезвы чайно большой объем оборудования для организа ции межпроцессорны х обменов . Определенный компромисс представляет сеть с фиксированной топологией , в которой каждый процессор соедин ен с некоторым подмножеством процессоров сист емы . Если процессорам , не имеющим непосредстве нного канала обмена , необходимо взаимодействовать, они передают сообщения через пром ежуточные процессоры . Одно из преимуществ так ого подхода - не ограничивается рост числа процессоров в системе . Недостаток - требуется о птимизация прикладных программ , чтобы обеспечить выполнение параллельных процессов , для которых необходимо активное воздействие н а соседние процессоры. Наиболее интересным вариантом для перспек тивных параллельных вычислительных комплексов яв ляется сочетание достоинства архитектур с рас пределенной памятью и каналами межпроцессорного обмена . Од ин из возможных методов построения таких комбинированных архитектур - к онфигурация с коммутацией , когда процессор им еет локальную память , а соединяются процессор ы между собой с помощью коммутатора (машин а 9). Коммутатор может оказаться весьма полезным для группы процессоров с распреде ляемой памятью (машина 8). Данная конфигурация п охожа на машину с общей памятью (машина 7), но здесь исключены проблемы пропускной сп особности шины . Недостатками классификации Т.Джона является скрытие уровня параллелизма в сис теме . Параллелизм любого рода требует одновреме нной работы , по крайней мере , двух устройс тв . Такими устройствами могут быть : арифметико- логические устройства (АЛУ ), устройства управления (УУ ). В ЭВМ классической архитектуры УУ и АЛУ образуют процессор . Ув еличение числа процессоров или числа АЛУ в кажд ом из них приводит к соответствующему рос ту параллелизма . Наличие в ЭВМ нескольких процессоров означает , что одновременно (параллельн о ) могут выполняться несколько программ или несколько фрагментов одной прог р ам мы . Работа нескольких АЛУ под управлением одного УУ означает , что множество данных м ожет обрабатываться параллельно по одной прог рамме . В соответствии с этим описание стру ктур параллельных систем можно представить в виде упорядоченной тройки : , где k - количество устройств управления , т. е . наибольшее количество независимо и одновре менно выполняемых программ в системе ; d - количество АЛУ , приходящихся на одно устройство управления ; w - количество разрядов , содержимое которых обрабатывается одн овременно (параллельно ) о дним арифметико-логическим устройством. Другая форма распараллеливания - конвейеризаци я , также требует наличия нескольких ЦП или АЛУ . В то время , как множество данных обрабатывается на одном устройстве , другое множество данных може т обрабатываться на следующем устройстве и т.д ., при этом в процессе обработки возникает поток данны х от одного устройства (ЦП или АЛУ ) к следующему . В течение всего процесса над одним множеством данных выполняется одно за другим n действий . Одновременно в конвейере на разных стадиях обработки могут находиться от 1 до n данных. Параллелизм и конвейеризацию можно рассма тривать на трех различных уровнях , представле нных в таблице 2. Шесть основных форм парал лелизма , в широком смысле этого слова , поз воляют пост роить схему классификации , в рамках которой можно описать разнообразие высокопроизводительных вычислительных систем и о тразить их эволюцию. Таблица 2 - Классифи кация МВС по типу распараллеливания Уровень параллелизма Параллелизм Конвейеризация П рограммы Мультипроцессор Макроконвейер Команды Матр ичный процессор Конвейер команд Д анные Множество разрядов Арифметический конв ейер В векторных суперЭВМ обеспечена предельна я производительность для процессов скалярной и векторной обработки , которая присутствует в большинстве задач . Задачи , содержащие высокую с тепень внутреннего параллелизма , могут быть хорошо адаптированы к системам масс ового параллелизма . Реальные задачи и , тем более , пакеты задач содержат целый ряд ал горитмов , имеющих различные уровни параллелизма. Все это говорит о том , что вместо попыток пр испособить все типы алгори тмов к одной архитектуре , что отражается н а конфигурации архитектур и сопровождается не всегда корректными сравнениями пиковой произ водительности , более продуктивным является взаимо дополнение архитектур в единой системе . Одним из первых примеров такой системы является объединение векторной системы Cray Y-XM с системой Cray T3D. Однако , это объединение с пом ощью высокоскоростного канала приводит к необ ходимости разбиения задач на крупные блоки и к потерям времени и памяти на обм ен и нформацией. Ситуация в данном случае подобна той , которая существовала до появления векторных машин . Для решения задач , содержащих боль шое число операций над векторами и матриц ами , использовались так называемые матричные процессоры , например , фирмы FSP, ко торые подкл ючались к универсальной машине с помощью канала ввода /вывода . Интеграция скалярной и векторной обработки в одном процессоре нар яду с обеспечением высокой скорости работы синхронного конвейера обеспечила успех векторн ых машин. Следующим логически м шагом является интеграция скалярной , векторной и параллельн ой обработки . Благодаря этому , может быть достигнута высокая реальная производительность з а счет распределения отдельных частей програм мы по подсистемам с различной архитектурой . Естественно , эт о распределение работы должно быть поддержано аппаратно-программными средствами автоматизации программирования . Эти средства должны содержать возможность интерактив ного вмешательства программиста на этапе анал иза задачи и возможность моделирования или проб н ого запуска программы с и змерением параметров эффективности. Следует подчеркнуть , что формы параллелизма в алгоритмах достаточно разнообразны , поэтому и их аппаратное отраж ение может быть различным . К наиболее прос тым можно отнести системы с одним потоком команд и множественными потоками данны х , системы с множественными потоками команд и данных , систолические системы. Одним из многообещающих подходов , обеспеч ивающих автоматическое распараллеливание , является принцип потока данных , при котором последов ательн ость или одновременность вычислений определяется не командами , а готовностью оп ерандов и наличием свободного функционального арифметического устройства . Однако , и в этом случае степень реального распараллеливания з ависит от внутреннего параллелизма алгори т ма и , очевидно , нужны эффективные спо собы подготовки задач . Кроме того , для реа лизации таких систем необходимо создание ассо циативной памяти для поиска готовых к раб оте пар операндов и систем распределения вычислений по большому числу функциональных у стро й ств . Аппаратная реализация параллельных подсистем полностью зависит от выбранных микропроцессо ров , БИС памяти и других компонентов . В настоящее время по экономическим причинам целесообразно использовать наиболее высокопроизводит ельные микропроцессоры , раз работанные для унипроцессорных машин. Вместе с тем , существуют подходы , связ анные с применением специализированных микропроц ессоров , ориентированных на использование в п араллельных системах . Типичным примером является серия транспьютеров фирмы Inmos. Однак о , и з-за ограниченного рынка эта серия по прои зводительности резко отстала от универсальных микропроцессоров , таких , как Alpha, Power PC, Pentium. Специализированн ые микропроцессоры смогут быть конкурентноспособ ными только при условии сокращения расходов н а проектирование и освоение в производстве , что в большой степени завис ит от производительности инструментальных вычисл ительных средств , используемых в системах авт оматизированного проектирования. В различных вычислительных машинах исполь зовались различные подходы , направленные на достижение , в первую очередь , одной из следующих целей : - максимальная арифметическая производительност ь процессора ; - эффективность работы операционной системы и удобство общения с ней для програм миста ; - эффективность трансляци и с языков высокого уровня и исключение написания п рограмм на автокоде ; - эффективность распараллеливания алгоритмов для параллельных архитектур. Однако , в любой машине необходимо в той или иной форме решать все указанны е задачи . Отметим , что сначала этого пытались достичь с помощью одного или нес кольких одинаковых процессоров. Дифференциация функций и специализация от дельных подсистем начала развиваться с появле ния отдельных подсистем и процессоров для обслуживания ввода /вывода , коммуникационных сет ей , вне шней памяти и т.п. В суперЭВМ кроме основного процессора (машины ) включались внешние машины . В различ ных системах можно наблюдать элементы специал изации в направлениях автономного выполнения функций операционной системы , системы программиро вания и подготов ки заданий. Во-первых , эти вспомогательные функции мог ут выполняться параллельно с основными вычисл ениями . Во-вторых , для реализации не требуются многие из тех средств , которые обеспечива ют высокую производительность основного процессо ра , например , возможн ость выполнения опера ций с плавающей запятой и векторных опера ций . В дальнейшем , при интеграции скалярной , векторной и параллельной обработки в рамка х единой вычислительной подсистемы состав эти х вспомогательных функций должен быть дополне н функциями анал и за программ с целью обеспечения требуемого уровня параллелиз ма и распределения отдельных частей программы по различным ветвям вычислительной подсистем ы. Появление суперЭВМ сопровождалось повышением их общей мощности потребления (выше 100 кВт ) и увеличением плотности тепловых поток ов на различных уровнях конструкции . Их со здание не в последнюю очередь оказалось в озможным , благодаря использованию эффективных жид костных и фреоновых систем охлаждения . Являет ся ли значительная мощность существенным приз наком су п ерЭВМ ? Ответ на этот вопрос зависит от того , что вкладывается в понятие суперЭВМ. Если считать , что суперЭВМ или , точнее , суперсистема - это система с наивысшей во зможной производительностью , то энергетический фа ктор остается одним из определяющих эту п рои зводительность . По мере развития техно логии мощность одного вентиля в микропроцессо рах уменьшается , но при повышении производите льности процессора за счет параллелизма общая мощность в ряде случаев растет . При о бъединении большого числа микропроцессоров в системе с массовым параллелизмом интегральная мощность и тепловыделение становятс я соизмеримыми с аналогичными показателями дл я векторно-конвейерных систем . Однако , иногда в рекламных целях параллельные системы с н ебольшим числом процессоров сравниваются с суперкомпьютерами предыдущего или более раннего поколений , чтобы показать их преиму щества в смысле простоты и удобства экспл уатации . Естественно , из такого некорректного сравнения нельзя сделать вывод о целесообразн ости создания современных суперсистем. О сновным стимулом создания суперсисте м являются потребности решения больших задач . В свою очередь , исследования и разработк и по суперсистемам стимулируют целый комплекс фундаментальных и прикладных исследований , р езультаты которых используются в дальнейшем в других областях . Прежде всего , это касается архитектуры и схемотехники вы числительных машин , высокочастотных интегральных схем и средств межсоединений , эффективных сис тем отвода тепла . Не менее важны результат ы по методам распараллеливания при выполнени и отдельных операций и участков программ на аппаратном уровне , методам постро ения параллельных алгоритмов , языков и програ ммных систем для эффективного решения больших задач. В развитии вычислительных средств можно выделить три основные проблемы : - повышени е производительности ; - повышение надежности ; - покрытие семантического разрыва. Этапы развития вычислительных средств при нято различать по поколениям машин . Характери стика поколения определяется конкретными показат елями , отражающими достигнутый уровень в решении трех перечисленных проблем . Поско льку подавляющий вклад в развитие вычислитель ных средств всегда принадлежал технологическим решениям , основополагающей характеристикой поколен ия машин считалась элементная база . И дейс твительно , переход на новую эл е мен тную базу хорошо коррелируется с новым ур овнем показателей производительности , надежности и сокращения семантического разрыва. В настоящее время актуальным является переход к новым поколениям вычислительных средств . По сложившейся традиции решающая рол ь отводится технологии производства элемент ной базы . В то же время становится оче видным , что технологические решения утратили монопольное положение . Так , например , в ближайш ей перспективе заметно возрастает значение пр облемы покрытия семантического разрыва, что отражается в необходимости создания высокосл ожных программных продуктов и требует кардина льного снижения трудоемкотси программирования . Эт а проблема решается преимущественно архитектурны ми средствами . Роль технологии здесь может быть только косвенной : высокая ст епень интеграции создает условия для реализац ии архитектурных решений. В настоящее время одним из доминируюш их направлений развития суперЭВМ являются выч ислительные системы c MIMD-параллелизмом на основе матрицы микропроцессоров . Для создания по добных вычислительных систем , состоящих и з сотен и тысяч связанных процессоров , пот ребовалось преодолеть ряд сложных проблем как в программном обеспечении (языки Parallel Pascal, Modula-2, Ada), так и в аппаратных средствах (эффективная ком мутационная сре д а , высокоскоростные с редства обмена , мощные микропроцессоры ). Элементная база современных вы cокопроизводительных сист ем характеризуется вы cокой степенью интеграци и (до 3,5 млн . транзисторов на кристалле ) и высокими тактовыми частотами (до 6 00 МГц ). В насто ящее время все фирмы и все университеты США , Западной Европы и Японии , разрабатывающие суперЭВМ , ведут интен сивные исследования в области многопроцессорных суперЭВМ с массовым параллелизмом , создают множество их типов , организуют их производс тво и ускорен н ыми темпами осваива ют мировой рынок в этой области . Многопроц ессорные ЭВМ с массовым параллелизмом уже сейчас существенно опережают по производительн ости традиционные суперЭВМ с векторно-конвейерной архитектурой . Системы с массовым параллелизм ом предъявля ю т меньшие требования к микропроцессорам и элементной базе и имеют значительно меньшую стоимость при любо м уровне производительности , чем векторно-конвейер ные суперЭВМ . Уже в текущем десятилетии пр оизводительность суперЭВМ с массовым параллелизм ом достигне т колоссальной величины десятков тысяч миллиардов операций в секунду с плавающей запятой над 64-разрядными числами ( десятков Тфлопс ). На ежегодной конференции в Чепел-Хилл ( Сев.Каролина ) представлен проект фирмы IBM, целью кото рого является создание гиперкубического параллельного процесора в одном корпусе . Конструкция , названная Execube, имеет 8 16-разрядных микропр оцесоров , встроенных в кристалл 4Мбит динамиче ского ЗУ (ДЗУ ). При этом степень интеграци составляет 5 млн . транзист о ров . Мик росхема изготовлена по КМОП-технологии с трем я уровнями металлизации на заводе IBM Microelectronic (Ясу,Яп ония ). Execube представляет собой попытку повышения степени интеграции процессора с памятью путем более эффективного доступа к информации ДЗУ. По существу , память превращается в расширенные регистры процессоров . Производительн ость микросхемы составляет 50 млн оп /с. Фирма CRAY Research объявила о начале выпуска с уперкопьютеров CRAY T3/E. Основная характеристика , на кот орой акцентировали внимание разработчики - м асштабируемость . Минимальная конфигурация составляет 8 микропроцессоров , максимальная - 2048. По сравнению с предыдущей моделью T3/D соотношение цена /про изводительность снижена в 4 раза и составляет 60 долл /Мфлопс , чему способствовало приме н ение недорогих процессоров DEC Alpha EVC, изгот овленных по КМОП-технологии . Предполагаемая стоимо сть модели Т 3/Е на основе 16 процессоров с 1-Гбайт ЗУ составит 900 тыс . долларов , а цена наиболее мощной конфигурации (1024 процессора , ЗУ 64 Гбайт ) -39,7 млн. долларов при пиков ой производительности 600 Гфлопс. Одним из способов дальнейшего повышения производительности вычислительной системы являе тся объединение суперкомпьютеров в кластеры п ри помощи оптоволоконных соединений . С этой целью компьютеры CRAY T3/E снабжены каналами вво да /вывода с пропускной способностью 128 Гбайт /с . Потенциальные заказчики проявляют повышенный интерес к новой разработке фирмы . Желание приобрести компьютер изъявили такие организа ции как Pittsburgh Supercomputer Center, Mobile Oil, Д е партамент по океанографии и атмосферным исследованиям США . При этом подписано несколько контрактов на изготовление нескольких компьютеров 512-процессорн ой конфигурации. Среди японских компаний следует выделить фирму Hitachi, которая выпустила суперкомпьюте р SR2201 с массовым параллелизмом , содержащий до 2048 процесоров . В основе системы переработанная компанией процессорная архитектура RA-RISC от фирмы Hewlett-Paccard. Псевдовекторный процессор функционирует под управлением ОС HP-UX/MPP Mash 3.0. В компьют е ре , кроме того , использована система поддержки параллельного режима работы Express, созданная корпор ацией Parasoft и получившая название ParallelWare. Производительно сть нового компьютера составляет 600 Гфлопс . К марту 1999 г . фирма планирует продать 30 с у перкомпьютеров. Одним из наиболее масштабных проектов в области создания вычислительных средств с массовым параллелизмом является проект фирм ы Intel по разработке самого быстродействующего к омпьютера на основе микропроцессоров шестого поколения P6. Новая с истема , которую планиру ется установить в Sandia National Laboratories будет состоять из 9000 процессоров Pentium P6 и иметь пиковую производительн ость 1000 ГФлопс . Заказчиком системы является мин истерство энергетики США . При этом основной областью примен е ния будет являться моделирование подземных ядерных взрывов , что позволит тратить 25 млн . долларов в год вместо 300 млн. За последнее десятилетие имеет место следующая динамика роста производительности пара ллельных вычислительных систем в США :1987 г . - 50 Мфлопс 1989 г . - 1 Гфлопс (суперкомпьютеры СМ ) 1991 г . - 10 Гфлопс (векторные процессоры и процессоры серии 528) 1994г . - 100 Гфлопс (CRAY,PARAGON) 1996-1997гг . – 200-500 Гфлопс (комбинация векторного процессора и куба поточной обработки ). 1998-1999 гг . – 100 0-3000 Гфлопс ( ASCI , T 3 E ) Особо выдающимися характеристиками отличаются суперкомпьютеры в середине 90-х годов :- Фирма IBM ALPS (1024 процессора RS6000, производительность 50 Гфлопс ); -Intel Paragon XPS (1872 процессора , производительность 72,9 Гфлопс ); - T hinking Mashines CM5 (512 процессоров Super Spark, производительность 83 Гфлопс ); - NCube 2SM80 (8192 процессора , производительность 84Гфлопс ); - Numerical Wind Tunnel (140 процессоров , производительность 124 Гфлопс на тестах LINPACK); - Intel Paragon XPS Supercomputer (4000 процессоров 1860XP, производительность 300 Гфлопс ) - С ray Research MPP System (2048 процессоров Alpha, производительность - 300 Гфлопс ) - Thinking Mashines CM5 (16384 процессора Super Spark, производительность 1000 Гфло пс ) Краткие харат еристики наиболее распро страненных современных суперкомпьютеров приведены ниже IBM RS/6000 SP2 Производитель - International Business Machines (IBM), отделение RS/6000. Класс архитектуры : Масштабируемая массивно-паралле льная вычислительная система (MPP). Узлы имеют архитектуру рабочих станций RS/6000. Существуют несколько типов "SP-узлов ", которые комплектуются различными процессорами : PowerPC 604e/332MHz, P2SC/160MHz, POWER3/MHz ( более ранние системы комплектовались процессорам и POWER2/66 и 77MHz). Возм ожна установка узлов с SMP-архитекутурой - до 4 процесоров PowerPC. Объем памяти для POWER3-узлов - до 4GB, для PowerPC-узлов - до 3GB. Доступны конфигурации SP от 2 до 128 узлов ( и до 512 по специальному заказу ). Узлы устана вливаются в "стойки " (до 16 уз лов в ка ждой ). Одна SP-система может содержать узлы р азличных типов . Узлы связаны между собой высокопроизводит ельных коммутатором (IBM high-performance switch), который имеет многост адийную структуру и работает с коммутацией пакетов . Cистемное ПО : OC AIX (устанавливается на каждом узле ). LoadLeveler – система поддержки пакетн ой обработки . Параллельные приложения исполняются под управлением Parallel Operating Environment (POE). Средства программирования : поставляется опт имизированная реализация интерфейс а MPI (ранее - MPL). HP 9000 (Exemplar) Производитель : Hewlett-Packard, High-performance systems division. Класс :многопроцессорные сервера с общей памятью (SMP). В настоящее время доступны несколько " классов " систем семейства HP 9000: сервера начально го уровня (D,K-class), среднего уровня ( N-class) и наи более мощные системы (V-class). Процессоры : 64-битные процессоры c архитектуро й PA-RISC 2.0 (PA-8200, PA-8500). Число процессоров : N-class - до 8 процессоров . V-class - до 32 процессоров . В дальней шем ожидается увеличение числа процессоров до 64, а затем до 128. Возможно объединение до 16 SMP-гиперузлов V-class ил и K-class в кластер "HP Enterprise Parallel Server". Для связи узлов исп ользуется коммутатор HP HyperFabric. Системное ПО : устанавливае тся опера ционная система HP-UX (совместима на уровне двоичн ого кода с ОС SPP-UX компьютеров Convex SPP). Средства программирования : HP MPI - реализация MPI 1.2, оптимизированная к архитектуре Exemplar. Распараллеливающие компиляторы Fortran/C, математиче ская библиотека HP MLIB. CXperf - средство анализа производительности программ . Cray T3E Производитель : Silicon Graphics Класс архитектуры : масштабируемая массивно-пар аллельная система , состоит из процессорных эл ементов (PE). В настоящее время сущест вуют две модификации : T3E-900 и T3E-1200. Процессорный элемент PE состоит из процессо ра , блока памяти и устройства сопряжения с сетью . Используются процессоры Alpha 21164 (EV5) с тактово й частотой 450 MHz (T3E-900) и 600 MHz (T3E-1000), пиковая производит ельность которых составляет 900 и 1200 MFLOP/sec соответственно . Процессорный элемент располагает своей лока льной памятью (DRAM) объемом от 256MB до 2GB. Системы T3E масштабируются до 2048 PE. Процессорные элементы связаны высокопроизвод ительной сетью с топологией трехмерного тора и двунаправленными каналами . Скорость обменов по сети достигает 480MB/sec в каждом нап равлении . Используется операционная система UNICOS/mk. Поддерживается явное параллельное программир ование c помощью пакета Message Passing T oolkit (MPT) - реализации интерфейсов передачи сообщений MPI, MPI-2 и PVM, библиотек а Shmem. Для Фортран-программ возможно также неявно е распараллеливание в моделях CRAFT и HPF. Среда разработки включает также набор визуальных ср едств для анализа и отладк и пар аллельных программ . Cray T90 Производители : Silicon Graphics, Cray Research. Класс архитектуры : многопр оцессорная векторная система (несколько векторных процессоров работают на общей памяти ). Модели Серия T90 включает модели T94, T916 и T932. Пр оцессор Системы серии T90 базируются на векторно-конвейерном процессоре Cray Research с пиковой производител ьностью 2GFlop/s. Число процессоров Система T932 может включ ать до 32 векторных процессоров (до 4-х в модели T94, до 16 модели T916), обеспечивая пиковую производительность более 60GFlop/s. Возможно объединение нескольких T90 в MPP-систе мы . Система T932 содержит от 1GB до 8GB (до 1 GB в модели T94 и до 4GB в модели T916) оперативной памя ти и обеспечивает скорость обменов с памя тью до 800MB/sec. И спользуется операционная система UNICOS. Cray SV1 Производитель : Silicon Graphics Класс архитектуры : масштабируемый векторный суперкомпьютер . Используются 8-конвейерные векторные процессор ы MSP (Multi-Streaming Processor) с пиковой производительность ю 4.8 GFLOP/sec; каждый MSP может быть подразделен на 4 станда ртных 2-конвейерных процессора с пиковой произ водительностью 1.2 GFLOP/sec. Тактовая частота процессоров - 250MHz. Процессоры объединяются в SMP-узлы , каждый из которых может содержать 6 MSP и 8 ста ндартных процессоров . Система (кластер ) может с одержать до 32 таких узлов . SMP-узел может содержать от 2 до 16GB памят и . Система может содержать до 1TB памяти . Вся память глобально адресуема (архитектура DSM). Используется операционная система UNICO S. Поставляется векторизующий и распараллеливаю щий компилятор CF90. Поддерживается также явное п араллельное программирование с использованием ин терфейсов MPI, OpenMP или Shmem. Cray Origin2000 Производитель Silicon Graphics Класс архитектуры : модульн ая систем а с общей памятью (cc-NUMA). Использованы 64-разрядные RISC-процессоры MIPS R10000, R12000/300MHz Основной компонент системы - модуль Origin, вклю чающий от 2 до 8 процессоров MIPS R10000 и до 16GB операт ивной памяти . Поставляются системы Origin2 000, сод ержащие до 256 процессоров (т.е . до 512 модулей ). В ся память системы (до 256GB) глобально адресуема , аппаратно поддерживается когерентность кэшей . Модули системы соединены с помощью сети CrayLink, построенной на маршрутизаторах MetaRouter. Использ уется операционная система SGI IRIX. Поставляется распараллеливающий компилятор Cray Fortran 90. Подде рживается стандарт OpenMP. Onyx2 InfiniteReality2 Производитель Silicon Graphics Класс архитектуры : многопроцессорная систем а визуализации ; по аппара тной архитектуре очень похожа на Origin2000. Система может включать до 128 процессоров MIPS R10000. Графические возможности системы обеспечивают специальные устройства трех типов : геометрич еские (векторные ) процессоры , растровые процессоры , генераторы ан алоговых сигналов . Система может быть оборудована 16 независимыми каналам и графического вывода (visualization pipelines). На аппаратном ур овне поддерживается графический интерфейс OpenGL. Используется операционная система SGI IRIX. Sun HPC 10000 (StarFi re) Производитель Sun Microsystems, серия Sun HPC. Класс архитектур : многопроцессорный SMP-сервер . Процессор UltraSPARC II/336MHz Система StarFire объединяет от 16 до 64 процессоров . Система включает от 2GB до 64GB памяти . Системное ПО : ОС Solari s, ПО распредел ения ресурсов Load Sharing Facility (LSF). Поставляется пакет поддержк и параллельных приложений Sun HPC 2.0, включающий такие средства как HPF, MPI, PVM, PFS (параллельная файловая систем а ), Prism (визуальная среда разработки ), S3L (библиот е ка математических подпрограмм ), и др . NEC SX-5 Производитель NEC, серия SX. Класс архитектуры : параллельный векторный суперкомпьютер (PVP). Каждый узел системы является векторно-кон вейерным SMP-суперкомпьютером , объединяющим до 16 инди видуальных вект орных процессоров (каждый с пиковой векторной производительностью 8 Gflop/s и скалярной производительностью 500 MFlop/s). Объем памяти каждого узла - до 128GB, произв одительность обменов с памятью достигает 1TB/sec. С истема может включать до 32 узлов , обе сп ечивая совокупную пиковую производительность до 4 TFlop/s. Для связи узлов используется высокоскорос тной коммутатор (IXS Internode Crossbar Switch). Используется операционная система SUPER-UX. Поставляются компилятор языка HPF, реализация интерфейса M PI, компиляторы Fortran77/SX и Fortran90/SX с авт оматическим распараллеливанием и векторизацией , а также интегрированная среда разработки и оптимизации PSUITE. Fujitsu VPP Производитель Fujitsu Класс архитектуры параллельный векторный суперкомпьютер ( PVP). Модификации VPP300, VPP700, VPP5000 Каждый процессорный элемент (PE) системы VPP700E с остоит скалярного устройства (SU), векторного устройс тва (VU), блока памяти и устройства сопряжения . Для VPP700: VU состоит из 7 конвейеров и обеспечивае т пикову ю производительность до 2.4 GFLOP/sec. Объем памяти - до 2GB. Для VPP5000: VU состоит из 4 конвейеров , пиковая производительность - 9.6 GFLOP/sec. Объем памяти - до 16GB. Для VPP700: cистема может включать от 8 до 256 PE, суммарная пиковая производительно сть до 14.4 GFLOP/sec Для VPP5000: до 512 PE, суммарная пиковая производите льность до 4.9 TFLOP/sec. Процессорные элементы связаны коммутатором (crossbar network), который производить двухсторонние обмены , не прерывая вычислений . Пропускная способность ка налов коммутатора : для VPP700 - 615MB/sec, для VPP5000 - 1.6GB/sec. Используется операционная система UXP/V, основанная на UNIX System VR4. Среди средств разработки поставляются : ра спараллеливающий и векторизующий компилятор Fortran90/VPP, о птимизированна я для VPP библиотека математическ их подпрограмм SSLII/VPP, библиотеки передачи сообшений MPI-2 и PVM 3.3. AlphaServer Производитель Compaq, Digital. Высокопроизводительный SMP-сервер , AlphaServer Array - кластерная система . Процессоры GS140 и GS60 - Alpha 21264, 8400 и 8200 - Alpha 21164 Число процессоров GS140 и 8400 - до 14, GS60 и 8200 - до 6 Объем памяти GS140 - до 28GB. Кластеры AlphaServer Array могут объединять до 8 узлов AlphaServer, т.е . в общей сложности до 112 процессоров . Могут комбини роваться узлы различных типов . Узлы связываются между собой коммута тором MEMORY CHANNEL, который обеспечивает скорость обменов до 66MB/sec и латентность порядка 3 мкс . На платформе AlphaServer поддерживаются операционные системы Tru64 UNIX (это новое имя Digital UNIX), OpenVMS и Windows NT. Поставляется ПО кластеризации TruCluster Software. Используются коммуникационные библиотеки TruCluster MEMORY CHANNEL Software и MPI. Поддерживается распараллеливание в с тандарте OpenMP. Особо выдающимися характеристи ками от личаются суперкомпьютеры в конце 90-х годов предстиавлены в таблице 3. Таблица 3 – н аиболее быстродействующие суперекомпьютеры № Изготовитель Суперкомпьютер Страна Год создания Число процес соров Пиковая производи-тельность , Гфлопс Реальная производи -тельность на пакете LINPAK, Гфлопс 1 Intel ASCI Red USA 1999 9472 3154 2121.3 2 SGI ASCI Blue Mountain USA 1998 6144 3072 1608 3 SGI T3E1200 USA 1998 1084 1300.8 891.5 4 Hitachi SR8000/128 Japan 1999 128 1024 873.6 5 SGI T3E900 USA 1997 1324 1191.6 815.1 6 SGI ORIGIN2000 USA 1999 2048 1024 690.9 7 SGI T3E900 UK 1997 876 788.4 552.92 8 IBM SP Silver USA 1998 1952 1296 547 9 SGI T3E900 USA 1999 812 730.8 515.1 10 SGI T3E1200 UK 1998 612 734 509.9 11 IBM ASCI Blue Pacific CTR SP Silver USA 1998 1344 892 468.2 12 Hitachi SR8000/64 Japan 1999 64 512 449.7
1Архитектура и строительство
2Астрономия, авиация, космонавтика
 
3Безопасность жизнедеятельности
4Биология
 
5Военная кафедра, гражданская оборона
 
6География, экономическая география
7Геология и геодезия
8Государственное регулирование и налоги
 
9Естествознание
 
10Журналистика
 
11Законодательство и право
12Адвокатура
13Административное право
14Арбитражное процессуальное право
15Банковское право
16Государство и право
17Гражданское право и процесс
18Жилищное право
19Законодательство зарубежных стран
20Земельное право
21Конституционное право
22Конституционное право зарубежных стран
23Международное право
24Муниципальное право
25Налоговое право
26Римское право
27Семейное право
28Таможенное право
29Трудовое право
30Уголовное право и процесс
31Финансовое право
32Хозяйственное право
33Экологическое право
34Юриспруденция
 
35Иностранные языки
36Информатика, информационные технологии
37Базы данных
38Компьютерные сети
39Программирование
40Искусство и культура
41Краеведение
42Культурология
43Музыка
44История
45Биографии
46Историческая личность
47Литература
 
48Маркетинг и реклама
49Математика
50Медицина и здоровье
51Менеджмент
52Антикризисное управление
53Делопроизводство и документооборот
54Логистика
 
55Педагогика
56Политология
57Правоохранительные органы
58Криминалистика и криминология
59Прочее
60Психология
61Юридическая психология
 
62Радиоэлектроника
63Религия
 
64Сельское хозяйство и землепользование
65Социология
66Страхование
 
67Технологии
68Материаловедение
69Машиностроение
70Металлургия
71Транспорт
72Туризм
 
73Физика
74Физкультура и спорт
75Философия
 
76Химия
 
77Экология, охрана природы
78Экономика и финансы
79Анализ хозяйственной деятельности
80Банковское дело и кредитование
81Биржевое дело
82Бухгалтерский учет и аудит
83История экономических учений
84Международные отношения
85Предпринимательство, бизнес, микроэкономика
86Финансы
87Ценные бумаги и фондовый рынок
88Экономика предприятия
89Экономико-математическое моделирование
90Экономическая теория

 Анекдоты - это почти как рефераты, только короткие и смешные Следующий
- Я слышал, ты встречаешься с моей бывшей?
- Ну да. А что?
- Ничего. Я тут яблоко надкусил, хочешь доесть?
Anekdot.ru

Узнайте стоимость курсовой, диплома, реферата на заказ.

Банк рефератов - РефератБанк.ру
© РефератБанк, 2002 - 2016
Рейтинг@Mail.ru