Главная | Обратная связь | Поможем написать вашу работу!
МегаЛекции

Организация компьютеров с массовым параллелизмом с помощью модели одноранговых вычислений




Знаете ли вы о том, что около 90% вычислительной мощности большинства компьютеров остаются незадействованными? Многие из них используются по рабочим дням, простаивая во время перерывов на кофе, обедов, деловых встреч, по ночам и выходным. Даже в рабочем состоянии при выполнении большинства задач используется незначительная доля вычислительной мощ­ности. Одноранговая обработка породила революционную концепцию, суть которой заключается в том, что среди многих компьютеров распределяются небольшие порции гигантских вычислительных задач, в результате чего за-действуются свободные вычислительные мощности. Эффект одноранговой технологии может использоваться в целях организации компьютеров с мас­совым параллелизмом.

Одноранговую технологию вряд ли можно охарактеризовать как нечто очень сложное или новое в технологическом плане. Все, что она делает, — эта установка непосредственных связей между двумя компьютерами, в ре­зультате чего они могут «разговаривать» друг с другом, не прибегая к помощи «третьей стороны» (сервера). В чем же состоит новизна установки соедине­ний между компьютерами через Интернет или частные сети? Непосредствен­ные соединения могут легко устанавливаться между любыми двумя компьюте­рами, выбранными среди тысяч или даже миллионов компьютеров, подключенных к Сети. В качестве одного хорошо известного примера одноранговой распре­деленной обработки может служить проект SETI@home, начало которому было положено весной 1999 г. Суть проекта заключалась в поиске внеземного разума. Каждый день наибольшие мировые радиотелескопы, размещенные в Аресибо и Пуэрто-Рико, «слушают» космос, фиксируя цифровые шумы, «пу­тешествующие» во Вселенной. В результате ежедневно накапливается мас­сив данных, объем которого достигает 50 Гбайтов. Затем требуется проана­лизировать собранные данные на предмет наличия регулярных фрагментов, которые могут свидетельствовать об их искусственном происхождении. Од­нако анализ данных, собранных в течение года, потребует около 100 тыс. лет работы большого компьютера, настолько грандиозной является эта задача. Решение заключается в использовании модели одноранговых вычислений в целях создания виртуального компьютера с массовым параллелизмом.

Данные, собранные радиотелескопом в Аресибо, передаются в Калифор­нийский университет в Беркли, где они разбиваются на рабочие модули,

заявки, а также наряды на работу) должна храниться в электронном виде и быть доступной для всех желающих. Заказчики и поставщики выполняют свою работу в электронной форме путем размещения заказов, проверки счетов и т. д. в любое время дня и ночи. Именно поэтому они выдвигают требование о доступности дан­ных в течение 24 часов в сутки. Ведь для электронного бизнеса не существуют границы и не имеют особого значения расстояния.

Например, банк Chase Manhattan Bank уделяет большое внимание интерак­тивным банковским технологиям, в связи с чем ему пришлось изменить исполь­зуемый метод обработки чеков. Еще до недавнего времени банк сохранял копии

объем каждого из которых составляет 350 Кбайтов. В течение одного рабочего дня генерируется 150 тыс. модулей. Затем каждый из модулей загружается одним из 2 млн добровольцев, чьи компьютеры используются для обработки данных в силу их недостаточной загруженности. Как только обработка модуля завершается (примерно 20 часов на компьютере с процессором Pentium II 400 МГц), результаты выгружаются на SETI-компьютер в целях их заверша­ющего обзора. Анализ подобного типа стал возможным только потому, что на компьютерах добровольцев выполняется обработка с массовым паралле­лизмом.

Эта модель не может быть распространена на все большие приложения, а применяется лишь по отношению к большим проектам, реализующим ин­тенсивную обработку данных. Производители микропроцессоров Intel приме­няют подобный подход начиная 1990 г., в результате чего уменьшаются за­траты на проектирование микросхем. Были связаны в глобальном масштабе 10 тыс. компьютеров, в результате чего была исключена необходимость в при­обретении нескольких мэйнфреймов в течение двух лет. Горнодобывающие компании выполняют сбор огромного количества географических и сейсми­ческих данных, прежде чем приступать к добыче нефти, газа или угля. Нефтяной гигант Amerada Hess, находящийся в Нью-Йорке, использует одноранговую вычислительную модель путем создания собственной сети, объединяющей 200 настольных компьютеров. Эти компьютеры выполняют анализ сейсми­ческих данных. Применение подобного подхода позволило отказаться от идеи приобретения двух суперкомпьютеров IBM. Согласно утверждению главного информационного менеджера Ричарда Росса (Richard Ross), Amerada Hess получила «семикратный рост производительности при условии снижения за­трат». Данная компания также придерживается концепции поэтапного про­движения, объединяя хранилища данных настольных компьютеров в целях со­здания гигантского репозитория данных.

Информация к размышлению. Предполагая, что концепция одноранго­вых вычислений может применяться в других отраслях промышленности, об­оснуйте применимость данной технологии. Какого рода недостатки (пробле­мы) вызывает применение подобного подхода?

Источники: Aaron Ricadela. «Power to the PC», Information Week, January 15, 2001; Jennifer Di Sabatino. «What's So New About Peer-to-Peer?» Computerwor/d, November 20, 2000; Paul McDougall. «The Power of Peer-to-Peer», Information Week, August 28, 2000; Kathleen Melymuka. «IT on the "Outer Limits"». Computerworld, July 3, 2000.

12 мли выписываемых ежедневно чеков на микрофильмах и микрофишах, но в этом случае был невозможен доступ к архивной информации в оперативном ре­жиме. В настоящее время банк Chase просто сгенерировал цифровые образы каж­дого чека, которые хранятся в интерактивном режиме в течение 45 дней, после чего производилась архивация данных на магнитную ленту с помощью быстро­действующего стримера. Заказчики получили возможность просмотра недавно выписанного чека в течение двух секунд. Для хранения каждого чека требуется примерно 40 тыс. байтов, поэтому для хранения сведений о всех чеках Chase нуж­дается в 20 Гбайтов свободного места (причем эти потребности быстро растут по

мере роста объема проводимых платежей). Электронный бизнес и коммерция придают новое стратегическое значение технологиям, которые обеспечивают хра­нение огромных объемов данных о транзакциях, а также обеспечивают оператив­ный доступ к ним.

Планирование производительности компьютерной системы и масштабируемость

По мере роста объемов электронного бизнеса и коммерции той или иной фирмы возникает необходимость в тщательном анализе существующих серверов и других компонентов инфраструктуры, с тем чтобы убедиться в их способности к обра­ботке все возрастающего количества транзакций и пользователей при условии сохранения высокого уровня производительности и доступности. Менеджерам и специалистам в области информационных систем необходимо уделять больше внимания вопросам планирования производительности компьютерных систем и масштабируемости. Процесс планирования производительности заключается в прогнозировании момента возникновения ситуации «переполнения». При этом учитываются такие факторы, как максимально возможное количество пользова­телей системы, степень влияния программных приложений, установленных и уста­навливаемых в ближайшем будущем, а также измеренные показатели произво­дительности (например, минимальное время отклика при обработке деловых транзакций). Благодаря планированию производительности компьютерной си­стемы гарантируется доступность необходимых вычислительных ресурсов, при­меняемых с различными уровнями приоритета, а также то, что фирма распола­гает вычислительными ресурсами, достаточными для удовлетворения текущих и будущих потребностей. Например, фондовая биржа Nasdaq выполняет опера­тивное планирование производительности компьютерных систем, позволяющее идентифицировать пиковые величины транзакций, связанных с продажей акций. При этом гарантируется уровень вычислительных ресурсов, достаточный для об­работки резких «скачков» транзакций (Robinson, 2000).

Хотя планирование производительности компьютерных систем — удел специ­алистов, важен вклад деловых менеджеров. В ходе осуществления этого процесса предпринимаются попытки достижения оптимального уровня производительно­сти в будущем и в настоящем. Простои и чрезмерное время отклика оборачива­ются потерей заказчиков и прибыли. Бизнес-менеджеры должны определить

Capacity planning (планирование производительности компьютерной си­стемы)

Процесс прогнозирования порога насыщения компьютерной системы, позво­ляющий гарантировать выделение адекватных вычислительных ресурсов для работы с различными уровнями приоритета. В результате успешного внед­рения этого процесса фирма получает в свое распоряжение объем вычисли­тельных ресурсов, достаточный для удовлетворения ее сегодняшних и буду­щих потребностей.

Поделиться:





Воспользуйтесь поиском по сайту:



©2015 - 2024 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...