Организация компьютеров с массовым параллелизмом с помощью модели одноранговых вычислений
Знаете ли вы о том, что около 90% вычислительной мощности большинства компьютеров остаются незадействованными? Многие из них используются по рабочим дням, простаивая во время перерывов на кофе, обедов, деловых встреч, по ночам и выходным. Даже в рабочем состоянии при выполнении большинства задач используется незначительная доля вычислительной мощности. Одноранговая обработка породила революционную концепцию, суть которой заключается в том, что среди многих компьютеров распределяются небольшие порции гигантских вычислительных задач, в результате чего за-действуются свободные вычислительные мощности. Эффект одноранговой технологии может использоваться в целях организации компьютеров с массовым параллелизмом. Одноранговую технологию вряд ли можно охарактеризовать как нечто очень сложное или новое в технологическом плане. Все, что она делает, — эта установка непосредственных связей между двумя компьютерами, в результате чего они могут «разговаривать» друг с другом, не прибегая к помощи «третьей стороны» (сервера). В чем же состоит новизна установки соединений между компьютерами через Интернет или частные сети? Непосредственные соединения могут легко устанавливаться между любыми двумя компьютерами, выбранными среди тысяч или даже миллионов компьютеров, подключенных к Сети. В качестве одного хорошо известного примера одноранговой распределенной обработки может служить проект SETI@home, начало которому было положено весной 1999 г. Суть проекта заключалась в поиске внеземного разума. Каждый день наибольшие мировые радиотелескопы, размещенные в Аресибо и Пуэрто-Рико, «слушают» космос, фиксируя цифровые шумы, «путешествующие» во Вселенной. В результате ежедневно накапливается массив данных, объем которого достигает 50 Гбайтов. Затем требуется проанализировать собранные данные на предмет наличия регулярных фрагментов, которые могут свидетельствовать об их искусственном происхождении. Однако анализ данных, собранных в течение года, потребует около 100 тыс. лет работы большого компьютера, настолько грандиозной является эта задача. Решение заключается в использовании модели одноранговых вычислений в целях создания виртуального компьютера с массовым параллелизмом.
Данные, собранные радиотелескопом в Аресибо, передаются в Калифорнийский университет в Беркли, где они разбиваются на рабочие модули, заявки, а также наряды на работу) должна храниться в электронном виде и быть доступной для всех желающих. Заказчики и поставщики выполняют свою работу в электронной форме путем размещения заказов, проверки счетов и т. д. в любое время дня и ночи. Именно поэтому они выдвигают требование о доступности данных в течение 24 часов в сутки. Ведь для электронного бизнеса не существуют границы и не имеют особого значения расстояния. Например, банк Chase Manhattan Bank уделяет большое внимание интерактивным банковским технологиям, в связи с чем ему пришлось изменить используемый метод обработки чеков. Еще до недавнего времени банк сохранял копии объем каждого из которых составляет 350 Кбайтов. В течение одного рабочего дня генерируется 150 тыс. модулей. Затем каждый из модулей загружается одним из 2 млн добровольцев, чьи компьютеры используются для обработки данных в силу их недостаточной загруженности. Как только обработка модуля завершается (примерно 20 часов на компьютере с процессором Pentium II 400 МГц), результаты выгружаются на SETI-компьютер в целях их завершающего обзора. Анализ подобного типа стал возможным только потому, что на компьютерах добровольцев выполняется обработка с массовым параллелизмом.
Эта модель не может быть распространена на все большие приложения, а применяется лишь по отношению к большим проектам, реализующим интенсивную обработку данных. Производители микропроцессоров Intel применяют подобный подход начиная 1990 г., в результате чего уменьшаются затраты на проектирование микросхем. Были связаны в глобальном масштабе 10 тыс. компьютеров, в результате чего была исключена необходимость в приобретении нескольких мэйнфреймов в течение двух лет. Горнодобывающие компании выполняют сбор огромного количества географических и сейсмических данных, прежде чем приступать к добыче нефти, газа или угля. Нефтяной гигант Amerada Hess, находящийся в Нью-Йорке, использует одноранговую вычислительную модель путем создания собственной сети, объединяющей 200 настольных компьютеров. Эти компьютеры выполняют анализ сейсмических данных. Применение подобного подхода позволило отказаться от идеи приобретения двух суперкомпьютеров IBM. Согласно утверждению главного информационного менеджера Ричарда Росса (Richard Ross), Amerada Hess получила «семикратный рост производительности при условии снижения затрат». Данная компания также придерживается концепции поэтапного продвижения, объединяя хранилища данных настольных компьютеров в целях создания гигантского репозитория данных. Информация к размышлению. Предполагая, что концепция одноранговых вычислений может применяться в других отраслях промышленности, обоснуйте применимость данной технологии. Какого рода недостатки (проблемы) вызывает применение подобного подхода? Источники: Aaron Ricadela. «Power to the PC», Information Week, January 15, 2001; Jennifer Di Sabatino. «What's So New About Peer-to-Peer?» Computerwor/d, November 20, 2000; Paul McDougall. «The Power of Peer-to-Peer», Information Week, August 28, 2000; Kathleen Melymuka. «IT on the "Outer Limits"». Computerworld, July 3, 2000. 12 мли выписываемых ежедневно чеков на микрофильмах и микрофишах, но в этом случае был невозможен доступ к архивной информации в оперативном режиме. В настоящее время банк Chase просто сгенерировал цифровые образы каждого чека, которые хранятся в интерактивном режиме в течение 45 дней, после чего производилась архивация данных на магнитную ленту с помощью быстродействующего стримера. Заказчики получили возможность просмотра недавно выписанного чека в течение двух секунд. Для хранения каждого чека требуется примерно 40 тыс. байтов, поэтому для хранения сведений о всех чеках Chase нуждается в 20 Гбайтов свободного места (причем эти потребности быстро растут по
мере роста объема проводимых платежей). Электронный бизнес и коммерция придают новое стратегическое значение технологиям, которые обеспечивают хранение огромных объемов данных о транзакциях, а также обеспечивают оперативный доступ к ним. Планирование производительности компьютерной системы и масштабируемость По мере роста объемов электронного бизнеса и коммерции той или иной фирмы возникает необходимость в тщательном анализе существующих серверов и других компонентов инфраструктуры, с тем чтобы убедиться в их способности к обработке все возрастающего количества транзакций и пользователей при условии сохранения высокого уровня производительности и доступности. Менеджерам и специалистам в области информационных систем необходимо уделять больше внимания вопросам планирования производительности компьютерных систем и масштабируемости. Процесс планирования производительности заключается в прогнозировании момента возникновения ситуации «переполнения». При этом учитываются такие факторы, как максимально возможное количество пользователей системы, степень влияния программных приложений, установленных и устанавливаемых в ближайшем будущем, а также измеренные показатели производительности (например, минимальное время отклика при обработке деловых транзакций). Благодаря планированию производительности компьютерной системы гарантируется доступность необходимых вычислительных ресурсов, применяемых с различными уровнями приоритета, а также то, что фирма располагает вычислительными ресурсами, достаточными для удовлетворения текущих и будущих потребностей. Например, фондовая биржа Nasdaq выполняет оперативное планирование производительности компьютерных систем, позволяющее идентифицировать пиковые величины транзакций, связанных с продажей акций. При этом гарантируется уровень вычислительных ресурсов, достаточный для обработки резких «скачков» транзакций (Robinson, 2000).
Хотя планирование производительности компьютерных систем — удел специалистов, важен вклад деловых менеджеров. В ходе осуществления этого процесса предпринимаются попытки достижения оптимального уровня производительности в будущем и в настоящем. Простои и чрезмерное время отклика оборачиваются потерей заказчиков и прибыли. Бизнес-менеджеры должны определить Capacity planning (планирование производительности компьютерной системы) Процесс прогнозирования порога насыщения компьютерной системы, позволяющий гарантировать выделение адекватных вычислительных ресурсов для работы с различными уровнями приоритета. В результате успешного внедрения этого процесса фирма получает в свое распоряжение объем вычислительных ресурсов, достаточный для удовлетворения ее сегодняшних и будущих потребностей.
Воспользуйтесь поиском по сайту: ©2015 - 2024 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...
|