Демонстрационный пример использования некоторых возможностей Grid Open Source Forum, Russia, 27 April 2005, [email protected] 1 Что такое Grid Grid это инфраструктура, которая делает возможным совместное использование высокопроизводительных компьютеров, сетей, баз данных, которыми владеют и управляют различные организации. Приложения Grid часто требуют больших объемов данных и/или больших вычислительных ресурсов и также требуют безопасного разделения ресурсов через организационные барьеры, что не просто обеспечить с помощью Интернета и Web структур. Как предлагает Ian Foster в [1] Grid это система, которая: 1) Координирует ресурсы, которые не подлежат централизованному управлению. Grid интегрирует и координирует ресурсы и пользователей, которые находятся в областях под разным управлением, например, настольный компьютер пользователя и централизованный компьютинг; различные компании; и решает вопросы безопасности, политики, оплаты, членства и т.д. 2 Что такое Grid (продолжение) В противном случае мы имеем дело с системой с локальным управлением. 2) Использует стандартные, открытые протоколы и интерфейсы общего назначения. Grid строится на протоколах и интерфейсах общего назначения, которые решают такие основные вопросы как аутентификация, авторизация, поиск и доступ к ресурсам. Важно, что эти протоколы и интерфейсы стандартные, в противном случае мы имеем дело с системой, зависимой от приложений. 3) Предоставляет нетривиальное качество обслуживания. Grid позволяет использовать свои составные ресурсы для удовлетворения требований пользователей так, чтобы использование всей системы было значительно эффективнее использования суммы ее частей. 3 Globus Toolkit Globus Toolkit является продуктом исследовательского проекта Globus Alliance [2], целью которого является дать возможность использовать концепции Grid в научных и инженерных вычислениях. Во всем мире Globus Toolkit используется для построения Grid и разработки Grid приложений и является де факто стандартом и продуктом с открытым исходным текстом. Globus Toolkit представляет собой набор компонентов, которые можно использовать независимо или вместе, чтобы разрабатывать grid приложения и средства программирования. 4 Сценарий демонстрационного примера • Имеются 2 вычислительных кластера: SUNY-NCG [3] и PNPI PCFARM [4]. • На обоих кластерах установлен Globus Toolkit 2.4 • На кластере SUNY-NCG установлен Torque [5] в качестве системы пакетной обработки, а на PCFARM Sun Grid Engine (SGE) [6]. • Кроме того на обоих кластерах установлена система мониторинга и учета заданий BOSS (Batch Object Submission System) [7]. Информация о заданиях записывается в базу данных, расположенную на сервере ram3.chem.sunysb.edu. • Для доступа пользователя к этой базе данных через webинтерфейс https://ram3.chem.sunysb.edu/BODE используется BODE ( BOss Database Explorer) [8]. • Тестовое задание запускается на обоих кластерах, а мониторинг заданий и результат их выполнения отображается на https://ram3.chem.sunysb.edu/BODE 5 Схема демонстрационного примера SUNY-NCG Job submission PCFARM Job submission BOSS Database Web Server BODE Web Browser 6 BODE страница мониторирования задания 7 Ссылки 1. What is the Grid ? A Three Point Checklist. I. Foster, GRIDToday, July 20, 2002. 2. http://www.globus.org The Globus Alliance 3. http://ram3.chem.sunysb.edu/ramdata SUNY-NCG cluster 4. http://hepd.pnpi.spb.ru/pcfarm PNPI PCFARM cluster 5. http://supercluster.org Torque 6. http://gridengine.sunsource.net SGE 7. http://boss.bo.infn.it BOSS 8. http://filine.home.cern.ch/filine/bode/doc/Contents.html BODE 8