ПРИНЦИПЫ ОРГАНИЗАЦИИ ПОДГОТОВКИ КАДРОВ В ОБЛАСТИ ВЫСОКОПРОИЗВОДИТЕЛЬНЫХ ВЫЧИСЛЕНИЙ В.Н.Берцун, С.П.Сущенко Томский государственный университет, Томск Тел.: (3822) 42-60-96, e-mail: [email protected] В настоящее время суперкомпьютеры (СК) начинают активно применять в таких областях, как: космонавтика, сейсмология, томография, восстановление изображений, нефте- и газодобыча, криптография, прогноз погоды, автомобилестроения, моделирования ядерных реакций, геоинформационные системы, экология, системы управления сложными техническими объектами, системы массового обслуживания и др. Использование СК позволяет получать качественно новые результаты в фундаментальных исследованиях. Одним из факторов, сдерживающих применение СК, является неподготовленность пользователей. Идеология подготовки кадров по направлению “Высокопроизводительные вычисления”, предложенная и реализуемая в Томском госуниверситете, основана на поэтапном введении различных уровней обучения специалистов. На первом этапе предполагается развернуть обучение специалистов в указанном направлении для аспирантов, докторантов и соискателей Томского научно-образовательного комплекса физико-математического профиля по программе повышения квалификации. В настоящее время выполнен цикл подготовки по специализированному учебному плану повышения квалификации, включающему шесть спецкурсов общим объемом 110 часов аудиторных занятий и продолжительностью 10 недель. Основной целью данного этапа является апробирование предложенной учебной программы и уточнение перечня, содержания и объема специализированных дисциплин учебного плана. Кроме того, важнейшая задача этого этапа состоит в определении спроса на знания в области высокопроизводительных вычислений, спектра отраслей науки, техники и производства, нуждающихся в специалистах данного направления, а также перечня проблем, решаемых в регионе и требующих применения высокопроизводительных ресурсов. На втором этапе с учетом итогов работы на первом этапе планируется развертывание образовательной программы в форме переподготовки кадров по направлению “высокопроизводительные вычисления”. Данный этап образовательной деятельности предусматривает расширение спектра обучаемых и включение в процесс обучения специалистов физико-математического и естественнонаучного профиля. Задача этого этапа состоит в формировании и уточнении перечня общих математических и естественнонаучных дисциплин; общепрофессиональных дисциплин, дисциплин специальности и факультативов, необходимых для переподготовки кадров. Третий этап предусматривает открытие специальности в области математического и программного обеспечения высокопроизводительных вычислительных систем для подготовки дипломированных специалистов на основе разрабатываемого проекта государственного образовательного стандарта. Для решения кадровой проблемы, после ввода в строй кластера ТГУ, начали реализовываться два направления подготовки пользователей. С января 2001 г. при кафедре вычислительной математики и компьютерного моделирования ММФ начал свою работу городской семинар по суперкомпьютерным вычислениям. Проведена подготовительная работа, разработан учебный план и с 15 марта началась подготовка слушателей (10 человек) по направлению высокопроизводительные вычисления. Учебный план объемом 110 часов включает в себя шесть спецкурсов: – методы параллельных вычислений; – технологии параллельного программирования и вычислений; – новые информационные технологии; – принципы организации многопроцессорных вычислительных систем и многомашинных комплексов; – современные методы решения многомерных задач на суперкомпьютерах; – принципы организации операционных систем. Выбор данного перечня дисциплин и содержания программ курсов для повышения квалификации в области высокопроизводительных вычислений обосновывается следующими соображениями. Теоретический курс “Методы параллельных вычислений” преследует цель ознакомить слушателей с базовыми понятиями параллельных вычислительных методов. Наряду с классификацией ЭВМ рассматриваются простейшие параллельные алгоритмы и их эффективность. Обращается внимание на избыточность параллельных алгоритмов и, как следствие, усложнение способа их теоретического анализа на устойчивость и точность. Учитывая, что значительное число сложных задач математической физики решаются на СК разностными методами, рассматриваются теоретические основы метода слабой аппроксимации, сводящего решение сложной задачи к сериям одномерных краевых задач. Заканчивается курс рассмотрением приемов декомпозиции расчетной области и примером регионально-аддитивной разностной схемы для СК. Курс “Технологии параллельного программирования и вычислений” представляет собой введение в программирование на распределенных вычислительных системах. Создание программы для параллельной (многопроцессорной) вычислительной системы включает в себя, как правило, две основных стадии. Во-первых, последовательный алгоритм подвергается декомпозиции (распараллеливанию), т.е. разбивается на независимо работающие подзадачи (ветви параллельного алгоритма), а для обмена информацией между подзадачами (или для взаимодействия между ветвями) вводятся две дополнительных операции – прием и передача данных. Во-вторых, распараллеленный алгоритм записывается в виде программы, в которой операции приема и передачи записываются в терминах конкретной системы программирования, обеспечивающей связи между подзадачами. С точки же зрения программиста существует две основных методологии программирования (парадигмы) –данные могут передаваться через разделяемую память (синхронизация доступа ветвей к такой памяти происходит посредством семафоров) или в виде сообщений. Первый метод является базовым для SMP-машин, второй – для систем с распределенной памятью 1 всех типов. Однако оба эти подхода могут реализованы в виде единого стандарта на интерфейс программиста (или, точнее, на систему обмена информацией между задачами), который обеспечил создание мобильных, эффективных и надежных параллельных приложений. Таким стандартом является MPI. Этот стандарт базируется на идее Т.Хоора о том, что параллельно работающие процессы могут обмениваться информацией только при помощи сообщений. Курс включает краткое изложение теории Т.Хоора о взаимодействующих параллельно работающих процессах и введение в методологию MPI. Выбор дисциплины ”Принципы организации многопроцессорных вычислительных систем и многомашинных комплексов” для включения в учебный план повышения квалификации по направлению "высокопроизводительные вычисления" обусловлен значительным влиянием современных архитектурных решений, реализованных в многопроцессорных вычислительных системах, на способы и эффективность построения программного кода и производительность вычислений. Знание связи причин и принципов параллелизма с архитектурой вычислителя позволяет обеспечить баланс в звеньях последовательности: приложение пользователя – программный параллелизм, доминирующий в приложении, – средства реализации параллелизма в вычислительной системе – архитектура системы. Кроме того, это дает возможность оптимизировать структуру программных комплексов под архитектуру конкретной вычислительной системы и наиболее полно и эффективно использовать все ее средства параллельной обработки. Лекционный курс "Современные методы решения многомерных задач на суперкомпьютерах" предназначен для ознакомления слушателей, повышающих квалификацию, с подходами и способами решения задач механики и физики на многопроцессорной вычислительной технике. В первую очередь внимание слушателей обращается на то, каким образом происходит модификация известных численных методов к условиям используемого суперкомпьютера. При этом предполагается, что слушатели знакомы с основами численных методов, уравнениями математической физики и программированием. В качестве базового материала при подготовке лекций используются оригинальные научные публикации отечественных и зарубежных авторов в рецензируемых журналах. Курс включает обсуждение следующих проблем: – параллельные алгоритмы численного решения задачи Коши для системы ОДУ; – решение систем интегральных уравнений Фредгольма второго рода; – решение уравнения Пуассона с использованием технологии MPI; – параллельные методы в задачах газовой динамики и динамики вязкой жидкости; – применение параллельных методов при моделировании турбулентных течений. Теоретический курс “Принципы организации операционных систем” необходим по нашему мнению в программе повышения квалификации в области высокопроизводительных вычислений для понимания механизмов реализации системообразующих функций и сервисов на прикладном уровне, поскольку разработку параллельных программ вполне можно отнести к классу работ уровня системного программирования. Наиболее трудоемкой фазой в жизненном цикле приложений параллельной обработки является стадия отладки программных комплексов, требующая глубоких знаний механизмов синхронизации взаимодействующих процессов, методов предупреждения тупиков, способов корректного и эффективного использования ресурсов вычислительной системы. Систематизированное изложение основных понятий и принципов функционирования операционных систем составляют основное содержание курса. После прочтения лекций слушателям предлагается самостоятельная работа (4 часа) по программированию на кластере ТГУ в системе MPI простейших задач математической физики. Для активизации интереса молодежи к проблемам суперкомпьютерных технологий 29, 30 марта профессор Малышкин В.Э. (СО РАН) прочитал лекции по программированию на суперкомпьютерах. В это же время в научной библиотеке ТГУ состоялась выставка литературы по суперкомпьютерным технологиям, которую посетило 90 преподавателей и студентов. В дальнейшем для увеличения круга пользователей кластером и повышения качества подготовки специалистов в области СК-технологий планируется ряд мероприятий: – проведение в декабре 2001 года первой сибирской школы-семинара по СК-технологиям; – введение с сентября 2001 года в лекции по методам вычислений раздела по методам параллельных вычислений, а в лекции по информатике раздела по параллельному программированию для физикоматематических факультетов ТГУ; – выделение средств для формирования книжного фонда по СК-технологиям; – организация на базе кафедры вычислительной математики и компьютерного моделирования межфакультетской специализации по параллельным вычислениям с сентября 2001 года; – организация стажировок аспирантов и студентов ТГУ в ИВТ СО РАН (Новосибирск). 2