Оценка сложности коммуникационных операций в кластерных вычислительных системах Гергель А.В Виноградов Р.В. Содержание Проблема оценки сложности коммуникационных операций Модель А Модель В Модель С Результаты вычислительных экспериментов Литература Проблема оценки сложности коммуникационных операций Эффективность параллельных вычислений во многом определяется трудоемкостью коммуникационных операций, выполняемых в В параллельных этой связи программах. важным представляется разработка моделей и методов оценки сложности операций передачи данных в многопроцессорных вычислительных системах. Модель А Проводя анализ существующих методов оценки сложности можно выделить тесты коммуникационных операций, разработанные в НИВЦ МГУ Андреевым А.Н, Воеводиным Вл. В. Эти тесты позволяют оценить экспериментально время подготовки данных для передачи по сети вычислительного кластера (латентность), скорость передачи данных (пропускную способность), а также определить время выполнения основных операций MPI. Модель А Для оценки времени выполнения операции передачи данных Андреевым А.Н, Воеводиным Вл. В предлагается соотношение (модель А): t пд (m) t н m / R (здесь t пд (m) – время передачи данных объема m байт, t н – латентность, R – пропускная способность сети). (1) Преимущества и недостатки модели А преимущества: данная модель позволяет достаточно точно оценить время выполнения операции передачи данных. недостатки: в этой модели не учитывается ряд эффектов, имеющих место при выполнении коммуникационных операций. В частности не учитывается метод передачи пакетов. Модель В Учитывая вышеизложенные обстоятельства, Кумар предложил уточненное выражение (модель B), позволяющее определить время передачи данных между двумя процессорными узлами, длина маршрута между которыми равна : t пд (m) t н m * t k t c * (2) где t k - время передачи одного байта данных через сетевой канал, t c - время передачи служебных данных - длина маршрута, связывающего узлы. Преимущества и недостатки модели В преимущества: данная модель позволяет более точно оценить время выполнения операции передачи данных недостатки: время подготовки данных t н предполагается постоянным (не зависящим от объема передаваемых данных), время передачи служебных данных t c не зависит от количества передаваемых пакетов и т.п. Модель С Предложена новая модель (модель С), в которой время передачи данных между двумя процессорами определяется в соответствии со следующими выражениями: m t к (TCP IP FE) n t к t нач0 m t нач1 , n 1 t пд m t к (TCP IP FE) n t к t нач0 (MTU IP TCP FE) t нач1 , n 1 (3) m n MTU TCP IP FE В приведенных соотношениях TCP есть размер заголовка пакета протокола передачи данных TCP , IP - размер заголовка пакета протокола IP , FE - размер заголовка пакета протокола сети Fast Ethernet, MTU - максимальный размер пакета, который может быть доставлен в сети Fast Ethernet, n- число передаваемых пакетов (размеры всех заголовков должны указываться в байтах). Для иллюстрации ниже приведен результат одного эксперимента, при проведении которого размер передаваемых сообщений изменялся от 0 до 10000 байт с шагом 4 байта. Эксперимент и модели передачи данных Эксперимент Модель В Модель А Модель С 1200 1000 800 600 400 200 9726 9284 8842 8400 7958 7516 7074 6632 6190 5748 5306 4864 4422 3980 3538 3096 2654 2212 1770 1328 886 444 0 2 Время передачи данных в мкс 1400 Размер сообщения Рис. 1. Зависимость экспериментального времени и времени, полученного по моделям A, B, C от объема данных Ниже приводятся ряд числовых данных по погрешности рассмотренных моделей трудоемкости коммуникационных операций Время Погрешность теоретической Объем передачи оценки времени выполнения сообщения данных в операции передачи данных в байтах мкс Модель А Модель B Модель С 32 172,03 -16,36% -12,45% 3,55% 64 172,22 -17,83% -13,93% 0,53% 128 173,15 -20,39% -16,50% -5,15% 256 203,79 -7,70% -4,40% 0,09% 512 242,68 0,46% 3,23% -1,63% 1024 334,44 14,57% 16,58% 0,50% 2048 481,54 22,33% 23,73% 5,05% 4096 770,62 28,55% 29,42% 18,13% Результаты работы - проведен анализ существующих методов оценки сложности коммуникационных операций; - разработана новая модель оценки сложности операций передачи данных; - проведены вычислительные эксперименты для проверки соответствия рассмотренных моделей реальным процессам передачи данных в сети многопроцессорного кластера. Литература 1.Group W., Lusk E., Skjellum A. Using MPI. Portable Parallel Programming with the Message-Passing Interface. MIT Press, 1994. 2.Андреев А.Н., Воеводин Вл.В. Методика измерения основных характеристик программно-аппаратной среды. (www.dvo.ru/bbc/benchmarks.html) 3. Kumar V., Grama A., Gupta A., Karypis G. Introduction to Parallel Computing.- The benjamin/Cummings Publishing Company, Inc., 1994. 4. Гергель В.П., Стронгин Р.Г., Основы параллельных вычислений для многопроцессорных вычислительных систем. Н.Новгород: Изд-во ННГУ, 2001 Спасибо за внимание