Pavsky_tesis (Novosibirsk 2011)

advertisement
ОЦЕНКА ФУНКЦИИ РАСПРЕДЕЛЕНИЯ ВРЕМЕНИ ЭФФЕКТИВНОГО
ФУНКЦИОНИРОВАНИЯ БОЛЬШЕМАСШТАБНЫХ РАСПРЕДЕЛЕННЫХ
ВЫЧИСЛИТЕЛЬНЫХ СИСТЕМ*
Павский В.А.1, Павский К.В.2
1
Кемеровский технологический институт пищевой промышленности, Кемерово
2
Учреждение Российской академии наук Институт физики полупроводников им. А.В.
Ржанова Сибирского отделения РАН, Новосибирск
TIME DISTRIBUTION FUNCTION ESTIMATION OF EFFECTIVE
FUNCTIONING LARGE-SCALE DISTRIBUTED COMPUTER SYSTEMS
V.A. Pavsky1, K.V. Pavsky2
1
Technological Institute of the Food Industry, Kemerovo, Russia
2
A.V. Rzhanov Institute of Semiconductor Physics of Siberian Branch of the RAS, Novosibirsk,
Russia
Mathematical model allowing to calculate robustness indices of large-scale distributed computer systems (CS) with
structural redundancy is offered. Estimation of time distribution function of effective functioning CS is received.
Введение
Для вычислительных систем (ВС), состоящих из десятков и сотен тысяч элементарных
машин (ЭМ), понятие надежности приобретает качественно другой смысл, а понятие отказа,
если и употребляется, то в смысле недостаточной производительности, поскольку системы,
имеющие такой огромный вычислительный ресурс (число ЭМ), просто не должны отказать.
Поэтому вполне разумно говорить о высокой производительности ВС или низкой в
зависимости от объема рабочего ресурса 1. Это расширяет возможности анализа
эффективности функционирования ВС. В самом деле, при оценке работы одной ЭМ или ВС с
небольшим ресурсом, мы исследуем процесс функционирования машины или системы
только до отказа. Для больших ВС, которые не отказывают, исследование можно проводить
для систем, которые находятся как в состоянии высокой производительности (эффективного
функционирования), так и в состоянии низкой. Если удается оценить функционирование
системы с одной стороны, то оценка другой может быть получена переходом к
противоположному состоянию.
Математическая модель.
Имеется ВС, состоящая из N ЭМ, n из которых составляют структурную избыточность,
а N-n -основную подсистему. Время работы каждой ЭМ является случайной величиной
подчиненной экспоненциальному закону с параметром  - интенсивностью выхода ЭМ из
строя. Вышедшая из строя ЭМ основной подсистемы мгновенно заменяется на ЭМ из
структурной избыточности, а сама попадает в восстанавливающую систему (ВУ). Если для
очередной отказавшей ЭМ основной подсистемы замены нет, то ВС переходит из состояния
высокой производительности в низкую. Время восстановления ЭМ находящихся в ВУ
является случайной величиной, подчиненной экспоненциальному закону с параметром  интенсивностью восстановления. Предполагается, что, независимо от числа ЭМ,
находящихся в ВУ, среднее время восстановления t cp  1 / μ . Предположим также, что
функционирование ВС происходит достаточно длительное время. Это позволяет нам
считать, что поток отказов ЭМ - пуассоновкий с параметром равным  N  λ 2.
Требуется вычислить Pk (t ) - вероятность того, что в момент времени t, t  [0, ) , в
состоянии отказа находится k ЭМ, k  0,1,..., n .
Работа выполнена при поддержке РФФИ (грант №09-07-00185) и Совета по грантам Президента РФ (грант №
НШ-5176.2010.9).
*)
Система дифференциальных уравнений для вероятностей Pk (t ) эквивалентна системе,
полученной в работе [3], и имеет вид:
n
 '
 P0 (t )   N  λ  P0 (t )  μ  k1Pk (t ),
 '
(1)
 Pk (t )  ( N  λ  μ)  Pk (t )  μ  Pk 1 (t ),k  1,2,..., n  1,
 '
 Pn (t )   μ  Pn (t )  N  λ  P1 (t ),

с начальными условиями P0 (0)  1 , Pk (0)  0 и условием нормировки
n
 Pk (t )  1 , t  [0, ) .
k 0
Общее решение системы (1) приведено в работе [3].
Если ВС функционирует достаточно долго, то для вероятностей Pk (t ) достаточно иметь
решение для случая когда t   ,
pk  lim Pk (t ) ,
t 
которое имеет вид
n
 Nλ 
μ  ( N  λ) k
μ
 .
p0 
, pk 
, p n  
(2)
k 1
Nλ μ
( N  λ  μ)
Nλ μ
Учитывая (2) и формулировку модели, вероятность нахождения ВС в состоянии низкой
производительности
n
Зададим вероятность
производительности, тогда

 Nλ 
 .
p н  
 μ N λ
того, что ВС находится
в
состоянии
высокой
n
Логарифмируя (3) и полагая k cp
где k cp
 Nλ 
 .
1  γ  
 μ N λ
 n  1 , находим
(3)


ln( 1  γ)
k cp  
 1,
ln
N
λ

ln(
N

λ

μ
)


- среднее число ЭМ, составляющих структурную избыточность.
Зависимость среднего числа n  k cp  1 ЭМ структурной избыточности от числа ЭМ в
ВС при 1  γ 0,05 , N  10 4 ,10 5 , μ  1 1/ч, λ  10 4 , 10 4 1/ч представлена в табл. 1
Таблица 1. Зависимость среднего числа ЭМ структурной избыточности от числа ЭМ в системе.
N

2  10 4
10
4
10 4
10 5
8
5
62
32
Из таблицы следует, что при числе ЭМ в ВС близких к 105 структурная избыточность
не превышает 0,15% от общего числа ЭМ в ВС, находящихся в состоянии высокой
производительности.
Перейдем к нахождению оценки функции распределения F (τ ) - вероятности того, что
ВС выйдет из состояния высокой производительности (эффективного функционирования) в
течение времени  при условии, что режим функционирования стационарный. Предположим,
что за время , τ  [0, ) , в ВС число отказов ЭМ не более чем число ЭМ в системе.
Пусть ВС функционирует достаточно долго, тогда вероятность ее нахождения в любом
из состояний в любой момент времени постоянна и совпадает с начальными условиями, а
вероятность того, что за время  в ВС откажет k ЭМ
(a( τ ) / τ ) k a ( τ )
Vk ( τ ) 
e
,
k!
где a( τ )  N  (1  exp(  λ  τ )) - среднее число отказавших ЭМ за время , τ  [0, ) (заметим,
что при τ  0 , получаем суммарную интенсивность отказов a (0)  N  λ ). Учитывая (3), для
вероятности Pн (τ ) того, что ВС будет находится в течение времени  в состоянии низкой
производительности, получаем
n
 a( τ ) 
 .
Pн ( τ )  
 μ  τ  a( τ ) 
Тогда функция F (τ ) распределения времени эффективного функционирования ВС
запишется в виде
n

μNλ
N  (1  e  λτ ) 
 ,
(4)
F ( τ )  1 
 λτ 
N

λ
μ

τ

N

(
1

e
)


где N  λ /( μ  N  λ) - вероятность в любой момент времени застать ВС в состоянии низкой
производительности, при условии, что режим работы стационарный.
Учитывая, что F (τ ) - монотонно возрастающая, F (0)  0 , F ()  1 , то заключаем, что
(4), в самом деле, можно рассматривать как оценку функции распределения 1 времени
эффективного функционирования ВС до выхода в состояние низкой производительности.
На рис. 1 представлены зависимости функции F (τ ) от времени  при μ  1 1/ч и
данных табл. 1.
F()
1
F()1
0,8
0,8
0,6
0,6
0,4
0,4
0,2
0,2
0
0
1 2
3 4
5
6 7
1
8
9 10 11 12 13
2
4
, 10 час
а)
0
0
1
2
3
4
5
3
6
7
8
4
9 10 11 12 13
, 104 час
б)
Рис. 1. Зависимость функции распределения времени эффективного функционирования ВС F ( ) от времени 
при   1 1/ч а)
  10 4 ;
б)
  2  10 4 :
1 –
N  10 4 , n  5 ; 2 – N  10 5 , n  32 ; 3 – N  10 4 ,
n  8 ; 4 – N  105 , n  62
Из рисунков видно, что - для ВС состоящих из числа ЭМ близких к 105 , при среднем
времени работы ЭМ не менее 1/ λ  10 4 ч, времени восстановления 1 / μ  1 ч, числе ЭМ
структурной избыточности не превосходящего 0,062% (см табл. 1) - промежуток времени
эффективного функционирования системы, с вероятностью не менее 0,98, будет не менее
чем 2 10 4 часов.
Из сравнения рисунков с таблицей (в которой расчеты проведены для стационарного
режима моментного состояния ВС) следует, что результаты практически совпадают для
промежутка времени до 2,5  10 4 ч, а далее различие становится существенным. Этот факт
демонстрирует эффективность использования показателей надежности полученных для
промежутка времени. С другой стороны, для сложных задач, время решения которых не
годы, а месяцы, расчеты для момента времени более эффективны в силу простоты
вычислений.
Заключение
Рассчитаны показатели живучести для многомашинных ВС. Получена оценка функции
распределения времени эффективного функционирования до выхода системы в состояние
низкой производительности. Установлено, что при одинаковых начальных условиях
(исследуется стационарный режим работы системы), анализ функционирования ВС на
промежутке времени дает более надежные результаты, чем анализ ее состояния в момент
времени.
Список литературы
1.
Хорошевский В.Г. Архитектура вычислительных систем: Учеб. пособие. для вузов. – 2е изд. – М.: Изд-во МГТУ им. Баумана, 2008. – 520 с.
2.
Клейнрок Л. Теория массового обслуживания. М.: Машиностроение, 1979. – 432 с.
3.
Павский В.А. Павский К.В. Оценка показателей осуществимости решения задач на
распределенных вычислительных системах// Вестник компьютерных и информационных
технологий. – 2008. - №4. – С. 61 – 68.
Download