ПРИНЦИПЫ ПОСТРОЕНИЯ АДАПТИВНОГО ПРОГРАММНОГО АНАЛИЗАТОРА ДЛЯ ДИАГНОСТИКИ СОСТОЯНИЯ ТРАСС ПЕРЕДАЧИ ДЕЙТАГРАММ В IP-СЕТЯХ А.Ю.Глебовский Санкт-Петербургский государственный технический университет, Санкт-Петербург Тел.: (812) 247-22-23, e-mail: [email protected] Постановка проблемы Успех вуза на рынке образовательных услуг и в научных программах с внешним финансированием в возрастающей степени зависит от уровня развития его информационных технологий. Оборотная сторона медали – пропорционально растущая зависимость от надежности и качества услуг провайдеров: по мере того, как все большая часть сферы деятельности вуза и его подразделений опирается на сеть кампуса и Интернет, отказы в сети приводят к все большим потерям, а подчас и к необратимым последствиям (срыв работы конференций, нарушение договорных обязательств и т.п.). Сказанное распространяется и на научноисследовательские институты. Таким образом, повышение надежности и качества обслуживания в академсетях становится все более актуальной задачей. В докладе обсуждается один ее аспект – специализированные программные средства поддержки администрирования сетевого узла вуза. При этом выделяется частная проблема автоматического тестирования и комплексной диагностики состояния внешних для данной сети трасс пакетов в целях оперативного извещения об аварийных ситуациях, обнаружения и регистрации сбоев и периодов ухудшения качества обслуживания. Анализ данных позволит получать объективную информацию для оценки качества телекоммуникационного сервиса за период наблюдения с возможным последующим урегулированием возникших проблем с провайдерами. Содержание доклада Дается обзор имеющихся программных систем и утилит тестирования маршрутов, как лицензионных, так и свободно распространяемых, с оценкой их достоинств и ограничений. Предлагается адаптивный метод решения задачи мониторинга трасс дейтаграмм путем периодического зондирования IP-сетей сетей тестовыми пакетами с целью сбора, накопления, обработки и интерпретации данных о потерях дейтаграмм, флуктуациях RTT, изменениях трасс, аномальных трассах, заторах, некорректном функционировании маршрутизаторов на удаленных узлах и других измеряемых параметрах и наблюдаемых событиях, позволяющих осуществлять постоянную комплексную диагностику состояния внешних трасс. Лицензионные средства сетевого администрирования Надежность корпоративных сетей за рубежом уже достигает уровня "5 девяток" (99.999% времени бесперебойной работы), то есть суммарные перерывы в работе сети не превышают 30 с в месяц. Тем не менее, в 1999 году убытки из-за сетевых проблем в США составили в среднем $3.9 млн. в расчете на одно предприятие. Причина не столько в отказах (black-outs), сколько в более частых периодах ухудшения качества услуг (brownouts): случаи отказов в сервисах основных провайдеров, повлекшие массовые убытки форм-клиентов, были единичными. Соответственно, задаче совершенствования технологий сетевого менеджмента уделяется возрастающее внимание. Крупнейшие производители аппаратного и программного сетевого обеспечения предлагают мощные (и весьма дорогостоящие) постоянно совершенствуемые комплексные средства поддержки менеджмента для корпоративных сетей (большей частью ориентированные на применение совместно с ими же поставляемыми оборудованием и системами), такие как: CiscoWorks (Cisco Systems), OmniView (Nortel Networks), Transcend Site Manager (3Com), ManageWise (Novell), Spectrum (Cabletron), OpenView (HP), HubWatch (DEC), NetXRay (Cinconet). Общедоступные средства Стандартные системные средства сетевых OC, свободно распространяемые утилиты сетевого тестирования и менеджерирования достаточно разнообразны. В частности, к ним можно отнести следующие: – средства операционных систем: команды конфигурирования и проверки состояния сетевых интерфейсов, маршрутных таблиц (netstat, ifconfig и др.); – универсальные анализаторы протоколов: tcpdump и подобные; – программы сбора статистики о трафике: mrtg и др.; – отладочные утилиты: sock и подобные (socket, sokio и др.); – утилиты тестирования удаленных хостов и маршрутов к ним: ttcp (оценка характеристик соединения между двумя хостами), bing (косвенная оценка пропускной способности на заданном участке трассы), разновидности ping и traceroute (такие как neotrace для Windows), различающиеся составом опций (таких как LSR, SSR), ассортиментом измеряемых параметров трассы (RTT, потери, географическая привязка трассы в продуктах типа geoboy от NDG software) и способами отображения и использования данных тестирования (текстовый или графический интерфейс, наличие или отсутствие функции alarm); – удаленные сервисы трассировки (например, на сайте www.netsys.com). Адаптивный метод мониторинга трасс Большинство разнообразных средств трассировки маршрутов в сетях IPv4 с измерением RTT и процента потерь дейтаграмм основано на принципах, изначально реализованных в классических утилитах ping (M.Muuss) и traceroute (V.Jacobson). Опираясь на опыт создателей этих утилит и их последователей, можно обобщить идеи разностороннего тестирования в одном автономном анализаторе трасс, использующим адаптивную методику автоматического зондирования пакетами переменного типа и размера (с первоначальным замером path MTU для каждого из тестирумых маршрутов). Источниками информации для выявления сбоев, аномальных событий и потенциальных проблем на удаленных узлах маршрутизации пакетов могут служить: – пакеты, регистрируемые в режиме перехвата транзитных кадров, такие как icmp-сообщения об ошибках (host/network unreachable, time exceeded, redirect, fragmentation error); – отклики на собственные зондирующие пакеты и icmp-запросы (echo, port/host/network unreachable, time exceeded, timestamp, router advertisment). Рабочий цикл анализатора может протекать в одном из двух режимах работы: – пассивный режим работы включает фазы: инициация, перехват фильтруемых пакетов, обработка (анализ), генерация отчетов и экстренная сигнализация; – активный режим работы включает фазы: инициация, тестирование некоторой трассы (генерация и отсылка зондирующих пакетов, прием и накопление откликов), обработка результатов (анализ), генерация отчетов и экстренная сигнализация. Адаптивность трассировки в широком смысле означает, что рабочий цикл может выполняться с переменным периодом и различным образом в зависимости от ситуации, зафиксированной в предыдущем цикле. В узком смысле адаптивность алгоритмов анализатора предполагает зависимость действий, предпринимаемых на каждой из фаз, от результатов предыдущего шага (в активном режиме это означает, что тип и размер генерируемого зондирующего пакета, запись в поля IP-заголовка и установка IP-опций выполняются с учетом отклика на предыдущий).