БИОИНФОРМАТИКА Биоинформатика (биологическая информатика) - наука, изучающая общие закономерности и особенности реализации информационных процессов в биосфере, организации и функционирования биологических систем разного уровня (от молекулярного до популяционного) на основе методов и средств информатики. Решение научных проблем биоинформатики имеет как фундаментальное, так и прикладное значение. На практике, иногда это определение более узкое, под ним понимают использование компьютеров для характеризации молекулярных компонентов. Вместе с тем паспорт специальности 03.00.28 Биоинформатика, впервые введенной в 2002 году, так определяет область исследования: 1. Исследование эволюции живой природы с помощью средств информатики и математики. 2. Компьютерное и математическое моделирование информационных процессов в биологических системах. 3. Компьютерная генетика: расшифровка и моделирование структурной организации генов и геномов, а также кодируемых генами белков; корреляционный анализ мутаций и др. 4. Компьютерная нейробиология: моделирование природных нейронных систем, разработка и приложение нейросетей и др. 5. Исследование экологических систем с помощью информационных технологий. 6. Компьютерное моделирование биологического действия ксенобиотиков. 7. Компьютерное моделирование процессов получения, накопления, обработки и систематизации биологических данных. 8. Компьютерное распознавание и синтез изображений биологических объектов. 2 9. Создание новых информационных технологий на основе результатов исследований живой природы. 10. Организация, ведение и использование автоматизированных банков данных по биологии и медицине, в т.ч. банков междисциплинарных данных. 11. Разработка интеллектуальных систем анализа и прогнозирования свойств биологических объектов на основе специализированных баз и банков данных. 12. Создание систем информационного обеспечения и поддержки биологических и медицинских исследований, включая анализ точек роста и тенденций развития научных направлений. Когда же появилась биоинформатика, наука, которую сейчас с уверенностью называют наукой третьего тысячелетия? Можно считать, что эта наука зародилась в XIII веке. Тогда молодой итальянец Леонардо из Пизы, вошедший в историю математики под именем Фибоначчи, описал решение задачи о размножении кроликов и, таким образом, построил первую математическую модель биологического процесса. По сути, этот любопытный случай и положил начало математической биологии. В 20-е годы XX века другой итальянский математик, Вито Вольтерра, создал модель совместного существования двух биологических популяций типа "хищник-жертва". У математиков появился интерес к теоретической биологии, а у биологов, в свою очередь, возникла потребность к систематизации науки с математических позиций. После Второй мировой войны в биологию пришли физики и математики. Это событие во многом индуцировал Шредингер выходом в свет своей книги "Что такое жизнь с точки зрения физики?". Среди них были такие знаменитые ученые, как Алексей Андреевич Ляпунов и Игорь Андреевич Полетаев. Благодаря их научным работам начал развиваться кибернетический подход к биологическим процессам. Вадим Александрович Ратнер, ученик Ляпунова, в начале 1960-х годов применил математический подход к описанию явлений молекулярного уровня в сложных системах. 3 В 1975 году была создана первая известная количественная модель управления развитием фага "лямбда". Его геном содержит 48 генов (совсем немного по нынешним меркам), но имеет сложную управляющую систему. Эта и более сложные системы уже требовали использования компьютеров. Из математической биологии стала выделяться отдельная ветвь - биоинформатика, которая предполагает применение информационных технологий для изучения биологических систем. Современная биоинформатика появилась на стыке наук - биологии, физиологии, математики, информатики, физики и химии, а такого рода объединения имеют стратегический характер. Самые крупные достижения возникают тогда, когда происходит синтез наук. Биология и информатика - классическое отражение этой ситуации. В настоящее время одной из основных задач биоинформатики является разработка вычислительных алгоритмов для анализа и систематизации данных о структуре и функциях биологических молекул, прежде всего нуклеиновых кислот и белков. Объем генетической информации, накапливаемой в банках данных, начал увеличиваться с возрастающей скоростью после того, как были разработаны быстрые методы секвенирования (расшифровки нуклеотидных последовательностей ДНК). Биоинформатические методы позволяют не просто обрабатывать этот огромный массив данных, но и выявлять закономерности, которые не всегда можно заметить при обычном эксперименте, предсказывать функции генов и зашифрованных в них белков, строить модели взаимодействия генов в клетке, конструировать лекарства. Основная линия в проектах биоинформатики - это использование математических средств для извлечения полезной информации из шумных данных, полученных с помощью биологичеких методов. Конечно, основой всего является геном: только зная все гены организма, можно делать надежные выводы. Массовые данные получаются из экспериментов, поставленных на индустриальный поток: это расшифровка геномов, изучение синтеза закодированных в генах белков, определение белок- 4 белковых взаимодействий в различных организмах, клетках, условиях роста. Раньше для получения такого рода данных ставились специальные эксперименты. Но у средней бактерии примерно 3000 генов, у человека - на порядок больше - 30 000, белков еще больше - сколько же надо провести экспериментов, например, для того, чтобы проверить все пары белков, взаимодействуют ли они. При этом основные ресурсы уйдут на "пустые" эксперименты, с невзаимодействующими белками. Массовый эксперимент - это сотня экспериментов одновременно, которые выполняют несколько десятков роботов. Однако при этом возникает высокий уровень "шума" - случайных ошибок. Получить на основе этих данных достоверные утверждения является одной из важнейших задач биоинформатики. То же самое с функциями генов. В принципе, выяснение функции одного гена в эксперименте - это год работы сильного исследователя. Но генов тысячи в каждом организме. В этом случае, оказывается, что биоинформатика позволяет делать надежные предположения, которые поддаются уже целенаправленной экспериментальной проверке, т.е. работы осуществляются с существенно меньшими затратами ресурсов, в том числе и времени. В конечном счете, возникает совершенно новое мощное средство для биологических исследований. Также среди основных задач биоинформатики - описание генных сетей, изобретение новых лекарств с заданными свойствами, разработка компьютерных моделей процессов, происходящих в организме. Все слышали про мыло Safeguard, которое «убивает микробы». Оказалось, что есть весьма опасные стрептококки, не чувствительные к его действующему началу — триклозану. Сначала это было показано с помощью компьютерного анализа геномов стрептококков, а потом подтверждено экспериментально. Еще пример — анализ генетических данных людей здоровых и с какимлибо заболеванием, например ишемической болезнью сердца. Нет одного гена, ответственного за эту болезнь. Однако сопоставление данных по большо- 5 му количеству больных позволило найти так называемые ассоциации — набор генов предрасположенности к указанной болезни, и тем самым дает возможность определить генетическую группу риска. Биоинформатика - наука, которая позволяет получать новые знания об организации и функционирования биологических систем разного уровня, не наблюдая непосредственно природу (как, например, в зоологии) и не ставя эксперименты (как в молекулярной биологии), а путем анализа гигантского количества экспериментальных данных на основе методов и средств информатики. Литература: 1. Афанасьева Г. Биоинформатика: виртуальный эксперимент в шаге от реальности. // Наука и жизнь. – 2004. – № 11. http://www.nkj.ru/archive/articles/310/ 2. Гельфанд М. Биология in silico // КомпьюТерра - 21.09.2001. [email protected]. 3. Макаров А.А. Профессия — биоинформатик. http://bio.1september.ru/articlef.php?id=200500108. 4. Орлов Ю.Л. Биоинформатика - наука третьего тысячелетия // Информационный вестник ВОГиС. – 2003. – № 21-22. http://www.bionet.nsc.ru/vogis/vestnik.php?f=2003&p=2122_2 5. Паспорт специальности 03.00.28 Биоинформатика. http://www.originweb.info/science/codes/03/030028.html. Берёзин Алексей Анатольевич, Группа З-04-33 Российская академия государственной службы при Президенте Российской Федерации