Международная научно-учебная лаборатория Интеллектуальных систем и структурного анализа Факультет компьютерных наук, Департамент анализа данных и искусственного интеллекта Описание и план развития на 2015-2016 годы Заведующий лабораторией д.ф.-м.н. С.О. Кузнецов Докладчик, старший научный сотрудник к.т.н., доцент А.А. Незнанов Высшая школа экономики, Москва, 2015 www.hse.ru Общие данные о лаборатории Что, где, когда? • Сокращённое название – МНУЛ ИССА • НУЛ ИССА создана в сентябре 2012 года и является структурным подразделением департамента анализа данных и искусственного фото интеллекта факультета компьютерных наук НИУ ВШЭ • В 2015 году получила статус международной • Контактная информация • Сайт: http://cs.hse.ru/ai/issa • Заведующий лабораторией д.ф.-м.н. С.О. Кузнецов, тел.: +7(495)772-95-90 * 22670, e-mail: [email protected] • Менеджер лаборатории Л.И. Антропова, тел.: +7(495)772-95-90 * 22668, e-mail: [email protected] • Адрес: Москва, Кочновский проезд, 3. фото Высшая школа экономики, Москва, 2015 2 Штатное расписание МНУЛ ИССА на 2015-2016 годы № Должность Ставки 1 Стажер-исследователь 2 Младший научный сотрудник 4 3 Менеджер 1 4 Научный сотрудник 3 5 Старший научный сотрудник 2 6 Ведущий научный сотрудник 1 7 Заведующий лабораторией 10 фото фото 0,5 Высшая школа экономики, Москва, 2015 3 Ведущий научный сотрудник • Андре Щедров, PhD • Chair of the Mathematics Department, Professor of Mathematics, Professor of Computer and Information Science, University of Pennsylvania фото • Интересы: • • • • Вычислительная логика Информационная безопасность Криптография и криптографические протоколы Коллаборативные технологии фото Высшая школа экономики, Москва, 2015 4 Основные сотрудники Кузнецов Сергей Олегович, д.ф.-м.н. Руководитель лаборатории (0,5 ставки) фото Незнанов Алексей Андреевич, к.т.н., доцент Старший научный сотрудник (0,5 ставки) Игнатов Дмитрий Игоревич, к.т.н. Научный сотрудник (0,5 ставки) Объедков Сергей Александрович, к.т.н. Научный сотрудник (0,5 ставки) фото Высшая школа экономики, Москва, 2015 5 Привлекаемые сотрудники на 01.07.2015 Макс Канович, Professor of Computer Science, University College London (http://www.eecs.qmul.ac.uk/~mik) Старший научный сотрудник (0,5 ставки) фото Леонид Либкин, Professor, School of Informatics, Laboratory for Foundations of Computer Science, University of Edinburgh (http://homepages.inf.ed.ac.uk/libkin) Старший научный сотрудник (0,5 ставки) 3 м.н.с.: А.А. Паринов(1), Ю.А. Кашницкий (1), Д.А. Ильвовский (0,5) 4 стажёра-исследователя 5 лаборантов (вне основного штатного расписания) фото Высшая школа экономики, Москва, 2015 6 Область интересов Почему мы так называемся? • Напомним: интеллектуальных систем и структурного анализа! • Все информационные системы становятся всё более «интеллектуальными» фото • Всё в большем числе приложений приходится работать со сложно структурированными данными, представленными в виде графов и сетей • Отметим: одним из важнейших аспектов интеллектуализации является «анализ данных», который стал «интеллектуальным» (ИАД) • Он не сводится к статистике и информационному поиску! • ИАД – это в первую очередь специальная подготовка данных, онтологическое моделирование, извлечение знаний и т.д. • В основе лежат различные логики (модальная, дескриптивная, …) и фото методы представления знаний Высшая школа экономики, Москва, 2015 7 Социальные сети, как объект исследования социологов, и как Интернет-службы фото фото © slate.com © yworks.com Высшая школа экономики, Москва, 2015 8 Структурные модели текстов в виде деревьев и более сложных структур • Чаща разбора (Parse Thicket) • С. Кузнецов, Б. Галицкий фото фото Высшая школа экономики, Москва, 2015 9 Решётки формальных понятий для интерактивного анализа предметных областей фото фото © Д.И. Игнатов Высшая школа экономики, Москва, 2015 10 Направления исследований Что нам интересно? Машины вполне обучаемы, но у них нет сердца • • • • • • • • • • Data Mining, Knowledge Discovery, and Machine Learning (Майнинг данных, обнаружение знаний и машинное обучение) фото Computational Logic (Вычислительная логика) Formal Concept Analysis (Анализ формальных понятий) Knowledge Bases and Applied Ontology Modelling (Базы знаний и онтологическое моделирование) Multimodal Clustering (Мультимодальная кластеризация) Structural Analysis and Applied Graph Theory (Структурный анализ и прикладная теория графов) Natural Language Processing (Автоматическая обработка текста) Recommender Systems and Collaborative Technologies (Рекомендательные системы и коллаборативные технологии) Social Network Analysis (Анализ социальных сетей) фото Big Data Analysis (Обработка больших данных) Высшая школа экономики, Москва, 2015 11 Основные научные проекты Чем конкретно мы занимаемся? • Развитие анализа формальных понятий и его приложений при построении интеллектуальных систем • Развитие методов и алгоритмов мультимодальной кластеризации фото • Развитие методов обработки больших коллекций неструктурированных текстов (в том числе – под управлением онтологий) • Создание интегрированной среды научных исследований в области анализа формальных понятий и смежных областей – Formal Concept Analysis Research Toolbox (FCART) • Проекты по созданию прикладных программных средств анализа неструктурированных данных (например, коллекций текстов на естественном языке), рекомендательных систем, систем обработки структурной информации в областях здравоохранения, фото правоохранения и др. Высшая школа экономики, Москва, 2015 12 Анализ формальных понятий Появление Formal Concept Analysis • Термин «Анализ Формальных Понятий (АФП)» [Formal Concept Analysis (FCA)] был предложен Рудольфом Вилле [Rudolf Wille], который начал работу над своим исследованием «restructuring lattice theory» в конце 1970-х годов в Техническом университете фото Дармштадта • АФП уходит корнями в работы, посвящённые связям Галуа и решеткам замкнутых множеств (G. Birkhoff, O. Ore и др.), и ранние работы о приложениях теории решёток к задачам информатики (M. Barbut, B. Monjardet и др.) • На ранних этапах развития АФП зачастую неверно воспринимался как ещё один тяжело масштабируемый формализм для работы с таблицами из нулей и единиц • После работ группы профессора Б. Гантера из Дрезденского политехнического университета, С.О. Кузнецова и многих других исследователей стала понятна актуальность АФП при решении задач обработки больших объёмов сложных динамических фото данных, связанных с некоторыми дополнительными знаниями (онтологиями) Высшая школа экономики, Москва, 2015 13 Анализ формальных понятий Достижения и приложения • Развитие теоретических основ и инструментария узорных структур [Pattern Structures] • Развитие понятия устойчивости формальных понятий фото [Stability of a Formal Concepts] • Применение аппарата АФП в приложениях здравоохранения, криминалистики, анализа социальных сетей и др. фото Высшая школа экономики, Москва, 2015 14 Анализ формальных понятий Достижения и приложения фото фото Высшая школа экономики, Москва, 2015 15 Formal Concept Analysis Research Toolbox (FCART) External Data Source External Data Set External Data Query Description LDS Import/Export Tools Local Data Storage JSON Collection Snapshot Profile FCART Import/Export Tools Session DB Data Snapshot (Multivalued Context) Scaling Query + Graph Generators Analytic Artifacts Pattern Structure фото Binary Context Clusters SOMs Concept Lattice фото Высшая школа экономики, Москва, 2015 16 Зарубежные партнёры С кем мы активно сотрудничаем? Всегда есть мороженое одному невкусно ни мне, ни тебе, никому. Александр Вратарев • • • • • • • • • • Lorraine Research Laboratory in Computer Science and its Applications фото (LORIA Nancy, France) Institut Supérieur d’Informatique, de Modélisation et de leurs Applications (L’ISIMA Clermont-Ferrand, France) Institut National des Sciences Appliquées (INSA LYON, France) Technische Universität Dresden (TU Dresden, Germany) Katholieke Universiteit Leuven (KU Leuven, Belgium) Eindhoven University of Technology (TU/e, Eindhoven, Netherlands) Palacky Univeristy (Olomouc, Czech Republic) Université de Caen (Caen, France) Université du Québec en Outaouais (Gatineau, Canada) Infobright Company (Toronto, Canada) фото Высшая школа экономики, Москва, 2015 17 Российские партнёры С кем мы активно сотрудничаем? Всегда есть мороженое одному невкусно ни мне, ни тебе, никому. Александр Вратарев • • • • • • Институт Проблем Передачи Информации РАН им. А.А. Харкевича фото Институт Системного Анализа РАН ФНКЦ Детской гематологии, онкологии и иммунологии им. Д. Рогачева Компании ImhoNet, Avicomp, АлгоМост и др. Фонд Сколково Лаборатория Цифрового Общества • Партнёры из НИУ ВШЭ • Лаборатория методов анализа больших данных • Факультет математики, факультет филологии, департамент психологии, департамент программной инженерии, кафедра публичной политики и др. фото Высшая школа экономики, Москва, 2015 18 Поддержка магистерской программы «Науки о данных» (Data Science) Специализации программы направлены на подготовку магистров в различных областях прикладной математики и информатики: • Интеллектуальные системы (основная специализация МНУЛ) фото • Анализ Интернет-данных • Технологии моделирования сложных систем • Дисциплины, читаемые сотрудниками лаборатории: • • • • • • • • Научно-исследовательский семинар Упорядоченные множества в анализе данных Неклассические логики Методы машинного обучения и разработки данных Machine Learning and Data Mining Проектирование взаимодействия с пользователем Распределённые системы Программирование (адаптационная дисциплина) фото Высшая школа экономики, Москва, 2015 19 Поддержка бакалаврской программы «Прикладная математика и информатика» • Дисциплины, читаемые сотрудниками лаборатории: • • • • • • • Научный семинар «Интеллектуальные системы» Дискретная математика Теория баз данных фото Модели вычислений и вычислительная сложность Методы майнинга данных Архитектура компьютеров и системное программирование Представление знаний • Прохождение производственной и преддипломной практики фото Высшая школа экономики, Москва, 2015 20 Публикационная активность • За 3 года существования лаборатории её сотрудниками опубликовано более 90 работ по проектам, ведущимся в НУЛ • http://cs.hse.ru/ai/issa/publications фото • Большинство работ опубликовано на английском языке издательствами Springer и Elsevier • Сергей Олегович Кузнецов и Дмитрий Игоревич Игнатов стали одними из самых публикуемых и цитируемых сотрудников НИУ ВШЭ • Сергей Александрович Объедков в 2013 году стал победителем Scopus Award Russia за выдающийся вклад в развитие компьютерных наук на национальном и международном уровнях • Наш новый ведущий специалист Андре Щедров – один из наиболее публикуемых и цитируемых авторов в области вычислительной логики фото Высшая школа экономики, Москва, 2015 21 Периодический семинар лаборатории Периодический научный семинар лаборатории вот уже третий год проходит по четвергам в 16:40 как минимум каждые 2 недели фото • За 2013-2015 годы проведено более 50 заседаний • Докладчиками были как крупные российские и зарубежные учёные (Steffen Hoelldobler, TU Dresden (Germany), Jean-Francois Boulicaut, INSA Lyon (France), Alessandro Moschitti, University of Trento (Italy), Dominik Slezak, University of Warsaw & Infobright Inc. (Poland), Boris Gutkin, Ecole Normale Supérieure (France), Tomasz Kociumaka, Warsaw university (Poland), Andre Scedrov, University of Pennsylvania (USA), Пьяных О.С., Harvard Medical School (USA), Laurent Bienvenu, Laboratoire J-V. Poncelet (France), Аржанцев И.В., НИУ ВШЭ, Осипов Г.С., ИСА РАН, Жуков Л.Е., НИУ ВШЭ и многие др.) так и молодые специалисты (студенты и аспиранты) фото Высшая школа экономики, Москва, 2015 22 Серии международных семинаров «What can FCA do for … ?» C 2012 года лаборатория организует семинар • Workshop “What can FCA do for Artificial Intelligence?” (FCA4AI) • Годы: 2012, 2013, 2014, … фото • Руководители: • • • Sergei Kuznetsov, Higher Schools of Economics, Moscow, Russia Amedeo Napoli, LORIA-INRIA, Vandoeuvre les Nancy, France Sebastian Rudolph, Technische Universitaet Dresden, Germany + Другие семинары “What can FCA do … ?” фото Высшая школа экономики, Москва, 2015 23 Организация научных мероприятий (2013 г.) • 10.01.2013 – 20th International Conference on Conceptual Structures (ICCS 2013) – http://iccs2013.hbcse.tifr.res.in • 24.03.2013 – International Workshop “Formal Concept Analysis meets Information Retrieval” (FCAIR) в рамках ECIR 2013 – http://fcair.hse.ru фото • 25.03.2013 – 35th European Conference on Information Retrieval (ECIR 2013), совместно с компанией Яндекс – http://ecir2013.org • Впервые в России за 35 лет! • 04.04.2013 – Вторая всероссийская конференция по Анализу Изображений, Сетей и Текстов (АИСТ 2013) – http://aistconf.org/legacy/2013 • 03.08.2013 – 2nd International Workshop “What can FCA do for Artificial Intelligence?” (FCA4AI 2014) в рамках IJCAI 2013 – http://fca4ai.hse.ru/2013 • 07.12.2013 – 2nd International IEEE Workshop on Experimental Economics and Machine Learning в рамках конференции IEEE ICDM 2013 – http://eeml.hse.ru/2013 фото Высшая школа экономики, Москва, 2015 24 Крупнейшее мероприятие 2013 года В 2013 году лаборатория участвовала в организации совместно с компанией Яндекс • 35th The annual European Conference on Information Retrieval фото (ECIR’2013) • а также семинар • Formal Concept Analysis meets Information Retrieval (FCAIR) фото Высшая школа экономики, Москва, 2015 25 Организация научных мероприятий (2014 год) • 09.04.2014 – Третья всероссийская конференция по Анализу Изображений, Сетей и Текстов (АИСТ 2014) – http://aistconf.org/legacy/2014 • 03.06.2014 – 2nd International Conference on Information Technology and Quantitative Management (ITQM 2014) – http://itqm2014.hse.ru фото • 06.06.2014 – 9th International Computer Science Symposium in Russia (CSR 2014) – http://logic.pdmi.ras.ru/csr2014 • 16.06.2014 – 24th Annual Symposium on Combinatorial Pattern Matching (CPM 2014) – http://cpm2014.hse.ru • 19.08.2014 – 3rd International Workshop “What can FCA do for Artificial Intelligence?” (FCA4AI 2014) в рамках IJCAI 2013 – http://www.fca4ai.hse.ru/2014 • 11.09.2014 – 16th International Conference on Artificial Intelligence: Methodology, Systems, Applications (AIMSA 2014) – http://www.aimsaconference.org фото Высшая школа экономики, Москва, 2015 26 Организация научных мероприятий (2015-2016 годы) • 09.04.2015 – Четвёртая всероссийская конференция по Анализу Изображений, Сетей и Текстов (АИСТ 2015) – http://aistconf.org • 22.06.2015 – International Workshop on Social Network Analysis using Formal Concept Analysis (SNAFCA-2015) – http://www.snafca2015.sitew.org фото • 25.07.2015 – CFP FCA4AI Workshop at IJCAI 2015 ``What can FCA do for Artificial Intelligence?'' (4th Edition) • … (планируется участие в организации ещё 2 мероприятий в 2015 году) • В 2016 году планируется впервые провести в России конференцию The Thirteenth International Conference on Concept Lattices and Their Applications (CLA 2016) фото Высшая школа экономики, Москва, 2015 27 Проекты Центра фундаментальных исследований Год 2012 2013 2014 2015 2016 Название Математические модели, алгоритмы и программные средства интеллектуального анализа информации в текстовой и структурной форме Математические модели, алгоритмы и программные средства интеллектуального анализа больших данных (Big Data) в текстовой и структурной форме Математические модели, алгоритмы и программные средства интеллектуального анализа данных в текстовой и структурной форме Интеллектуальный анализ данных на основе решеток замкнутых описаний и прикладных онтологий Планируется… Число публикаций фото 42 29 38 -фото -- Высшая школа экономики, Москва, 2015 28 Трудоустройство в лаборатории и после • Лаборатория – прекрасная стартовая площадка как для дальнейшей научной карьеры, так и для продвижения в бизнес-среде • Лаборатория ищет инициативных исследователей, которые готовы фото участвовать в разработке и апробации методов анализа данных (аналитиков) и/или реализации программных средств (программистов). • Для того чтобы поступить в лабораторию, нужно прислать резюме заведующему, пройти собеседование и, возможно, аттестацию (проверку математических знаний и/или навыков программирования) • Студенты и аспиранты изначально зачисляются на должность стажёра-исследователя с испытательным сроком • Аспиранты обычно становятся младшими научными сотрудниками • Молодая НУЛ ИССА уже может гордиться трудоустройством стажёров в Yandex, Witology, Imhonet, АлгоМост, Лабораторию Цифрового Общества, а также участием сотрудников в программах студенческого и академического фото обмена с международными партнерами Высшая школа экономики, Москва, 2015 29 Перечень показателей эффективности МНУЛ на 2015-2016 годы № 1 Наименование показателя Количество публикаций по заявленному направлению исследования в изданиях, индексируемых в базах данных Scopus, Web of Science Ед. изм. 2015 2016 Ед. 10 11 фото 2 Организация и проведение международной конференции Ед. 1 2 3 Организация и проведение международного семинара Ед. 2 2 Чел. 2 2 Чел. 2 2 Чел. 1 1 Чел. 5 5 2 2 4 5 6 7 8 Количество аспирантов, обучающихся в Университете, постоянно работающих в составе научного коллектива МЛ Количество студентов магистратуры, обучающихся в Университете, постоянно работающих в составе научного коллектива МЛ Количество кандидатских диссертаций, защищенных сотрудниками МЛ по заявленному направлению научного исследования Количество научно-педагогических работников МЛ, принявших участие в программах международной и внутрироссийской мобильности Количество зарубежных сотрудников лаборатории и российских сотрудников – обладателей PhD зарубежных университетов, принявших участие в выполнении НИР за отчетный период фото Чел. Высшая школа экономики, Москва, 2015 30 125319, Россия, Москва, Кочновский проезд, д. 3 Тел.: +7(495)772-95-90 * 22668 www.hse.ru/ai/issa