Uploaded by anvc577

Special Analytics

advertisement
I. Введение
НИИ Кризисных информационных систем
ИНФОРМАЦИОННАЯ ПОДДЕРЖКА КРИЗИСНОГО РЕАГИРОВАНИЯ
19.11.11
4
WWW.CRISISDATA.INFO
Шаг 1
Шаг 2
Шаг 3
Шаг 4
Шаг 5
Шаг 6
Шаг 7
5
ИНФОРМАЦИОННАЯ ПОДДЕРЖКА КРИЗИСНОГО РЕАГИРОВАНИЯ
WWW.CRISISDATA.INFO
6
ИНФОРМАЦИОННАЯ ПОДДЕРЖКА КРИЗИСНОГО РЕАГИРОВАНИЯ
WWW.CRISISDATA.INFO
Растущее признание важности сбора и анализа
разведданных из открытых источников
Информационная революция, ведущая к росту объема
информации – полезной и бесполезной – доступной
аналитикам
Своевременный и верный анализ информации
становится все более трудным. Аналитикам требуется
собрать, верифицировать, оценить и интегрировать в
свои доклады потоки информации, поступающей из все
большего количества неизвестных источников
Признание всего этого привело к созданию и
распространению широкого набора инструментов
(аналитических и программно-аппаратных),
помогающих аналитикам выполнять свои задачи
7
ИНФОРМАЦИОННАЯ ПОДДЕРЖКА КРИЗИСНОГО РЕАГИРОВАНИЯ
WWW.CRISISDATA.INFO
8
ИНФОРМАЦИОННАЯ ПОДДЕРЖКА КРИЗИСНОГО РЕАГИРОВАНИЯ
WWW.CRISISDATA.INFO
9
ИНФОРМАЦИОННАЯ ПОДДЕРЖКА КРИЗИСНОГО РЕАГИРОВАНИЯ
WWW.CRISISDATA.INFO
Информация из открытых источников – «... общедоступные
материалы, которые может получить кто угодно на
законном основании, путем запроса, через коммерческое
приобретение или самостоятельный поиск»
(Источник: US Intelligence Community Directive 301:
National Open Source Enterprise)
www.fas.org/irp/dni/icd/icd-301.pdf
10
ИНФОРМАЦИОННАЯ ПОДДЕРЖКА КРИЗИСНОГО РЕАГИРОВАНИЯ
WWW.CRISISDATA.INFO
1.
2.
Информация, свободно доступная всем
Коммерческие данные – например, ежегодные отчеты
компаний
3. Аналитические работы отдельных экспертов
4. Т.н. «серая» литература – например, доклады,
подготовленные в частном секторе,
правительственных учреждениях или академических
институтах, которые лишь ограниченно доступны
11
ИНФОРМАЦИОННАЯ ПОДДЕРЖКА КРИЗИСНОГО РЕАГИРОВАНИЯ
WWW.CRISISDATA.INFO
• СМИ
• Общественные данные
• Информация из профессиональных или академических
источников
• Коммерческие данные
• «Серая» литература
12
ИНФОРМАЦИОННАЯ ПОДДЕРЖКА КРИЗИСНОГО РЕАГИРОВАНИЯ
WWW.CRISISDATA.INFO
I I . Сбор разведданных из отк рытых источник ов,
анализ вопросов и построение поиск овых запросов
13
!
!
1. Что так ое «сбор разведданных из отк рытых
источник ов»?
5. «… информация, полученная из открытых, не
«скрытых» и не секретных источников».
Определения:
1. «Сбор разведданных из открытых источников
это использование общедоступной информации,
которая
собирается,
обрабатывается,
своевременно
распространяется
среди
экспертов, в тех областях деятельности, где
необходимо ее использование». (FMI 2-22.9
декабрь 2009)
6. "... общедоступные материалы, которые может
получить кто угодно на законном основании,
путем запроса, через коммерческое приобретение
или
самостоятельный
поиск".
(Intelligence
Community Directive Number 301 and P.L. 109-163,
Sec. 931)
7. Соответствующая определенным требованиям
информация из открытых источников, которая
после тщательного анализа на соответствие этим
требованиям
предоставляет в распоряжение
аналитика
актуальную,
репрезентативную,
релевантную, надежную и
достоверную
информацию или доклад, в корректном формате и
в необходимые временные сроки.
Такая
информация позволяет быть более уверенным при
принятии решений и сократить время на его
приняти.
2. «….это форма управления сбором разведанных
которая включает в себя нахождение, отбор и
извлечение необходимой
информации
из
общедоступных источников, для дальнейшего
анализа и использования». (Wikipedia)
3. «….части пазла, без которых невозможно ни
начать, ни завершить сборку пазла... разведданные
из открытых источников являются важнейшей
основой для всех источников разведданных, но
они не заменяют
собой совокупность всех
источников». (Joseph Nye, Head
National
Intelligence Council, 1990)
Разведданные
из
отк рытых
источник ов,
информация из отк рытых источник ов
Часто термин «информация из открытых
источников»
используется
для
обозначения
получения
проверенной
информации
из
4. "... незасекреченная информация»
10
!
!
универсальных открытых источников для широкой
общественности, без всякого анализа такой
информации.
безопасности, но не тип информации. Таким образом,
их сравнение не является корректным. Почти вся
засекреченная
информация
это
информация,
полученная из открытых источников с пометкой
«секретно».
В силу отсутствия, каких либо
критериев подлинности: источник, имен авторов,
использованной методологии, надежность секретной
информации практически невозможно определить.
Термин «сбор разведданных из открытых
источников» далее OSINT (Open source intelligence)
используется для информации, которая прошла
предварительный анализ.
Так, например, в
корпорации
Intel
департамент занимающийся сбором данных и их
предварительным анализом (data => information),
передает такую информацию для дальнейшей
обработки (информация => разведданные) в
аналитический департамент.
Законодательство
Многие страны имеют законодательство о сборе
информации, которое ясно разъясняет, как и при
каких условиях
может осуществляться сбор
информации.
М есто разведданных,
полученных
из
отк рытых источник ов в разведывательной
деятельности.
Порядка 80% или более всех разведданных
получено из открытых источников.
Различие между Сбором информации из открытых
источников и Анализом состоит в следующем:
1. Сбор информации из открытых источников - это
мониторинг,
нахождение,
отбор,
обзор,
каталогизация,
распространение
информации,
информирование лиц принимающих решение
2. Анализ это сравнение, понимание, интерпретация,
объяснение, прогнозирование или отбраковка
информации.
Почему применяется OSINT:
1.Низкая стоимость
2. Повсеместная доступность
3. Быстрый доступ
4. Режим реального времени
5. Надежность
6. Отсутствие грифа секретно
Информация из отк рытых источник ов и
засек реченная информация в сравнении:
Секретная информация не является классом
информации. Термин «секретно»
есть мера
2. Анализ «вопросов»
11
!
!
Как сформулировать поисковый запрос, перед тем
как начать выполнять поиск?
2.3 Вопрос, на к оторый можно получить ответ
Концепция «Вопроса, на который можно получить
ответ» включает следующие советы:
Знание того что именно Вы пытаетесь найти
вероятно самая важная вещь определяющая успех
вашего поиска.
Никогда не начинайте поиск, если в вопросе
присутствует неопределенность
Пример:
Получить несколько докладов (статей,
ссылок, материалы и т.д.) по последней ситуации в
сфере безопасности в Бразилии. Неопределенность в
вопросе:
несколько,
«текущей»,
«ситуация»,
«безопасность».
Всегда старайтесь сформулировать вопрос как
можно более точно.
1. Неправильно:
«Получить
несколько
докладов (статей, ссылок, материалы и тд)
по
последней
ситуации
в
сфере
безопасности в Бразилии».
2. Правильно: «Получить не более пяти
газетных статей из международных изданий
про
безопасность
правительственных
компьютерных
сетей в Бразилии
опубликованных на прошлой неделе»
Правила:
Если мы понимаем вопрос, мы знаем, как должен
выглядеть ответ.
Если мы знаем, как должен выглядеть ответ, мы
также знаем, когда остановить поиск.
«Суть такова, есть известные «известности», то есть
то, о чем мы знаем, что мы знаем. Так же есть
известные «неизвестности». То есть, то о чем мы
знаем, что не знаем. Но так же есть неизвестные
«неизвестности», то есть то, о чем мы не знаем, что
не знаем. И каждый год мы находим все больше
таких неизвестных» неизвестностей»». (Министр
Обороны США Дональд Рамсфелд, 12 февраля,
2002)
2.2 Для чего необходим анализ вопроса?
Самая большая проблема в поиске информации: это
расплывчатые или нечеткие вопросы
Следствие расплывчатого вопроса:
1. Неверный вопрос? => Неверный ответ!
2. Переизбыток
ответной (как правило, не
релевантной) информации
3. Вы не знаете когда остановить поиск
Всегда начинайте поиск,
уделяя пристальное
внимание формулировке вопроса.
2.4
Последовательность анализа
12
!
!
В процессе перевода исходной информации в запрос,
который вводится в поисковую систему, можно
выделить следующие этапы:
1. Уменьшить
результатов
2. Увеличить
результатов
У Клиента (начальника) есть общая информационная
проблема.
Например: «У меня недостаточно сведений о
Бразилии»
количество
найденных
релевантность
найденных
Примеры модификатров:
1. Язык документа: найти документы только на
Русском или Английском языке
2.
Время
публикации:
найти
документы,
опубликованные на прошлой неделе, в прошлом
месяце, в таком то году.
3. Количество результатов: показать только 50
результатов
4. Формат: найти только книги или доклады, блоги,
презентации, карты или видео
5. Издатель/источник информации: найти только
документы,
опубликованные
аналитическими
центрами, правительством, ИТАР ТАСС.
1. Клиент формулирует определенную задачу
Пример: «Дайте мне всю информацию о
Бразилии для доклада высшему руководству»
2. Поисковый аналитик формулирует «вопрос, на
который можно получить ответ»
Например: «Найти не менее 6 аналитических
статей в зарубежных изданиях о ситуации в
сфере безопасности в Бразилии за последние 6
месяцев, описывающих события и их
последствия для безопасности в регионе».
3. Поисковый аналитик переводит вопрос в
поисковый запрос ss (Brasil+BrasiliaCity)/ti,de
* majpap/so * 2008/py * len>800
2.6 Поиск овые к онцепты
Думайте концептуально!
1. Когда вы формулируете вопрос,
старайтесь
определить его конкретный смысл
Пример:
1. Доклад о пограничном конфликте между Абхазией
и Грузией
2. История кораблестроения
3. История кораблестроения в России и т.д.
2.5 Использование модифик аторов при
составлении поиск овых вопросов
Модификаторы
это
дополнительные
параметры, сужающие рамки поиска.
Цель их использования:
2.7 «Проблемы» с поиск овыми вопросами
13
!
!
6. Клиент сильно упрощает вопрос
Вопросы, вводящие в заблуждение
1. Вопрос: Найти книгу о движении сопротивления
2.9 Типичные «неправильные» вопросы
«Дикая обезьяна» в Бразилии»
Очень часто клиент не способен самостоятельно
сформулировать корректный вопрос
Такой вопрос может выглядеть следующим образом:
1. Вопрос о том, как что-то сделать
2. Например, найдите мне:
Книги про управление мотоциклом
Публикации про саперное дело
3. Поиск
специфических
названий,
узко
технических терминов и т.д.
4. Очень широкий вопрос
Настоящий вопрос: "Действительно ли существует
такое движение в Бразилии?»
Неполные вопросы
1. Вопрос: «техническое описание Т-80»
Истинный вопрос:
«техническое описание
тепловизорного оборудования
танка Т-80
экспортной версии»
Нечеткий вопрос
1. Вопрос: «найти книги про фотоискусство»
2. настоящий вопрос: Как использовать 16мм камеру
для подводной съемки морской жизни.
2.10 Обсуждайте с к лиентом информацию,
к оторую он хочет получить
2.8 Причины, по к оторым к лиент часто не может
к оррек тно сформулировать вопрос:
1. Клиент не хочет выглядеть глупым.
2. Клиент не хочет или не может сформулировать
правильный вопрос
3. Клиент является посредником (например
секретарь передающий просьбу руководителя в
информационный департамент)
4. Клиент
не
понимает
возможности
информационного департамента
5. Клиент сам не знает, какая информация ему
нужна (очень сложно сформулировать слова,
которые ты не знаешь)
На основе предыдущего объяснения, о том,
почему многие пользователи не задают правильных
вопросов, неплохо предварительно обсудить с
клиентом (или с самим собой) точный вопрос.
Рассмотрите следующие вопросы, которые
помогут лучше составить запрос.
• Чего вы действительно хотите?
• Это настоящий запрос? (Или он содержит
скрытый запрос?)
• Тема запроса ясна? Понимаете ли вы
терминологию запроса (Атомная архитектура
Кадмия 109?)
14
!
!
инструмента изучения применяют семантический
анализ.
• Есть ли неточности в вопросе?
• Содержит ли вопрос неопределенность?
• Какие проблемы будут решены с помощью
этой информации
• Для чего будет использоваться найденная
информация? (Мотивация клиента)
• Бэкграунд клиента (образование, работа,
должность)
• Степень информированности клиента в
запрашиваемом ответе
• Тип
вопроса:
глубокое
исследование,
фактологическая информация, короткий обзор,
брифинг, доклад, подтверждение подлинности
• Тип опубликованной информации (доклад,
книга, патент, руководство пользователя)
• Что клиент уже нашел по данному вопросу
• Установленные ограничения:
• Язык текста
• Временные рамки
• Стоимость
• Требуемый формат вывода информации для
конечного пользователя (Текстовая, Видео,
Аудио)
3.1 Терминолог ия
Использование правильной терминологии для
обозначения предмета поиска является ключевым
фактором успеха.
Приведенная ниже семантическая таблица
поможет определить правильный ли термин выбран
для обозначения объекта поиска.
Правило: в процессе поиска, старайтесь думать
о том как документ который вы ищите, может быть
составлен, какую информацию о может содержать.
3.2 К ак найти к лючевые слова для составления
вопроса (термины)
При поиске ключевых слов, для поискового запроса,
рекомендуется использовать следующие источники:
1. Словари
2. Энциклопедии
3. Справочники
4. Тезарусы, таксономии или онтологии
5. Книги, журнальные статьи, и т.д.
6. При изучении источников, также необходимо
обратить
внимание
на
следующую,
встречающуюся в них информацию:
• Известные! авторы! по! данной! тематике,!
автор!предисловия,!!редактор!
3. Семантик а
Сема́нтика
(от
др.-греч.
σηµαντικός —
обозначающий) —
раздел
языкознания,
изучающий значение единиц языка. В качестве
15
!
!
• Названия!
институтов,!
университетов,!
сообществ!публикующих!работы!по!данной!
тематике!
• Имена!издателей!
• Названия!журналов!
• Фразы!и!выражения!
Ключевые слова для поиска, а также варианты
их написания:
• Общие!имена,!!псевдонимы!
• Возможные!варианты!перевода!
• Омонимы!
• Синонимы!
3.3 Семантическ ая таблица
Семантическая таблица состоит из 10 пунктов,
которые необходимо принимать во внимание, при
формировании вопроса.
1. Варианты написания
Обращайте внимание на возможные варианты
написания одного и того же термина, например
: Al-Qaida ; Al-Qaeda ; Al-Qa'eda ; Al-Kaida
2.
Использование
акронимов
(аббревиатур,
сокращений)
Как:
(a) ВУЗ - «Высшее учебное заведение»
(b) США - «Соединенные штаты Америки»
(c) ОМП - «Оружие массового поражения»
При этом необходимо помнить, что один и тот же
акроним может иметь разное значение
КАК:
ДНК - дезоксирибонуклеиновая кислота
ДНК - дистиллированные нефтяные кислоты
ДНК - духовно-нравственная культура
Или:
НАК - Национальный антитеррористический комитет
НАК - незаменимая аминокислота
НАК - Национальная ассоциация кинотеатров
НАК - Национальный антикоррупционный комитет
3. Технические термины /профессиональный жаргон
(a) Законность - Легитимность
(b) аскорбиновая кислота - витамин
(c) определение целостности гальванической цепи с
помощью омметра, мультиметра или других
приборов и приспособлений – Прозвонка
5. Исторические особенности написания стран
(a) Цейлон – Шри-Ланка
(b) Мьянма – Бирма
(c) Югославия – Бывшая республика Югославии
Черногория -Montenegro - Балканы
6. Синонимы
(a) Мотоцикл - Байк
(b) Нидерланды - Голландия
(c) Модель-Образец-Прототип
7.Антонимы
(a) Белый - Черный
(b) Благодаря - Вопреки
(c) Богатый - Нищий
16
!
!
8. Квази синонимы
(a) number 10 - london - united kingdom - "gordon
brown"
Кремль-Москва-Россия
Белый Дом-Вашингтон-США
9. Термины включающие широкую предметную
область; Термины включающие узкую предметную
область
(a) Ш ирокая предм. область: полевая артиллерия
Поисковый термин: гаубица
Узкая предм. Область : механизированная гаубица/
самоходное орудие
Еще более узкая предм. область : M109A2/A3
Ш ирокая предм. область: Россия
Узкая предм. область: Московская область
Еще более узкая предм. область: Москва
3.4 Язык
Найдите написание ключевых слов в других языках
Имейте в виду, что один и тот же термин в Англии и
СШ А может писаться по разному
(a) Lift - elevator ; lorry - truck ; autumn - fall ; chips french fries ; trousers - pants
(b) Encyclopaedia - encyclopedia ; catalogue - cataloge
(c) At the weekend - on the weekend ; I have lost my
book - I lost my book
rocket=missile ?
10. Омонимы
банк ; танк ; танкер
17
!
!
• Комбинируйте концепты при помощи связки
AND, для увеличения релевантности
4. Поиск овые стратегии
Основные поисковые стратегии
Обзор
Существуют пять основных поисковых стратегий,
которые будут рассмотрены ниже
1. Построение блоковой поисковой стратегии
2. Фокусирование результата поиска
3. Использование цитат в процессе поиска
4. Метод «снежного кома»
Рассмотрим и разберем 8 основных шагов, а так же
приведем примеры применимые в таких поисковых
системах как Google, Yahoo, Ask and Exalead.
Правильно задавайте вопрос!
• Формулируйте вопрос в одном предложении
• Четко
выделяйте
смыслообразующий текст
предложении
• Проверяйте полученные результаты на наличие
новых ключевых слов, имен авторов,
вариантов написания, и тд.
Пример
Проблема: «найти информацию о старых ветреных
мельницах в Голландии, 17 века постройки,
конструкция, использование, и тд.»
1. Формулируем вопрос: «история ветряных мельниц
в Голландии»
2. Определяем концепты: история; ветряные
мельницы, Голландия
3. Для каждого концепта находим ключевые слова
История, средневековье, 17 век, geschiedenis;
middeleeuwse ; 17e eeuwse
Ветряные мельницы, ветряк, ветряные турбины,
ветряной генератор
Голландия, Нидерланды, dutch ; nederland ; pays bas ;
niederlande
4. Комбинируйте ключевые слова со связкой OR
(история OR средневековые OR «17 век»)
(ветряные мельницы OR ветряные турбины OR
ветряные генераторы OR wind-mills OR windmill OR
"wind turbine" OR "wind generator")
(Нидерланды OR Голландия OR nederland OR "pays
bas" OR nieder-lande)
5. Комбинируйте концепты связкой "AND"
конкретный
далее концепт в
• Для каждого концепта найдите несколько
семантических вариаций: синонимы, варианты
написания, псевдонимы, множественное или
единственное число, аббревиатуры.
• Комбинируйте термины для каждого концепта
с помощью связки OR для расширения охвата
поиска
18
!
!
(a) (history OR geschiedenis) (windmills OR
windmolens) (netherlands OR holland)
(история OR средневековые OR «17 век») AND
(ветряные мельницы OR ветряные турбины OR
ветряные генераторы OR wind-mills OR windmill OR
"wind turbine" OR "wind generator") AND
(Нидерланды OR Голландия OR nederland OR "pays
bas" OR niederlande)
Что это?
Крайне упорядоченный подход к поиску, в
котором поисковый запрос состоит из «блоков»
поисковых терминов связанных между собой связкой
OR , а каждый концепт связан связкой AND
Когда используется?
Используется в случаях когда встречаются
следующие условия:
1. Сложный вопрос (состоит из нескольких
концептов и терминов)
2. Поисковая система позволяет создание наборы
вопросов
3. Поиск должен быть исчерпывающим
Как использовать «блоковую» стратегию
1.Проанализируйте вопрос/ разберите проблему
2.Сформулируйте вопрос в одном предложении
3.Разделите вопрос на концепты
4.Для каждого концепт подберите термины в
соответствии с семантической таблицей
5. Начните поиск для каждого концепта
6. Используйте для связки терминов между собой
«OR»
7. Используйте для связки концептов «AND»
Пример
1. Анализ вопроса/ разбор проблемы
6. Проверьте полученные результаты на наличие
новых ключевых слов, имен авторов, повторите шаг
номер один.
7. Используйте модификаторы
Произведите отсев результатов
По названию: Нидерланды, Ветряные мельницы
По типу документа: pdf
По адресу сайта: Ветряные мельницы site:ru
По языку : ( В поисковой системе Google, идем в
меню Search Settings, , in Exalead, type "language:en"
to search english language only)
По времени: (в Google, нажать Show Options)
Конечный поисковый запрос (history OR geschiedenis)
(intitle:windmills OR intitle:windmolens) (nether- lands
OR holland) _letype:pdf site:ru date:3"
4.1
Использование
стратег ии.
Построение «Блоков»
«Блок овой»
а.
Проблема:
начальник
хочет
получить
исчерпывающую информацию о пограничном
конфликте между Индией и Пакистаном
Сформулируйте вопрос в одном предложении. Такой
вопрос обычно содержит исходную информацию:
поиск овой
19
!
!
предмет поиска, географическое расположение,
временные рамки
Вопрос: Найти высококачественную информацию
академического уровня о пограничном конфликте
между Индией и Пакистаном.
1. Разбиваем вопрос на концепты
Стрелковое оружие: винтовка OR автомат
пистолет OR стрелковое оружие
автоматическое оружие
Балканы: Балканы OR Сербия OR Босния
Хорватия
Конечный поисковый запрос: торговля
контрабанда OR незаконный оборот
продажа AND винтовка OR автомат
пистолет OR стрелковое оружие
автоматическое оружие AND Балканы
Сербия OR Босния OR Хорватия
Индия
Пакистан
Пограничный конфликт
2. Для каждого концепта находим термины в
соответствии с семантической таблицей
OR
OR
OR
OR
OR
OR
OR
OR
Инструменты и поисковые системы для улучшения
«блоковой» поисковой стратегии
1. Google не позволяет строить наборные запросы,
но используя кнопку «поиск среди найденных
результатов»
вы
можете симулировать
«блоковую» поисковую стратегию
Пример:
Индия: Индия, Нью-Дели, Манмохан Синг
Пакистан: Пакистан, Исламобад, Асиф Али
Зардани
Пограничный
конфликт:
пограничный
конфликт,
пограничный
инцидент,
вооруженный инцидент
Начните поиск по каждому концепту
Скомбинируйте все термины в рамках одного
концепта при помощи связки OR
Скомбинируйте все концепты между собой при
помощи связки AND
Пример №2
Вопрос: Контрабанда стрелкового оружия на
Балканах
Выделяем концепты и термины
Контрабанда: торговля OR контрабанда OR
незаконный оборот OR продажа;
20
!
!
Начните поиск по каждому концепту
Скомбинируйте все термины в рамках одного
концепта при помощи связки OR
Скомбинируйте все концепты между собой при
помощи связки AND
Пример фокусированного поиска
Пример: шаг за шагом
Индия
Нью Дели
Индия OR Нью Дели
Индия OR " Нью Дели "
intitle:Индия OR intitle:" Нью Дели "
Пакистан
Исламабад
Пакистан OR Исламабад
intitle:Пакистан OR intitle:Исламабад
intitle:Пакистан OR intitle:Исламабад intitle:Индия OR
intitle:"Нью Дели"
intitle:Индия OR intitle:"Нью Дели" intitle:Пакистан
OR intitle:Исламабад -спорт -крикет
intitle:Индия OR intitle:"Нью Дели" intitle:Пакистан
OR intitle: Исламабад - спорт -крикет -inurl:(.com|.net)
intitle:Индия OR intitle:"Нью Дели" intitle:Пакистан
OR intitle: Исламабад - спорт -крикет inurl:(.com|.net)_letype:pdf
4.2 Фок усирование результата поиск а
Как добиться более релевантных результатов в
процессе поиска?
Если вы сформулируете очень «сырой» запрос,
то вы получите огромное количество результатов с
низкой релевантностью. Если же в запрос добавлены
концепты, термины и прочие ограничители, то это
существенно сокращает количество результатов,
увеличивая релевантность.
Пример:
Проблема: Найти высококачественную информацию
академического уровня о пограничном конфликте
между Индией и Пакистаном.
Вопрос: аналитические доклады о пограничном
конфликте между Индией и Пакистаном.
1. Разбиваем вопрос на концепты
Индия
Пакистан
Пограничный конфликт
2. Для каждого концепта находим термины в
соответствии с семантической таблицей
Пример:
Индия: Индия, Нью-Дели, Манмохан Синг
Пакистан: Пакистан, Исламобад, Асиф Али
Зардани
Пограничный
конфликт:
пограничный
конфликт,
пограничный
инцидент,
вооруженный инцидент
intitle:Индия OR intitle:"Нью Дели" intitle:Пакистан OR intitle:
Исламабад - спорт -крикет -inurl:(.com|.net)_letype:pdf
daterange:2453371.50000-2455927.50000
4.3 М етод «снежног о к ома»
Что такое «снежного кома» и как это работает?
21
!
!
Большая часть научной литературы содержит список
ссылок на других авторов, писавших по данной
тематике.
1.Найдя релевантный документ, обратите внимание
на ссылки и библиографию, по ссылке вы находите
другую работу, которая так же содержит ссылки.
2.Важно! Найдя новый документ, обязательно
запишите имя автора, оно может понадобиться для
дальнейшего поиска, например в библиотечных
каталогах.
Так
же
записывайте
название
публикующих
организаций:
институтов,
университетов и тд.
3.Обязательно отмечайте новые ключевые слова,
варианты написания ключевых слов, новые
выражения и термины, имеющие отношение к
предмету вашего поиска.
Повторите шаг №1.
1. Возьмите научную статью, назовем ее «статья
№1»
2. Берем имена авторов этой статьи
3. С помощью индекса цитирования смотрим
какие другие авторы цитирует в своих работах
«статью №1», таким образом находим новые
статью , называем ее «статья №2»
4. Берем имена авторов «статьи №2»
5. С помощью индекса цитирования смотрим
какие другие авторы цитирует в своих работах
«статью №2», таким образом находим новые
статью , называем ее «статья №3»
6. И так далее
Второй способ:
1. Берем статью, смотрим на кого ссылается
автор, находим по ссылке исходный документ,
сморим на кого в нем ссылается его автор, и
так далее.
4.4 Использование «цитирования» в процессе
поиск а
Существует два способа работ с «цитированием» в
процессе составления поискового вопроса.
1. Нахождение
новых
документов
с
использованием «индекса цитирования».
2. Нахождение
новых
документов
с
использованием существующих ссылок.
Как использовать?
22
!
!
5. Надежность информации
Перед
тем
как
использовать
информацию
обязательно проверьте ее по целому ряду критериев
подтверждающих ее надежность
Почему?
1. Чтобы судить о надежности и точности
информации
2. Чтобы отличить Хорошее от Плохого
3. Чтобы избежать информационного переизбытка
4. Пример: United Airlines
Проверка Интернет информации
1. Информация в Google не проверяется на предмет
качества, впрочем, как и в Интернете вообще.
Почему так много некачественной информации?
1. Никто не хочет получать объективную
информацию
1. Мы хотим читать, то, что нам нравится читать,
невзирая на надежность и правду.
2. Мы хотим получать информацию, невзирая на
предвзятость автора
Кто угодно может опубликовать, что угодно в
Интернете.
Взгляните: правда, или ложь?
23
!
!
2. Tribune Findings on United Airlines Story from
December 2002 86 (Tribune, 9 sep 2008)
10 Tribune Says Confusion Over 2002 Article
Started with Google Search Agent 87 (Tribune,
Sep 2008)
3. Inside The UAL Story Debacle 88 (Forbes, 9 sep
2008)
Верифик ация данных
Пример: случай с авиакомпанией United Airlines
Использование информации из Интернета, без
проверки
может привести к катастрофическим
последствиям.
Что случилось в сентябре 2008:
1.Кто-то из сотрудников департамента организации
занимающейся Обслуживанием Инвестиций искал
информацию в Google о банкротствах в 2008 году.
2. Google на соответствующий запрос, выдал
результат 6 летней давности, подписав его датой
составления запроса.
3. Результатом была история о скором банкротстве
компании
United
Airlines,
опубликованная
издательством Sun Sentinel publishes.
4.Информагенство Блумбергс без всякой проверки,
разместило эту информацию.
5. За считанные минуты акции United Airlines упали в
цене на 75 %.
6. Торги были остановлены, агентство Блумберг
удалило сообщение, но несмотря на опровержение,
акции United Airlines подешевели с 12 до 10
долларов.
Список к ритериев для проверк и информации:
1. Цель публикации
2. Создатель информации
3.Источник (книга, веб-сайт)
4.Содержание источника
5.Доступность информации
6. Стоимость
Причины публикации
Причины публикации, цель деятельности веб-сайта,
цель создания веб-сайта.
Для чего?
1.Пропаганда / влияние на общественное мнение,
группами лоббистов, группами политического
давления.
2. Реклама, например Google, « бесплатные» сайты
3. Сайты для обмена информацией, например хобби
или сайты правительственных учреждений
4. Коммерческие проекты
5. Образовательные проекты
6. Развлечения
Источники:
1. 2002's News, Yesterday's Sell-O_ 85 (Washington
Post, 9 sep 2008)
24
!
!
7. Криминальные сайты, сбор частной информации,
заражение вредоносными программами.
Поиском по библиотечным каталогам
Использует ли автор, какие либо ученые
степени, академические титулы или нет?
Кто и как часто цитирует автора? (Индекс
цитирования) Что другие думают об авторе?
Проверьте контактную информацию (номер
телефона, адрес электронной почты, место
жительства)
На что обратить внимание:
1. Всегда ищите на сайте информацию о сайте'about
us', 'more information', 'about this website'
2. Обратите внимание на копирайт сайта, контакты
3. Обратите внимание на домен сайта (ru, (.gov, .com,
.edu и тд.)
2. Издатель
Есть ли издательство, проверьте сайт издательства
Есть ли спонсор, проверьте сайт спонсора
Проверьте домашний сайт веб дизайнера, для кого
еще они делали сайты?
Рекламодатели, насколько они известны?
Автор, создатель, редак тор
Попытайтесь найти информацию о создателях сайта,
авторах публикующих информацию. Кто они на
самом деле, насколько они известны и авторитетны.
Автором может быть кто угодно, кто подписался под
размещенной информацией. Если используются не
настоящие имена то почему?
Проверяйте источник
Проверьте веб-сайт, книгу, доклад, насколько
качественно и профессионально они выглядят.
Что делать
1. Ищите имена или источник идентификации для:
Писателей, создателей сайта
Редактора
Издателя
Спонсора
Дизайнера веб-сайта
Рекламодателя
Что делать?
1. Насколько логичным выглядит имя домена для
интернет ресурса?
2. Является ли сайт личным веб- сайтом?
3.
Является ли URL сайта подлинным, или
информация скопирована
4. Насколько URL выглядит логичным и надежным?
5. Есть ли у сайта собственное доменное имя или он
под сторонним хостингом
Как проверить
1.Автора публикации
Поиском в сети
25
!
!
6. Стиль написания контента? Профессионально?
Любительски?
7. Насколько хорошо информация на сайте
организованна и представлена?
8. Кто является владельцем веб-сайта?
9. Кем зарегистрирован веб-сайт?
10. Физическое местонахождение веб-сайта?
11. Проверьте внешние ссылки.
12. Есть ли на сайте фишинговые ссылки - вид
интернет-мошенничества, целью которого является
получение доступа к конфиденциальным данным
пользователей — логинам и паролям;
Так называемые линкофермы – сайт для
искусственного создания ссылок; группа веб-сайтов,
каждый из которых содержит ссылки на другие
сайты в группе; специально создаваемый сайт
(обычно — большое количество сайтов), не несущий
полезного контента, цель которого — накрутка
индекса цитирования третьего сайта (сайтов) путем
размещения ссылок на него (них).
3. Проверьте URL на наличие тильды
4. Обратите внимание если фактический URL адрес,
отличается от того который прописан в
командной строке
5. Поверьте, на кого зарегистрирован сайт (это
можно сделать по адресу www.whois.net)
6. Что другие пишут про этот сайт?( www.icg.org inurl:icg.org)
Содержание сайта
На что обратить внимание:
Насколько хорошо написан текст, насколько он
выглядит профессионально и какое производит
впечатление?
Что делать:
1. Какой стиль написания материалов? Популярный,
научный, технический?
2. Как организован контент?
3. Насколько контент соотносится с названием сайта?
4. Много ли рекламы?
5. Есть ли ссылки на источники информации
6. Содержат ли другие сайты ссылки на этот сайт?
Как проверить?
1. В случае «скрытых ссылок» (когда ссылка,
указанная на странице, не совпадает с реальной
гиперссылкой, на которую происходит переход)
скопируйте URL из статусной строки браузера и
проверьте его.
2. Проверьте содержание сайта на предмет
соответствия домену, сайт правительства без
домена gov. Вряд ли принадлежит правительству.
1. Сравните содержание сайта с содержанием других
аналогичных сайтов
2. Спросите мнение у экспертов
3. Проверьте, есть ли на сайте опечатки или
очевидные ошибки
4. Проверьте ссылки на сайт в поисковых системах
Google/Yahoo, or Google Scholar, or Alexa.com
26
!
!
• Необходимо понимать разницу между датой
публикации
информации
и
последним
обновлением.
• Обязательно проверяйте информацию и ее
актуальность на других сайтах.
Доступность сайта
Насколько просто сайт доступен?
1. Защищен ли сайт паролем?
2. Необходима ли регистрация
3. Если необходима, то какая информация
запрашивается
4. Есть ли на сайте всплывающие окна?
5. Как организованна навигация сайта?
Стоимость
Информация предоставляется бесплатно или на
коммерческой основе?
Если бесплатно, то почему?
Если не бесплатно, то, сколько стоит, как часто
платить, за что?
1. Найдите информацию о системе оплаты
2. Особое
внимание
уделите
нечетко
прописанным
условиям
коммерческого
предоставления информации.
3. Можно ли оплатить кредитной картой?
Используются ли платежные системы PayPal? Wire
Transfer? (Western Union)
Актуальность информации
• Насколько актуальна информация?
• Есть ли дата публикации?
• Есть ли дата первой публикации?
• Есть ли не активные ссылки?
• Постарайтесь
определить
опубликованной информации.
!
!
!
возраст
27
!
!
Анализ источников и
их содержимого
ИНФОРМАЦИОННАЯ ПОДДЕРЖКА КРИЗИСНОГО РЕАГИРОВАНИЯ
WWW.CRISISDATA.INFO
29
ИНФОРМАЦИОННАЯ ПОДДЕРЖКА КРИЗИСНОГО РЕАГИРОВАНИЯ
WWW.CRISISDATA.INFO
30
ИНФОРМАЦИОННАЯ ПОДДЕРЖКА КРИЗИСНОГО РЕАГИРОВАНИЯ
WWW.CRISISDATA.INFO
31
ИНФОРМАЦИОННАЯ ПОДДЕРЖКА КРИЗИСНОГО РЕАГИРОВАНИЯ
WWW.CRISISDATA.INFO
История: http://www.newsweek.com/id/136440
Ответ Маккейна: http://www.newsweek.com/id/136572
Newsweek: http://www.newsweek.com/
32
ИНФОРМАЦИОННАЯ ПОДДЕРЖКА КРИЗИСНОГО РЕАГИРОВАНИЯ
WWW.CRISISDATA.INFO
•
•
•
•
•
За исключением газет El-Khabar и El-Watan, ВСЕ газеты в Алжире печатались
государственными печатным предприятиями и распространялись по
государственным дистрибьюторским сетям
Государство контролирует доходы от рекламы в соответствии с позициями газет
При этом большинство этих доходов идет про-правительственным газетам
Государство полностью контролирует теле и радио сети, включая Enterprise
Nationale de Television (ENTV)
Алжирский УК содержит статьи, предусматривающие тюремные сроки и штрафы
за публикацию информации, наносящей ущерб президенту, членам парламента
или другого правительственного органа, а также вооруженных сил
Алжирское законодательство запрещает публикацию статей по безопасности или
политическим конфликтам из любых источников, кроме правительственных
33
ИНФОРМАЦИОННАЯ ПОДДЕРЖКА КРИЗИСНОГО РЕАГИРОВАНИЯ
WWW.CRISISDATA.INFO
Algerian Press Service (APS)
Algerian Radio
Enterprise Nationale de Television
(ENTV)
El Moudjahid, Ежедневная газета
на французском
Ech Chaab, Ежедневная газета на
арабском
«Сухой ост ат ок»: Контроль над
основными алжирскими СМИ
позволяет правительству
манипулировать информацией
34
ИНФОРМАЦИОННАЯ ПОДДЕРЖКА КРИЗИСНОГО РЕАГИРОВАНИЯ
WWW.CRISISDATA.INFO
35
ИНФОРМАЦИОННАЯ ПОДДЕРЖКА КРИЗИСНОГО РЕАГИРОВАНИЯ
WWW.CRISISDATA.INFO
36
ИНФОРМАЦИОННАЯ ПОДДЕРЖКА КРИЗИСНОГО РЕАГИРОВАНИЯ
WWW.CRISISDATA.INFO
http://www.dailystar.co.uk;
http://www.carnegieendowment.org/
37
ИНФОРМАЦИОННАЯ ПОДДЕРЖКА КРИЗИСНОГО РЕАГИРОВАНИЯ
WWW.CRISISDATA.INFO
Конфликт между Израилем и Хезбола, июль-август 2006
38
ИНФОРМАЦИОННАЯ ПОДДЕРЖКА КРИЗИСНОГО РЕАГИРОВАНИЯ
WWW.CRISISDATA.INFO
Позиция Совета по сотрудничеству
стран Залива
Критика Резолюции ООН за
недостаточное внимание
израильской военной агрессии
против Ливана
Предположение, что интересы
безопасности игнорируются
«Сухой ост ат ок»: Совет по
сотрудничеству стран Залива
выступает в поддержку прав
палестинцев, создания двух
государств и вывода Израиля
со всех оккупированных
арабских территорий
39
ИНФОРМАЦИОННАЯ ПОДДЕРЖКА КРИЗИСНОГО РЕАГИРОВАНИЯ
WWW.CRISISDATA.INFO
Палестинская точка зрения
Критика резолюции ООН за
сохранение возможности
для дальнейшей
израильской военной
агрессии
«Сухой ост ат ок»: WAFA
(источник информации)
это Палестинское
новостное агентство,
владельцем которого
является Палестинская
национальная автономия.
40
ИНФОРМАЦИОННАЯ ПОДДЕРЖКА КРИЗИСНОГО РЕАГИРОВАНИЯ
WWW.CRISISDATA.INFO
Международный взгляд на
проблему
СБ ООН смог прийти к
консолидированной
позиции по вопросу, вокруг
которого до этого были
существенные разногласия
«Сухой ост ат ок»: ООН
часто критикуют за
бездействие по арабоизраильскому вопросу.
Неудивительно, что
представитель постоянного
члена СБ ООН оценивает
переговоры как крупный
успех международного
http://daccess-dds-ny.un.org/doc/UNDOC/GEN/N06/465/03/
сообщества
PDF/N0646503.pdf?OpenElement
41
ИНФОРМАЦИОННАЯ ПОДДЕРЖКА КРИЗИСНОГО РЕАГИРОВАНИЯ
WWW.CRISISDATA.INFO
BBC Asia-Pacific news page, 11 апреля, 2010
42
ИНФОРМАЦИОННАЯ ПОДДЕРЖКА КРИЗИСНОГО РЕАГИРОВАНИЯ
WWW.CRISISDATA.INFO
Bangkok Post, 11 апреля, 2010
43
ИНФОРМАЦИОННАЯ ПОДДЕРЖКА КРИЗИСНОГО РЕАГИРОВАНИЯ
WWW.CRISISDATA.INFO
New York Times, April 11, 2010
45
ИНФОРМАЦИОННАЯ ПОДДЕРЖКА КРИЗИСНОГО РЕАГИРОВАНИЯ
WWW.CRISISDATA.INFO
46
ИНФОРМАЦИОННАЯ ПОДДЕРЖКА КРИЗИСНОГО РЕАГИРОВАНИЯ
WWW.CRISISDATA.INFO
С помощью графического редактора
на данном фото добавлен дым, с целью
создать видимость больших разрушений,
чем в действительности
47
ИНФОРМАЦИОННАЯ ПОДДЕРЖКА КРИЗИСНОГО РЕАГИРОВАНИЯ
WWW.CRISISDATA.INFO
http://www.washingtonpost.com/wp-dyn/content/article/
2010/04/11/AR2010041102509.html
48
ИНФОРМАЦИОННАЯ ПОДДЕРЖКА КРИЗИСНОГО РЕАГИРОВАНИЯ
WWW.CRISISDATA.INFO
Талибан выпустил видео по американскому
военнослужащему, 8 апреля, 2010
http://www.reuters.com/news/video?videoId=69351807
49
ИНФОРМАЦИОННАЯ ПОДДЕРЖКА КРИЗИСНОГО РЕАГИРОВАНИЯ
WWW.CRISISDATA.INFO
“Ливанская
«золотая
молодежь»
проезжает по
улице,
рассматривая
разрушенные
кварталы
Бейрута.”
Источник:
http://news.bbc.co.uk/2/hi/
middle_east/6385969.stm
На самом деле: часть кадра (обрезка), показывающего,
как неприспособленные немедицинские автомобили
используются для транспортировки раненых
50
ИНФОРМАЦИОННАЯ ПОДДЕРЖКА КРИЗИСНОГО РЕАГИРОВАНИЯ
WWW.CRISISDATA.INFO
<=
•
«Первые американские военнослужащие
высаживаются на Гаити в сентябре 1994
года для восстановления власти
отстраненного в результате военного
переворота 1991 года президента
Аристида»
На самом деле: фото сделано на
военном аэродроме через неделю
после начала военной операции =>
51
ИНФОРМАЦИОННАЯ ПОДДЕРЖКА КРИЗИСНОГО РЕАГИРОВАНИЯ
WWW.CRISISDATA.INFO
Первые фото организатора 9/11 Халида Мохамеда, снятые Красным
Крестом в Гуантонамо, появились в Интернете в сентябре 2009 года
Фото были сделаны для членов семьи, а не для публикации
Фото сразу появились на веб сайтах и форумах, используемых АльКаидой для пропаганды
Демонстрация последствий публикации изображений
52
ИНФОРМАЦИОННАЯ ПОДДЕРЖКА КРИЗИСНОГО РЕАГИРОВАНИЯ
WWW.CRISISDATA.INFO
Политическая
аффилиация
Левые
Центристы
Правые
Экономическая
аффилиация
Частные
Юридическое
окружение
Открытое
Ограничивающее
Непонятное
Автор
Авторитетный
Неавторитетный
неясно
Аудитория
Специалисты
Освещение
Объективное
Сбор информации
Источники
прослеживаются
Природа контента
Мнение
Факт
непонятная
Тип контента
Печатный
аудио
Видео
Государственные
Общая аудитория
Одностороннее
непонятное
Источники скрыты
53
ИНФОРМАЦИОННАЯ ПОДДЕРЖКА КРИЗИСНОГО РЕАГИРОВАНИЯ
WWW.CRISISDATA.INFO
54
ИНФОРМАЦИОННАЯ ПОДДЕРЖКА КРИЗИСНОГО РЕАГИРОВАНИЯ
WWW.CRISISDATA.INFO
Всегда задавайте вопросы об источниках и их
содержимом
Никогда не считайте, что текстовый, фотографический
или даже мультимедийный контент верен и объективен
Всегда ищите доказательства или признаки
манипулирования информацией, которую Вы собрали
55
ИНФОРМАЦИОННАЯ ПОДДЕРЖКА КРИЗИСНОГО РЕАГИРОВАНИЯ
WWW.CRISISDATA.INFO
«Новые» СМИ и
социальные сети как
источники
разведданных
www.crisisdata.info
ИНФОРМАЦИОННАЯ ПОДДЕРЖКА КРИЗИСНОГО РЕАГИРОВАНИЯ
WWW.CRISISDATA.INFO
57
ИНФОРМАЦИОННАЯ ПОДДЕРЖКА КРИЗИСНОГО РЕАГИРОВАНИЯ
WWW.CRISISDATA.INFO
Ключевые
характеристики
58
ИНФОРМАЦИОННАЯ ПОДДЕРЖКА КРИЗИСНОГО РЕАГИРОВАНИЯ
WWW.CRISISDATA.INFO
http://www.demotix.com/
http://www.huffingtonpost.com/
http://worldtv.com/
59
ИНФОРМАЦИОННАЯ ПОДДЕРЖКА КРИЗИСНОГО РЕАГИРОВАНИЯ
WWW.CRISISDATA.INFO
Ключевые
характеристики
http://www.youtube.com/watch?v=_1zGPnoE6U8
60
ИНФОРМАЦИОННАЯ ПОДДЕРЖКА КРИЗИСНОГО РЕАГИРОВАНИЯ
WWW.CRISISDATA.INFO
61
ИНФОРМАЦИОННАЯ ПОДДЕРЖКА КРИЗИСНОГО РЕАГИРОВАНИЯ
WWW.CRISISDATA.INFO
Блоги
Системы поддержки социальных сетей
62
ИНФОРМАЦИОННАЯ ПОДДЕРЖКА КРИЗИСНОГО РЕАГИРОВАНИЯ
WWW.CRISISDATA.INFO
Ключевые
характеристики
63
ИНФОРМАЦИОННАЯ ПОДДЕРЖКА КРИЗИСНОГО РЕАГИРОВАНИЯ
WWW.CRISISDATA.INFO
http://www.facebook.com/bbcworldnews?v=wall&ref=search#!/cnn?ref=ts
http://www.facebook.com/bbcworldnews?v=wall&ref=search#!
64
ИНФОРМАЦИОННАЯ ПОДДЕРЖКА КРИЗИСНОГО РЕАГИРОВАНИЯ
WWW.CRISISDATA.INFO
http://www.facebook.com/#!/democrats?v=wall&ref=ts
65
ИНФОРМАЦИОННАЯ ПОДДЕРЖКА КРИЗИСНОГО РЕАГИРОВАНИЯ
WWW.CRISISDATA.INFO
Социальная сеть – набор узлов (или членов сети),
которые связаны друг с другом отношениями одного
или более типов
Пример: Когда люди перемещаются с одного места на другое,
они приносят с собой не только свои знания и умения, но и
свои контакты
Понимание связей между людьми, группами,
государствами и негосударственными
объединениями может помочь пониманию того, какое
влияние они оказывают друг на друга
66
ИНФОРМАЦИОННАЯ ПОДДЕРЖКА КРИЗИСНОГО РЕАГИРОВАНИЯ
WWW.CRISISDATA.INFO
Шаг 1: определить границы сети
Шаг 2 : определить связи между узлами сети или ее
членами
Клю чевой пункт : члены сети оказывают воздействие друг
на друга для оказания влияния на действия друг друга.
Поэтому важно понять, как они связаны друг с другом
Клю чевой пункт : необходимо понимать силу и природу
связей в сети, чтобы понять, как она функционирует
Эт о позволяет нам идентифицировать социальные сети ,
важные для понимания проблемы, о которых мы не знали
Чт о дает возможност ь сравнить разные сети,
идентифицировать, те пункты, где они перекрывают друг
друга и анализировать сравнительные уровни
сплоченности сетей
67
ИНФОРМАЦИОННАЯ ПОДДЕРЖКА КРИЗИСНОГО РЕАГИРОВАНИЯ
WWW.CRISISDATA.INFO
Бесплатные и платные программные продукты для анализа
социальных сетей:
Orgnet.com
i2 Analyst Notebook
Palantir Technologies
Агрегаторы новостей Silobreaker и EMM News также
содержат некоторые бесплатные инструменты для
анализа социальных сетей
Теория анализа социальных сетей была применена для
анализа террористических сетей в следующих работах:
Uncloaking Terrorist Networks Валдиса Кребса
EScience Article
68
ИНФОРМАЦИОННАЯ ПОДДЕРЖКА КРИЗИСНОГО РЕАГИРОВАНИЯ
WWW.CRISISDATA.INFO
Карта сети i2, созданной для целей расследования
деятельности ОПГ :
(Взято из http://www.intelligenceanalysis.net )
69
ИНФОРМАЦИОННАЯ ПОДДЕРЖКА КРИЗИСНОГО РЕАГИРОВАНИЯ
WWW.CRISISDATA.INFO
Using Facebook as a Data Source and Platform for e-Researching
Social Networks, Robert Ackland
Академическое исследование по анализу Facebook
Social Network Analysis: An Introduction, Alexandra Marin and
Barry Wellman
Введение в теорию анализа социальных сетей
The Changing Nature of Suicide Attacks, Ami Pedahzur and Arie
Perliger
Исследование по тому, как социальные сети могут определять
природу терактов с участием смертников
70
ИНФОРМАЦИОННАЯ ПОДДЕРЖКА КРИЗИСНОГО РЕАГИРОВАНИЯ
WWW.CRISISDATA.INFO
Ключевые
характеристики
71
ИНФОРМАЦИОННАЯ ПОДДЕРЖКА КРИЗИСНОГО РЕАГИРОВАНИЯ
WWW.CRISISDATA.INFO
http://www.guardian.co.uk/tone/blog
http://blogs.news.sky.com/editors
http://atwar.blogs.nytimes.com/
ИНФОРМАЦИОННАЯ ПОДДЕРЖКА КРИЗИСНОГО РЕАГИРОВАНИЯ
72
WWW.CRISISDATA.INFO
Блог посты
Биографическая
информация
о блоггере
Комментарии о
Блог посте
73
ИНФОРМАЦИОННАЯ ПОДДЕРЖКА КРИЗИСНОГО РЕАГИРОВАНИЯ
WWW.CRISISDATA.INFO
http://allthingsct.wordpress.com/
74
ИНФОРМАЦИОННАЯ ПОДДЕРЖКА КРИЗИСНОГО РЕАГИРОВАНИЯ
WWW.CRISISDATA.INFO
Ключевые
характеристики
75
ИНФОРМАЦИОННАЯ ПОДДЕРЖКА КРИЗИСНОГО РЕАГИРОВАНИЯ
WWW.CRISISDATA.INFO
76
ИНФОРМАЦИОННАЯ ПОДДЕРЖКА КРИЗИСНОГО РЕАГИРОВАНИЯ
WWW.CRISISDATA.INFO
Искать в Twitter можно по адресу: http://search.twitter.com
Поиск Twitter использует систему тэгов и операторов :
twitter search содержит и "twitter», и "search". Это оператор по
умолчанию.
" happy hour" содержит точную фразу "happy hour".
love OR hate содержащее или "love" или "hate" (или оба).
beer -root содержащее "beer" но не "root".
"happy hour" near:"san francisco" содержащее точную фразу "happy
hour" и послано из места поблизости "san francisco".
near:NYC within:15mi послано из радиуса 15 миль от "NYC".
superhero since:2010-02-07 содержащее "superhero" и посланное
после "2010-02-07" (год-месяц-число).
ftw until:2010-02-07 содержащее "ftw" посланное до "2010-02-07".
77
ИНФОРМАЦИОННАЯ ПОДДЕРЖКА КРИЗИСНОГО РЕАГИРОВАНИЯ
WWW.CRISISDATA.INFO
• Операторы поиска, специфичные для Twitter:
#haiku содержащий hashtag "haiku".
from:alexiskold послано от пользователя "alexiskold".
to:techcrunch послано пользователю "techcrunch".
@mashable лицо-референт "mashable".
movie -scary :) содержит "movie", но не "scary", и с
положительным отношением.
flight :( содержит "flight" с негативным отношением.
traffic ? Содержит "traffic" и вопрос.
hilarious filter:links содержит "hilarious" с имеет ссылку на
URLы.
news source:twitterfeed содержит "news" и введено с помощью
TwitterFeed
78
ИНФОРМАЦИОННАЯ ПОДДЕРЖКА КРИЗИСНОГО РЕАГИРОВАНИЯ
WWW.CRISISDATA.INFO
“Необдуманные
т вит ы ст оят
жизней.”
Times Online, 24 января,
2010
http://
technology.timesonline.co.
uk/tol/news/
tech_and_web/the_web/
article6999928.ece
79
ИНФОРМАЦИОННАЯ ПОДДЕРЖКА КРИЗИСНОГО РЕАГИРОВАНИЯ
WWW.CRISISDATA.INFO
Землетрясение на
Гаити, январь 2010
После выборов в Иране,
июнь 2009
80
ИНФОРМАЦИОННАЯ ПОДДЕРЖКА КРИЗИСНОГО РЕАГИРОВАНИЯ
WWW.CRISISDATA.INFO
Гаитяне с мест
предоставляли взгляды
очевидцев для
международных
новостийных агентств.
Звезды через Twitter
призывали делать
пожертвования
http://
www.timesonline.co.uk/
tol/news/world/
us_and_americas/
article6986301.ece
81
ИНФОРМАЦИОННАЯ ПОДДЕРЖКА КРИЗИСНОГО РЕАГИРОВАНИЯ
WWW.CRISISDATA.INFO
Иранское правительство, ограничив
деятельность иностранных СМИ,
заставило их полагаться на
информацию из «новых»
новостийных источников, в
особенности Twitter
Использование инструментов,
предоставляемых социальными
сетями, помогало оппозиции
организовывать протесты
Однако, в результате в заголовках
новостей мировых СМИ
доминировало именно
использование Twitter, а не сами
протесты.
http://www.cnn.com/2009/WORLD/meast/06/14/
iran.protests.twitter/index.html
82
ИНФОРМАЦИОННАЯ ПОДДЕРЖКА КРИЗИСНОГО РЕАГИРОВАНИЯ
WWW.CRISISDATA.INFO
Ресурсы социальных сетей
были названы
американским
правительством важными
инструментами сбора
тактических разведданных
Однако существуют
потенциальные проблемы
с надежностью данных,
собираемых таким
методом
http://us.cnn.com/2009/TECH/06/16/iran.twitter.facebook/
index.html
83
ИНФОРМАЦИОННАЯ ПОДДЕРЖКА КРИЗИСНОГО РЕАГИРОВАНИЯ
WWW.CRISISDATA.INFO
• Хотя сам твит и представляет из себя просто 140
знаков на экране компьютера, он содержит гораздо
больше скрытых данных, доступных девелоперам
Twitter.
• This provides data relating to location of the Tweeter,
including any Geodata that is associated with them.
84
ИНФОРМАЦИОННАЯ ПОДДЕРЖКА КРИЗИСНОГО РЕАГИРОВАНИЯ
WWW.CRISISDATA.INFO
• Twitter и блоги из конкретных стран и регионов могут
дать важную информацию о том, что там происходит.
• Twitter и блоги могут быть полезным источником, но
нахождение релевантной и надежной информации в
этих системах достаточно трудно.
• Эти источники чаще дают мнения, чем факты, и
могут помочь пониманию широкого контекста
региональных проблем, которые мы исследуем.
• Они также могут дать точку зрения на события в
стране, которая не дает возможности легкого
получения информации.
• Однако, эта точка зрения может быть ограничена
конкретными городами или областями.
85
ИНФОРМАЦИОННАЯ ПОДДЕРЖКА КРИЗИСНОГО РЕАГИРОВАНИЯ
WWW.CRISISDATA.INFO
Полезность?
• Новые» и социальные СМИ могут дать полезную дополнительную информацию,
дополняющую процесс сбора данных, в особенности, что касается полевых исследований и
мнений
• witter может также дать полезные средства для сбора, фильтрации и распространения
общей новостийной информации
Надежность и релевантность
•
сновная слабость данного типа информации – недостаток надежности, поскольку
практически отсутствуют механизмы контроля за размещением этой информации в системе
• оскольку «новые» и социальные СМИ рассчитаны, прежде всего, на связь индивидов,
нахождение новой и релевантной информации вопросам политики, национальной
безопасности, обороны или даже коммерческим вопросам достаточно трудно
86
ИНФОРМАЦИОННАЯ ПОДДЕРЖКА КРИЗИСНОГО РЕАГИРОВАНИЯ
WWW.CRISISDATA.INFO
Векторы надежности
ИНФОРМАЦИОННАЯ ПОДДЕРЖКА КРИЗИСНОГО РЕАГИРОВАНИЯ
87
WWW.CRISISDATA.INFO
Два ключевых вопроса для аналитики открытой
информации:
Насколько надежна эта информация?
Насколько релевантна эта информация?
Ответы на эти вопросы влияют как на процесс сбора
информации, так и на конечный продукт, который мы
получим в результате анализа.
88
ИНФОРМАЦИОННАЯ ПОДДЕРЖКА КРИЗИСНОГО РЕАГИРОВАНИЯ
WWW.CRISISDATA.INFO
Откуда мы берем информацию?
Информационное поле
89
ИНФОРМАЦИОННАЯ ПОДДЕРЖКА КРИЗИСНОГО РЕАГИРОВАНИЯ
WWW.CRISISDATA.INFO
90
ИНФОРМАЦИОННАЯ ПОДДЕРЖКА КРИЗИСНОГО РЕАГИРОВАНИЯ
WWW.CRISISDATA.INFO
91
ИНФОРМАЦИОННАЯ ПОДДЕРЖКА КРИЗИСНОГО РЕАГИРОВАНИЯ
WWW.CRISISDATA.INFO
92
ИНФОРМАЦИОННАЯ ПОДДЕРЖКА КРИЗИСНОГО РЕАГИРОВАНИЯ
WWW.CRISISDATA.INFO
93
ИНФОРМАЦИОННАЯ ПОДДЕРЖКА КРИЗИСНОГО РЕАГИРОВАНИЯ
WWW.CRISISDATA.INFO
94
ИНФОРМАЦИОННАЯ ПОДДЕРЖКА КРИЗИСНОГО РЕАГИРОВАНИЯ
WWW.CRISISDATA.INFO
95
ИНФОРМАЦИОННАЯ ПОДДЕРЖКА КРИЗИСНОГО РЕАГИРОВАНИЯ
WWW.CRISISDATA.INFO
96
ИНФОРМАЦИОННАЯ ПОДДЕРЖКА КРИЗИСНОГО РЕАГИРОВАНИЯ
WWW.CRISISDATA.INFO
Релевантность информации
Шаблон для построения вектора
надежности
Надежность информации
97
ИНФОРМАЦИОННАЯ ПОДДЕРЖКА КРИЗИСНОГО РЕАГИРОВАНИЯ
WWW.CRISISDATA.INFO
Релевантность информации
Пример вектора надежности
Надежность информации
98
ИНФОРМАЦИОННАЯ ПОДДЕРЖКА КРИЗИСНОГО РЕАГИРОВАНИЯ
WWW.CRISISDATA.INFO
• Построение вектора надежности – инструмент, который
может использоваться, чтобы помочь разведаналитику
сравнить качество различных источников.
• Процесс оценки источников позволяет аналитику
собирать надежную и полезную информацию.
99
ИНФОРМАЦИОННАЯ ПОДДЕРЖКА КРИЗИСНОГО РЕАГИРОВАНИЯ
WWW.CRISISDATA.INFO
Анализ данных
ИНФОРМАЦИОННАЯ ПОДДЕРЖКА КРИЗИСНОГО РЕАГИРОВАНИЯ
100
WWW.CRISISDATA.INFO
101
ИНФОРМАЦИОННАЯ ПОДДЕРЖКА КРИЗИСНОГО РЕАГИРОВАНИЯ
WWW.CRISISDATA.INFO
Информация = обработанные данные
Разведы вательны й продукт = взаимосвязанная
информация
Данны
Информация
Разв
102
ИНФОРМАЦИОННАЯ ПОДДЕРЖКА КРИЗИСНОГО РЕАГИРОВАНИЯ
WWW.CRISISDATA.INFO
•Анализ имеет место на всех этапах разведывательного цикла:
•
•
•
Определение процесса сбора
Оценка надежности источников
Заключения по поводу сбалансированности информации
• редставление информации самой по себе может только
привести к вопросу: “И что?”
•Анализ – способ, посредством которого мы делаем собранную
информацию полезной для конечного пользователя.
103
ИНФОРМАЦИОННАЯ ПОДДЕРЖКА КРИЗИСНОГО РЕАГИРОВАНИЯ
WWW.CRISISDATA.INFO
“Сенат ор, мы не имели об эт ом ни
малейшег о
предст авления” (Директ ор ЦРУ
Джордж Тенет )
11 мая 1998 года Индия
провела испытания трех ядерных
устройств – первое испытание за
20 лет. Несмотря на публичные
заявления индийского
правительства о намерении
провести данные испытания, ЦРУ
проглядело данное важное
геополитическое событие и было к
нему не готово
104
ИНФОРМАЦИОННАЯ ПОДДЕРЖКА КРИЗИСНОГО РЕАГИРОВАНИЯ
WWW.CRISISDATA.INFO
Сенатский комитет по разведке был удивлен таким ходом
событий и директор ЦРУ назначил адмирала Дэвида
Джеримаю, провести расследование, почему ЦРУ
прогнозировало, что эти испытания не будут проведены.
Исследования доступной открытой информации до испытаний
показали сложную картину, «ведущую ко множеству
аналитических проблем» (Congressional Report)
Это не было неудачей в сборе данных, а в их анализе.
Аналитики оказались неспособны преодолеть собственную
познавательную предвзятость и понять, что может случиться.
105
ИНФОРМАЦИОННАЯ ПОДДЕРЖКА КРИЗИСНОГО РЕАГИРОВАНИЯ
WWW.CRISISDATA.INFO
106
ИНФОРМАЦИОННАЯ ПОДДЕРЖКА КРИЗИСНОГО РЕАГИРОВАНИЯ
WWW.CRISISDATA.INFO
107
ИНФОРМАЦИОННАЯ ПОДДЕРЖКА КРИЗИСНОГО РЕАГИРОВАНИЯ
WWW.CRISISDATA.INFO
108
ИНФОРМАЦИОННАЯ ПОДДЕРЖКА КРИЗИСНОГО РЕАГИРОВАНИЯ
WWW.CRISISDATA.INFO
Альтернативные методы анализа:
•
•
•
Адвокат дьявола
Множественная защита
Метод конкурирующих гипотез
Эти техники разработаны для подвергания сомнению
аналитических точек зрения и более объективного
подхода к проблемам.
Они могут повлиять на то, как специалист по сбору
информации выбирает свои источники и
информацию из этих источников.
109
ИНФОРМАЦИОННАЯ ПОДДЕРЖКА КРИЗИСНОГО РЕАГИРОВАНИЯ
WWW.CRISISDATA.INFO
Замдиректора ЦРУ, 2004:
“Я хотел бы обратить внимание на опасность
унаследованных предположений. Возможно это один
из наиболее важных аспектов нашей работы,
требующий повышенного внимания… Каким образом
мы можем быть уверенны, что не принимаем на веру
предположения, которые недостаточно проверены?”
111
ИНФОРМАЦИОННАЯ ПОДДЕРЖКА КРИЗИСНОГО РЕАГИРОВАНИЯ
WWW.CRISISDATA.INFO
Групповое мышление
Познавательная
предвзятость
112
ИНФОРМАЦИОННАЯ ПОДДЕРЖКА КРИЗИСНОГО РЕАГИРОВАНИЯ
WWW.CRISISDATA.INFO
Ввел в оборот термин «познавательная предвзятость» в
1972.
113
ИНФОРМАЦИОННАЯ ПОДДЕРЖКА КРИЗИСНОГО РЕАГИРОВАНИЯ
WWW.CRISISDATA.INFO
114
ИНФОРМАЦИОННАЯ ПОДДЕРЖКА КРИЗИСНОГО РЕАГИРОВАНИЯ
WWW.CRISISDATA.INFO
115
ИНФОРМАЦИОННАЯ ПОДДЕРЖКА КРИЗИСНОГО РЕАГИРОВАНИЯ
WWW.CRISISDATA.INFO
• Адвокат дьявола (обычно) человек, который
выступает против идеи или политики ради самого
спора, а не в результате собственных убеждений
• Намерение адвоката дьявола – быть намеренно
провокационным с целью подвергнуть оценке
общепризнанные точки зрения, стратегии, планы,
концепции, программы, проекты, заключения и
политические позиции
116
ИНФОРМАЦИОННАЯ ПОДДЕРЖКА КРИЗИСНОГО РЕАГИРОВАНИЯ
WWW.CRISISDATA.INFO
117
ИНФОРМАЦИОННАЯ ПОДДЕРЖКА КРИЗИСНОГО РЕАГИРОВАНИЯ
WWW.CRISISDATA.INFO
Аналитический прием, призванный помочь лицам, принимающим
решения, состоящий из:
• Структурированных дебатов и защиты противоположных
точек зрения перед принятием решения
• Презентации альтернативных точек зрения специально
назначенными членами группы или подгруппами
• Рассмотрение вопроса, идентифицируя проблемы,
генерируя и оценивая альтернативные пути решения и
выбирая наилучшее решение
Стимулирует различные мнения внутри группы для облегчения
рассмотрения альтернативных точек зрения и нахождения в
конечном итоге консенсусного решения
118
ИНФОРМАЦИОННАЯ ПОДДЕРЖКА КРИЗИСНОГО РЕАГИРОВАНИЯ
WWW.CRISISDATA.INFO
119
ИНФОРМАЦИОННАЯ ПОДДЕРЖКА КРИЗИСНОГО РЕАГИРОВАНИЯ
WWW.CRISISDATA.INFO
•
•
•
Анализ конкурирующих гипотез требует от аналитика явным
образом идентифицировать все возможные альтернативы и
сравнить их друг с другом даже если некоторые из них и не
представляются разумными
Процесс позволяет аналитикам преодолеть когнитивные
ограничения
Анализ начинается с мозгового штурма для идентификации
полного набора существующих альтернатив
120
ИНФОРМАЦИОННАЯ ПОДДЕРЖКА КРИЗИСНОГО РЕАГИРОВАНИЯ
WWW.CRISISDATA.INFO
•
Данная техника была впервые предложена в 1970 году
аналитиком ЦРУ Ричардом Хеуэром в 8 главе его книги
«Психология анализа разведданных».
•
Согласно ЦРУ, метод анализа конкурирующих гипотез –
инструмент для помощи преодоления когнитивных ограничений
аналитиков.
•
Анализ конкурирующих гипотез – восьмиступенчатая
процедура, основывающаяся на когнитивной психологии,
анализе решений и других научных методах.
121
ИНФОРМАЦИОННАЯ ПОДДЕРЖКА КРИЗИСНОГО РЕАГИРОВАНИЯ
WWW.CRISISDATA.INFO
122
ИНФОРМАЦИОННАЯ ПОДДЕРЖКА КРИЗИСНОГО РЕАГИРОВАНИЯ
WWW.CRISISDATA.INFO
• Со времени изобретения метода он был
модифицирован, усовершенствован и применялся
для новых областей анализа.
• Было создано специализированное программное
обеспечения для проведения такого анализа.
• Пример: http://www2.parc.com/istl/projects/ach/ach.html
• ACH 2.0 является одним из примеров такого ПО,
созданного исследовательским центром Palo Alto, в
сотрудничестве с изобретателем метода Ричардом
Хеуэром.
123
ИНФОРМАЦИОННАЯ ПОДДЕРЖКА КРИЗИСНОГО РЕАГИРОВАНИЯ
WWW.CRISISDATA.INFO
124
ИНФОРМАЦИОННАЯ ПОДДЕРЖКА КРИЗИСНОГО РЕАГИРОВАНИЯ
WWW.CRISISDATA.INFO
Рассмотрение планов, политических курсов и точек зрения с
целью обнаружить уязвимости и предложить альтернативные
точки зрения и сценарии
Ролевые игры с участием условного противника во время
оперативного планирования или обучения для лучшего
понимания намерений и возможностей противника и
обнаружения уязвимых мест в собственных стратегиях
125
ИНФОРМАЦИОННАЯ ПОДДЕРЖКА КРИЗИСНОГО РЕАГИРОВАНИЯ
WWW.CRISISDATA.INFO
126
ИНФОРМАЦИОННАЯ ПОДДЕРЖКА КРИЗИСНОГО РЕАГИРОВАНИЯ
WWW.CRISISDATA.INFO
•
•
•
Метод нацелен на выделение движущих сил будущего и того,
как эти движущие силы могут эволюционировать со временем.
Может принимать форму построения сценариев
Не является предсказанием будущего. Скорее это механизм
понимания ключевых неопределенностей
127
ИНФОРМАЦИОННАЯ ПОДДЕРЖКА КРИЗИСНОГО РЕАГИРОВАНИЯ
WWW.CRISISDATA.INFO
Download