Контент-анализ в гуманитарных науках

advertisement
1
МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ
ГОУ ВПО Томский государственный университет
УТВЕРЖДАЮ
Декан исторического факультета
________________В.П. Зиновьев
«____»___________________20___г.
КОНТЕНТ-АНАЛИЗ В ГУМАНИТАРНЫХ НАУКАХ
Рабочая программа
Направление 030600.62 – История
Направление 034700.62 – Документоведение и архивоведение
Квалификация (степень) выпускника
Бакалавр
Форма обучения
очная
Томск
2011
2
1. Цели освоения учебной дисциплины
Выработать навыки аналитических компетенций в области формализации обработки
неструктурированной текстовой информации в различных предметных областях.
Сформировать понимание междисциплинарных теоретических основ контент-анализа,
Дать представление о новейших тенденциях применения кантент-анализа в различных
отраслях профессиональной информационной деятельности,
Познакомить с возможностями использования компьютерных экспертных систем
автоматизированной обработки текстовой информации.
2. Место учебной дисциплины в структуре ООП бакалавриата
Данная дисциплина входит в раздел СД.Ф.05 – Цикл специальных дисциплин.
Федеральный компонент.
Для изучения дисциплины необходимы компетенции, сформированные у обучающихся в
средней общеобразовательной школе по математике, русскому языку, литературе и
обществознанию.
Контент-анализ является полидисциплинарным методом, интегрируя в себе теории и
методики многих гуманитарных дисциплин на базе прикладного использования
математической статистики и лингвистики для изучения любых текстов. В связи с этим,
дисциплина «Контент-анализ в гуманитарных науках», преподаваемай на последнем годе
бакалавриата, призвана завершить и обобщить цикл изучения всех предшествующих курсов с
точки зрения использования прикладных методик для решения практических задач обработки
текстовой информации.
Полученные знания подготавливают к более глубокому освоению профессиональных
компетенций, связанных с услугами аналитического консалтинга, мониторинга СМИ,
управления документооборотом, разработки баз данных в области гуманитарных наук.
3. Компетенции
дисциплины
обучающегося,
формируемые
в
результате
освоения
В результате освоения дисциплины студент должен:
Знать:
 Основы формализации и алгоритмизации аналитических процедур;
 Понятийно-терминологический аппарат, связанный с неструктурированной и
структурированной текстовой информацией;
 Особенности разных видов контент-анализа;
 Современные направления использования контент-анализа.
Уметь:
 Соблюдать требования научной строгости в анализе больших массивов текстов;
 Использовать различные методики качественно-количественного анализа текстовых
архивов;
 Применять полученные знания о контент-анализе в собственной предметной
исследовательской области;
 Самостоятельно осваивать практические прикладные процедуры «ручного» и
автоматизированного контент-анализа;
3
Данная
дисциплина
способствует
формированию
следующих
компетенций,
предусмотренных ФГОС-3 по направлению ВПО 030600 – История, 034700 –
Документоведение:
А) Общекультурные компетенции (ОК):
- Владеет культурой мышления; способность к восприятию, анализу, обобщению
информации, постановке целей и путей ее достижения (ОК-1);
- Стремится к саморазвитию, повышению квалификации и мастерства, способен изменять
при необходимости профиль своей профессиональной деятельности, способен к социальной
адаптации (ОК-6);
- Владеет способностью использовать в познавательной и профессиональной деятельности
базовые знания основ информатики, элементы естественнонаучного и математического
знания (ОК-13)
Б) Профессиональные компетенции (ПК):
Общепрофессиональные:
- Владеет способностью использовать теоретические знания и методы исследования на
практике (ПК-2);
- Владеет базовыми знаниями в области информационных систем (языки и программные
алгоритмы, компьютерный практикум) (ПК-4).
Научно-исследовательские:
- Владеет основами информационно-аналитической деятельности и способностью их
применить в профессиональной сфере (ПК-10);
- Владеет способностью выявлять и отбирать документы для разных типов и видов
публикаций (ПК-21);
- Владеет способностью вести научно-методическую работу в государственных,
муниципальных архивах и архивах организаций (ПК-22).
Технологические:
- Владеет способностью совершенствовать технологии документационного обеспечения
управления и архивного дела на базе использования средств автоматизации (ПК-38);
Проектные:
- Владеет принципами и методами упорядочения состава документов и информационных
показателей (ПК-44).
4
2
2
1
2
2
2
1
5
2
2
1
7
2
2
5. Метод интент-анализа
1
8
2
2
6. Матрицы данных и
статистические методы в контентанализе
1
4
1
1
2
7. Прикладные задачи и методики
частотного контент-анализа
1
3
1
1
2
8. Прикладные задачи и методики
семантического контент-анализа
1
6
1
1
2
1
9
2
2
1
10
1
2
2. Принципы частотного контентанализа (манифестного кодирования)
3. Принципы семантического
контент-анализа (латентного
кодирования)
4. Метод контекстно-тематического
анализа
9. Использование логических и
статистических функций в офисных
компьютерных приложениях для
автоматизации контент-анализа
10. Компьютерные экспертные
системы технологий «data mining» и
«text mining»
1
Контрольные работы
лекции
1
1. Вводное знакомство с методом
контент-анализа текстов
С
Р
С
Контрольные работы,
проектное исследование
Неделя семестра
1
Раздел дисциплины
Практические
занятия
Семестр
№2. Методические и прикладные
аспекты контент-анализа
№1. Теоретические аспекты
контент-анализа
Номер и
название
тематического
модуля
Виды
учебной
работы
(в час.)
В том числе
Формы текущего контроля
успеваемости
(по неделям)
4. Структура и содержание учебной дисциплины
Общая трудоемкость дисциплины составляет 2 зачетных единицы (по1-й на каждый
тематический модуль), 20 часов (по 10 часов на каждый тематический модуль).
5
5. Образовательные технологии
Неимитационные методы обучения:
 Технология лекции-визуализации используется по всем темам спецкурса. Лекциявизуализация учит студента преобразовывать устную и письменную информацию в визуальную
форму, для более глубокого понимания сути изучаемого материала и его лучшего запоминания.
Кроме того, инфографика – главный способ отображения результатов контент-анализа. В связи
с этим демонстрация образцов визуализации данных и задания на самостоятельную
оперативную визуализацию имеют также прикладную цель освоения технологических навыков.
В ходе показа авторских слайд-презентаций, посвящённых теории и практике контент-анализа,
значительная часть тезисов или вопросов сопровождается постепенным поэлементным
демонстрированием образцов инфографики (схемы, диаграммы, SmartArt). На основе этих
образцов студентам предлагается в их конспектах графически отображать ту часть лекционного
материала, которая, даётся только в устной форме и текстовом виде (на слайдах). Авторские
образцы инфографики для вводной лекции показаны на сайте ИФ ТГУ по адресу
http://klio.tsu.ru/content-analysis.pps. В рамках учебной дисциплины технология лекциивизуализации должна формировать следующие компетенции: ОК-1, ОК-6, ПК-10.
 Технология проблемной лекции используется по всем темам учебного Модуля №2.
«Методические и прикладные аспекты контент-анализа». Проблемная лекция начинается с
вопросов, с постановки практических проблем обработки неструктурированной или
слабоструктурированной текстовой информации. Эти проблемы студенты с помощью
преподавателя должны решить в ходе изложения материала. Лекция строится таким образом,
что деятельность студента по ее усвоению приближается к поисковой, исследовательской.
Обязателен диалог преподавателя и студентов. В рамках учебной дисциплины технология
проблемной лекции должна формировать следующие компетенции: ОК-1, ОК-13, ПК-2, ПК-10,
ПК-21, ПК-44.
Имитационные методы обучения:
Практические задания для тематического модуль №1. «Теоретические аспекты контентанализа» для получения первой зачётной единицы.
 Методологический анализ научной статьи или монографии, с описанием применения и
результатов контент-анализа. Статья должна быть найдена студентом самостоятельно по
библиографическим обзорам. Методологический анализ должен формировать следующие
компетенции: ОК-1, ОК-6, ПК-2, ПК-10, ПК-21. Анализ должен проводиться по следующим
критериям:
1. Объект исследования: определить, какой конкретный текст или выборка текстов
анализируется в исследовании.
2. Цели и задачи, связанные предметной областью.
3. Учитываемые и анализируемые лингвистические единицы текста.
4. Учитываемые единицы счёта, относительно которых выявляется встречаемость
лингвистических или семантических единиц текста.
5. Внетекстовые явления предметной области базовой дисциплины (исторические,
психологические, социальные, литературные, политические и др.), отождествляемые с
учитываемыми лингвистическими единицами или выводимые из них.
6. Вид контент-анализа и обоснование использования именно этого вида.
7. Описание (или моделирование в случае отсутствия описания) матрицы данных, на
которой основано исследование.
8. Описание и обоснование использованных математических методов.
9. Описание приведённых либо возможных форм и способов представления эмпирических
числовых результатов контент-анализа.
10. Обобщающие выводы и выявленные закономерности для предметной области базовой
дисциплины.
6

Составление тематического тезауруса-классификатора единиц контент-анализа для
предложенной преподавателем комбинации выборки текстов любого жанра, дискурсивнолингвистической тенденции и предметно-тематической области. Примеры и образцы
тезаурусов-классификаторов демонстрируются преподавателем на лекциях. Это задание
должно формировать следующие компетенции: ОК-1, ОК-6, ПК-2, ПК-21, ПК-22, ПК-44.
Практические задания для тематического модуля №2. «Методические и прикладные
аспекты контент-анализа» для получения второй зачётной единицы.
 Разработка проекта контент-аналитического исследования (исследовательской
модели) изучения выборки однотипных текстов (сообщений СМИ и публицистики,
политических речей и заявлений, архивных документов или текстов любого иного типа и
жанра). Выборка может, как собираться студентом (по желанию), так и предлагаться
преподавателем. В случае выбора источниковой базы студентом, она должна быть связана с
темой курсовой работы. Этапы и пункты проекта соответствуют критериям
методологического анализа научной статьи или монографии из учебного тематического
модуля №1. Кроме этого, обязательна презентации и разбор пробного примера карточки
фиксации единиц контент-анализа для единицы счёта (одного небольшого текста или
фрагмента большого текста). Это задание должно формировать следующие компетенции:
ОК-1, ОК-13, ПК-2, ПК-10, ПК-21, ПК-22, ПК-44.
 Автоматизация контент-анализа в офисных компьютерных приложениях c
использованием макросов, логических и статистических функций, элементов управления
GUI. С помощью средств автоматизации нужно сгенерировать матрицу данных контентанализа выборки тектов, сгенерировать таблицы и графики, с обобщающие результаты
анализа, а затем кратко проанализировать статистические характеристики и параметры шкал
данных. Выборка текстов должна быть обязательно связана с темой курсовой работы. Это
задание должно формировать следующие компетенции: ОК-13, ПК-4, ПК-38, ПК-44.
 Освоение и аннотированное описание компьютерной экспертной контентаналитической программы из предложенного списка Интернет-ресурсов (см. пример
списка по адресу http://academic.csuohio.edu/kneuendorf/content/cpuca/ccap.htm ). Это задание
призвано обобщить все знания, полученные в учебно-тематическом модуле №2, и должно
формировать следующие компетенции: ОК-6, ОК-13, ПК-10, ПК-38.
Оценочные средства для текущего контроля успеваемости.
Для получения зачёта необходимо выполнить все контрольные задания на уровне не
ниже удовлетворительного (минимально возможный допустимый уровень знаний). В случае
если большинство задание будет выполнено на «отлично с плюсом» (выдающийся уровень
знаний, превышающий объем обязательного материала, с творческим подходом к дисциплине),
для получения зачёта может быть необязательным выполнения одного из заданий (по выбору
студента).
7
6. Учебно-методическое и информационное обеспечение дисциплины
Основная литература:
1. Аверьянов Л.Я. Контент-анализ. М., 2007
2. Баранов А.Н. Введение в прикладную лингвистику. М., 2001
3. Белянин В.П. Психолингвистика: Учебник. М., 2003
4. Ермаков А.Е. Автоматизация онтологического инжиниринга в системах извлечения знаний
из текста // Компьютерная лингвистика и интеллектуальные технологии: труды
Международной конференции Диалог'2008. М., 2008
5. Зверев В.М. Социологическое прочтение философских идей России XVIII века: контентанализ. С.-Пб., 1998
6. Здравомыслов А.Г. Немцы о русских. Контент-анализ. М., 2003
7. Зильберт Б.А. Социопсихолингвистическое исследование текстов радио, телевидения, газет.
Саратов, 1986
8. Кузнецов И.Н. Информация: сбор, защита, анализ. Учебник по информационноаналитической работе. М., 2001
9. Курилович Н.В. Контент-анализ: логика развития метода // Методология исследования
политического дискурса: актуальные проблемы содержательного анализа общественнополитических текстов. Вып. 2. Мн.: БГУ, 2000
10. Латынов В.В. Исследование социальных представлений методом интент-анализа. //
Языковое сознание: формирование и функционирование. Сб. ст. / Отв. ред. Н.В.
Уфимцева. М., 1998
11. Миронов Б.Н. История в цифрах: Математика в исторических исследованиях. Л., 1991
12. Речевое воздействие в сфере массовой коммуникации / Отв.ред.Ф.М.Березин, Е.Ф.Тарасов.
М., 1990
13. Чураков А.Н. Компьютерный контент-анализ. М.: Институт социологии РАН, 1996
14. Яковлев И. Компьютерные технологии контент-анализа прессы в планировании
президентских избирательных кампаний // Электоральные технологии и президентские
выборы. – Кишинев: CAPTES, 2000
Дополнительная литература:
1.
Аверьянов Л.Я. Контент-анализ. М., 2007
2.
Асеев Ю.А. Фирсов Б.М. Контент-анализ и изучение понимание текста аудиторией //
Иностранная психология. Т.1. №2, 1993
3.
Баранов А. Н., Караулов Ю. Н. Словарь русских политических метафор. М., 1994
4.
Баранов А.Н. Введение в прикладную лингвистику. М., 2001
5.
Барсамов В.А. Контент-анализ газетных материалов (события в Беслане) // Социс №2,
2006
6.
Белянин В.П. Психолингвистика: Учебник. М., 2003
7.
Богомолова Н.Н. Контент-анализ. М., 1992
8.
Бородкин Л.И., Морозова Л.Е. Опыт использования математических моделей и ЭВМ в
текстологических исследованиях // Количественные методы в гуманитарных науках. М.,
1981
9.
Брагина Л.М. Опыт исследования философского трактата XV в. методом количественного
анализа // Математические методы в исторических исследованиях. М., 1972
10. Васильев А.Д. Слово в российском телеэфире: Очерки новейшего словоупотребления. М.,
2003
8
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
28.
29.
30.
31.
32.
33.
34.
Верховская А.И. Методы анализа писем в редакционной работе. М., 1984
Волков С.В. Социальный состав высшего чиновничества Кореи периода Корё (X - XIV
вв.) // Математические методы и ЭВМ в исторических исследованиях. Под. ред.
И.Д.Ковальченко. М., 1985
Давлетшина Н.В. Массивы материалов СМИ как исторический источник по российской
истории новейшего времени // Круг идей: историческая информатика в информационном
обществе.Труды VII конференции АИК. М., 2001
Ильин М.В. Политический дискурс как объект лингвистического анализа // Полис,
2004, №3
Кучумов Д.О. Семантический анализ информационной войны (на примере осетиноингушского конфликта). Дис. канд. полит. наук. Ростов-на-Дону, 2007
Лапшова О.А. Психологическое содержание текста и его оценивание методами интентанализа и психосемантики. Дис. канд. психол. наук.. М., 2003
Ласко М.В. Резвицкая Ж.И. Определение эмоционального состояния методом контентанализа речи // Речь и эмоции. Л., 1975
Луков В.Б., Сергеев В.М. Опыт моделирования мышления исторических деятелей: Отто
Фон Бисмарк, 1866-1876 гг. Вопросы кибернетики. Логика рассуждений и её
моделирование. М., 1983
Лурия А.Р. Язык и сознание. М., 1979
Маджаров А.С. К вопросу о применении контент-анализа к источникам личного
происхождения. // Источниковедение и историография истории Восточной Сибири. –
Иркутск,1982.
Мазырин В.М. Применение методов контент-анализа к материалам прессы //
Количественные методы в гуманитарных науках. М., Изд. МГУ., 1981
Малкина Г.Ю. Контент-анализ автобиографических рассказов в изучении личностных
свойств. Дис. канд. психол. наук. М., 2005
Манаев О.Т.
Опыт контент-анализа альтернативной прессы Белоруссии //
Социологические исследования, 1991. №8.
Мангейм Дж.Б., Рич Р.К. Политология. Методы исследования: Пер. с англ. /
М.: Издательство “Весь Мир”, 1997
Мансуров В.А., Семёнов А.В. «Московский комсомолец»: контент-анализ публикаций о
терактах 2004 года и терроризме // Социс №8, 2007
Математика в изучении средневековых повествовательных источников. М., 1986.
Математические методы и ЭВМ в историко-типологических исследованиях. Сборник
научных статей АН СССР / Отв. ред. И.Д.Ковальченко. М., 1989
Методологические и методические проблемы контент-анализа (Тезисы докладов рабочего
совещания социологов). Выпуск 1. Москва-Ленинград, 1973
Методы анализа документов в социологических исследованиях / Под ред.:
В.Г.Андреенкова, О.М.Масловой. М., 1985
Методы количественного анализа текстов нарративных источников. М., 1983
Мещерякова Э.И. Текст в психодиагностике и консультировании. - Томск: Изд-во Том.
ун-та, 2001
Миронов Б.Н. История в цифрах: Математика в исторических исследованиях. Л., 1991
Можаева Г.В., Мишанкина Н.А. Историко-лингвистический анализ в изучении русской
историографии второй половины XVIII века // Гуманитарная информатика: Сб. статей.
Томск: Изд-во Том. ун-та, 2005.
Налимов В.В. Вероятностная модель языка. О соотношении естественных и
искусственных языков. — М.: Наука, 1974; 2-е изд. — 1979.
9
Негрышев А.А., Мокеева А.В. Аспекты речевого воздействия в радиотекстах "Немецкой
волны" // Актуальные проблемы содержания и методики обучения иностранным языкам.
Владимир, 2001
36. Оберемко О.А. Чикагская традиция и политическая наука Гарольда Ласуэлла //
Социологический журнал, 1994. № 1.
37. Павлова Н.Д. Интент-анализ телеинтервью // Языковое сознание: формирование и
функционирование. Сб. ст. / Отв. ред. Н.В. Уфимцева. М., 1998
38. Паршин П.Б. Об оппозиции системоцентричности и антропоцентричности применительно
к политической лингвистике // Диалог, 2000. № 1 (http://www.dialog21.ru/Archive/2000/Dialogue% 202000-1/229.htm)
39. Почепцов Г. Теория и практика коммуникации. М., 1998
40. Проблемы психологии дискурса (под ред. Павловой Н.Д., Зачесовой И.А.), 2005
41. Расторгуев С.П. Введение в формальную теорию информационной войны. М., 2002.
42. Репьев А.П. «По-ВААЛ-яем дурака, господа!» http://www.repiev.ru/articles/VAAL.htm
43. Речевое воздействие в сфере массовой коммуникации / Отв.ред. Ф.М.Березин,
Е.Ф.Тарасов. М., 1990
44. Романовский Н.В. НЭП, контент-анализ и князь Кропоткин // СОЦИС. 2001. № 3
45. Рыбаков Б.А. Русские летописцы и автор "Слова о полку Игореве". М., 1972
46. Свинцов В. И. Смысловой анализ и обработка текста. М., 1979
47. Семенов В.Е. Применение метода контент-анализа в социально-психологических
исследованиях. Л., 1975
48. Слово в действии. Интент-анализ политического дискурса / Под. ред Ушакова Т.Н.,
Павловой Н.Д. - С.-Пб., 2000
49. Сорокин Ю.А. Психолингвистические аспекты изучения текста. М., 1985
50. Сэлтон Г. Автоматическая обработка, хранение и поиск информации. Нью-Йорк, 1968,
Пер. с англ. М., 1973
51. Топка Р.В. Контент-анализ: семантический или документалистический? Опыт применения
на материале крестьянских наказов от южноукраинских губерний в I Государственную
Думу // Круг идей: историческая информатика в информационном обществе.Труды VII
конференции АИК. М., 2001
52. Федотова Л.Н. Анализ содержания - социологический метод изучения средств массовой
коммуникации. М., 2001
53. Федотова Л.Н. Контент-аналитические исследования средств массовой информации и
пропаганды. М.: Изд-во Моск. ун-та, 1988
54. Французов С.А. Антропонимика Райбуна: опыт количиственного и качественного анализа.
Вестник древней истории. №3 (262). М., 2007
55. Хьетсо Г., Густавсон С., Бекман Б., Гил С. Кто написал "Тихий Дон"? - М., 1989
56. Черепанова И.Ю. Заговор народа. Как создать сильный политический текст. М.: «КСП+»,
2002
57. Чудинов А.П. Россия в метафорическом зеркале: когнитивное исследование политической
метафоры (1991-2000). Екатеринбург, 2001
58. Шумилина Т.В. Методы сбора информации в журналистике. М., 1983
59. Эпштейн М.Н. Информационный взрыв и травма постмодерна // "Русский Журнал" 1998.
http://old.russ.ru/journal/travmp/98-10-08/epsht.htm
60. Ядов В.А. Стратегия социологического исследования. Описание, объяснение, понимание
социальной реальности. М., 1998
61. Язык и моделирование социального взаимодействия. М., 1987
35.
10
Материально техническое обеспечение дисциплины:
Оргтехника: компьютерный класс, проектор, выход в Интернет, авторский комплект
мультимедиа презентаций.
Автор:
Бочаров Алексей Владимирович – кандидат исторических наук, доцент кафедры истории
древнего мира, средних веков и методологии истории ИФ ТГУ
Рецензент:
Ларьков Николай Семёнович – доктор исторических наук, профессор кафедры истории
кафедры истории и документоведения ИФ ТГУ
ТГУ
Программа одобрена на заседании методической комиссии исторического факультета
Председатель комиссии, доцент______________В.Ю. Соколов
Протокол №___ от «___» __________________2010 г.
Download