Этнографический институт Сербской академии наук и искусств

advertisement
Драгана Радоичич
Этнографический институт Сербской
академии наук и искусств (САНУ)
Белград

Проект разработан как стимул к объединению и
взаимному пронизыванию основных, прикладных
и исследований развития в области сербского
языкового и культурного наследия, в целях создать
единное цифровое сокровище знаний о сербском
языке и культуре, которое, при соблюдении
наивысших научных и технологических
стандартов, принсет вклад в сохранение языкового
и культурно-исторического наследия,
модернизацию научной практики в области
этнологии, науки о языке и других гуманитарных
дисциплин и осуществление предпосылок для
цифрового производства знаний в современном
информационном обществе.

Основой проекта является материал собранный в
оцифрованных словарях сербского языка и культуры
(диалектологических, исторических, этимологических,
ономастических, терминологических,
энциклопедических), интегрированный в удобную для
поиска и поддающуюся расширению базу данных,
которую участники в Проекте будут использовать как
основу для разработки междисциплинарного словаря
сербской культуры, в форме инновативного,
мультимедийного, цифрового тезауруса.

Цель проекта – установка цифровой инфраструктуры,
которая позволит исследователям в области
гуманитарных наук общими усилями комбинировать
свои теоретические и полевые исследования и
использовать результаты этих исследований для
создания представительного интернет-портала,
который своей профессиональной неуступчивостью и
тематической всеохватностью будет совершенно
новым видом презентации научной деятельности, и
тем самим будет стимулировать трансфер знаний и
сохранение культурной идентичности Республики
Сербии.

Проект выполнится в рамках трех подпроектов: I
ПРИМЕНЕНИЕ ЛИНГВИСТИЧЕСКИХ
ИССЛЕДОВАНИЙ В РАЗРАБОТКЕ ЦИФРОВОГО
СЛОВАРЯ. Основой является разработка цифровой
лексикографической базы и концептуального словаря,
в котором слова групированы по семантическим
отношениям, с приведением варианта форм из
сербских диасистем и сведений энциклопедического
типа.

Фазы: разработка программного обеспечения для ввода
лексикографических данных и формирование базы путем
ввода первого круга выбранных источников; семантическая
сегментация базы и определение лемм и лексического
фонда в области материальной и духовной культуры;
этимологическая обработка выбранных лексем
(фонетический, словообразовательный и семантический
анализ, установление происхождения); формирование
систем этимологических гнезд; словообразовательносемантический анализ диалектных лексем,
морфофонематической формы, мотивирующей основы и
языкового расслаивания согласно региональному и
общественному употреблению и регистрам, анализ
контекста.

Организация тезауруса: терминология сербской
духовной культуры: космогоническая, онтологическая,
мифологическая, религиозная, демонологическая,
обрядовая, гносеологическая, этическая и
эстетическая терминология; терминология социальной
культуры: правового обычая, родственных отношений
и народных инстутов, определения идентитичности
(национальные, местные, религиозные, гендерные).
Терминология сербской материальной культуры:
зоологические и ботанические термины, народная
медицина, народная экономика, ремесла и умения.

Взаимное связывание архаичной и диалектной
терминологической лексики с терминологиями
современной культуры (соовременный литературный
язык, городские диалекты, социолекты и остальные
разновидности языка). Связывание лингвистических и
этнологических исследований установлением типа
отношений реалия – номинация. II ЭТНОЛОГИЧЕСКОЕ
И АНТРОПОЛОГИЧЕСКОЕ ТОЛКОВАНИЕ
ТРАДИЦИЙ. Подпроект сосредоточен на декодировании
и анализе традиции и идентичностей в Сербии и регионе
– моделей и стратегий, с помощью которых они
конструируются, хранятся и трансформируются под
влиянием исторических и общественных факторов.

Обработанные и истолкованые данные о культурном
наследии и практиках идентичности будут
представлены в форме энцикопедического произведения
терминов и научных трудов, интегрированных в
интернет-библиотеке.

Исследоваться будут: концепции традиции в прошлом и
настоящем: жизненные обычаи, обряды и ритуалы, мифология,
религия и новая религиозность; концептуализация практики
идентичности и культурных практик в рамках сельской и
городской культур и субкультур на местном, национальном и
региональном уровнях; гендарные идентичности, СМИ и
практики идентичности; дуализм и параллелизм правового
обычая и гражданского права, народная и альтернативная
медицина, демография и репродуктивные стратегии,
коллективные модели памяти; модели культурной и
морфологической вариации в различных популяциях, объем
переменных и вариаций культурных и биологических
характеристик, анализ их породивших общественных и
микроэволюционных процессов – особенно миграций.

III ОЦИФРОВКА СЕРБСКОГО КУЛЬТУРНОГО
НАСЛЕДИЯ И РАЗВИТИЕ ИНТЕГРАЛЬНОЙ
ЛЕКСИКОГРАФИЧЕСКОЙ ИНФРАСТРУКТУРЫ.
Разработка и развитие теоретических моделей
компьютерной интеграции различных
лексикографических ресурсов, организация процесса
оцифровки лексикографической, этнологической и
другой литературы, нужной для междисциплинарных
исследований.

Развитие мета-лексикографических моделей словаря,
как вида веб-сервиса и практическое софтверное
применение мультимедийной базы данных сербской
культуры и языка. Оцифрованные словари будут
вручную обработаны и размечены в формате XML, в
соответствии с Text Encoding Initiativе (TEI).
Наглядное определение текстуальной структуры и
содержания кодированием и разметкой текста для
машинного или человеческого употребления, с
особенным ударением на осмысленном поиске.

Таким образом обработанный текст характеризуется
архивной устойчивостью, межплатформенной
совместимостью и портативностью данных. Цифровое
TEI-идание возможно использовать в качестве
единственного электронного источника для
манипулирования размеченными частями текста и
подготовку различного вида отправления и хранения.

Создание лексикографическо-энциклопедической базы
(ЛЭБ) позволяет многоцелевой и комплексный поиск
разнообразных оцифрованных лексикографических
ресурсов. Оцифрованные словари будут включены в ЛЭБ
для нужд исследования и подготовки Словаря. ЛЭБ будет
расширен и новейшими результатами исследований
участников проекта, мультимедийными элементами
(картинки, аудио- и видео-файлы), иллюстрирующими
знания о самых важных понятиях сербской культуры, и
интегрирован с существующими веб-ресурсами: Интернетбиблиотекой Сербии по гуманитарным наукам и искусству,
и проектами Центра по цифровым гуманитарным наукам:
билингвальным сербско-английским словарем и Сербской
морфо-синтаксической базой (СМС).

Научно-исследовательские темы: исследование
сложных лексических архитектур в электронной
лексикографии; трансформация статических словарей
в веб-сервисы, употребление технологии Web-2.0 и
взаимное связывание лингво-культурологических
ресурсов; использование социальных сетей в
академических проектах; стандартизация,
взаимодействие и объединение веб-ресурсов,
определение общих интерфейсов прикладного
программирования (API), исследований технологий
семантического веба, таких как Topic Maps, Resource
Description Framework (RDF), онтологии.

Речь идет о амбициозном, междисциплинарном
проекте, который свяжет сотрудников в разных
областях – во-первых, этнологии, линквистике,
компьютерной науке, и объединит теперешние усилия
по развитию лексикографической и гуманитарной
цифровой инфраструктуры в Распублике Сербии,
включая туда в первую очередь Интернет библиотеку
Сербии по гуманитарным наукам и искусству (ИБиС,
http://ibis.mi.sanu.ac.rs/) и проекты Центра цифровых
гуманитарных наук (http://humanistika.org).



Ожидаемый эфект программы
Презентация сербского культурного и языкового
наследия в международных рамках.
Сохранение культурной идентичности и обучение
широких общественных кругов.


Совершенствование разработки капиталных
лексикографических и энциклопедических трудов, но
и предоставление научному сообществу и широким
общественным кругам полезных и надежных сведений
по областям этнографии, этнологии, культурологии и
остальным гуманитарным и общественным
дисциплинам. Так как в Интернете налицо
многочисленные данные, надежность которых
проблематична, разработка такого портала имеет
большую национальную ценность.
Развитие цифровых гуманитарных наук в Республике
Сербии.

К части проекта, касающейся развития, относится и
формирование лабораторий цифровой гуманистики.
Будущие лаборатории цифровой гуманистики будут
развиваться в рамках трех институций:
этнографического института Сербской академии наук
и искусств, Института сербского языка Сербской
академии наук и искусств и Технического факультета
университета в Приштине, с штаб-квартирой в
Косовска-Митровице.

Создание лабораторий, наряду с обеспечением
дополнительного оборудования, подразумевает
трудоустройство, обучение и совершенствование
новых сотрудников, так же как и развитие новых
цифровых технологий, приспособленных к
требованиям гуманистики, посредством чего был бы
заложен фундамент для развития цифровых
гуманитарных наук в Сербии и открыта возможность
для более успешного регионального и более широкого
международного сотрудничества в этих научных
дисциплинах.

Лаборатория в рамках Этнографического института
Сербской академии наук и искусств будет развиваться
в направлении оцифровки этнологического архивного
материала и источников, а также и формирования
этнографическо-антропологической базы данных; в
рамках Института сербского языка будут заниматься
оцифровкой лексикографических источников,
лексического и ономастического материала и
развитием цифровой платформы в целях
лингвистических исследований, в то время как в
рамках Технического факультета работа лаборатории
будет направлена на развитие решений программного
обеспечения для нужд цифровой гуманистики.

В рамках части проекта, касающейся развития, будет
продолжена работа над оцифровкой научных книг и
трудов, и компьютеризацией Интернет-библиотеки
Сербии по гуманитарным наукам и искусству
(организация метаданных и обработка текста в
формате у XML). Работа над дальнейшим развитием
ИбиС будет подразумевать обработку научных книг и
трудов в текстуальном формате и их связывание с
терминами Словаря сербской культуры.
Одновременно, с Математическим институтом
Сербской академии наук и искусств будет продолжено
сотрудничество в сохранении книг и трудов в формате
PDF в рамках Виртуальной библиотеки.



К научному применению относится:
Научно-исследовательская работа в сфере
лингвистики и этнолингвистики, этимологии,
лексикографии и лексикологии, диалектологии,
сербистики и славистики
Научно-исследовательская работа в сфере
этнологии и антропологии, а также и остальных
гуманитарных и общественных дисциплин
(литература, история, культурология,
балканистика, социология, педагогогия...)


Научно-исследовательская работа в сфере
гуманитарной информатики, компьютерной
лингвистики и обработки естественных языков –
включая разнородные проекты, такие как
семантический анализ текста, разрешение
многозначности слова, исправление омофонов,
классификация и нахождение документов, ответы на
вопросы в рамках открытых доменов, обнаружение
текстуальных импликаций (textual entailment).
Создание новых или совершенствование
существующих машинных инструментов для
обработки текста (корректировщика правильности
текста, грамматических парсеров, лемматизаторов и
т. д.)






Возможные пользователи:
все носители сербского языка в родной стране и
диаспоре;
отечественная и зарубежная популяция школьников
и студентов;
представители профессий, для которых необходимо
хорошее знание сербского языка и культуры
(образование, журналистика, годударственная
администрация, эконимика и политика)
международное и отечественное научно сообщество;
иностранные и отечественные дипломаты.

Общественно доступный Интернет-портал по
сербскому языку и культуре, благодаря хорошей
организации данных и связыванию с научными
книгами и трудами, опубликованными в интернетбиблиотеке, позволит всеохватный и надежный поиск.
Таким образом организованная лексикографическая и
этнографическая база имеет высокие возможности
дальнейшего развития путем добавления новых
единиц и мультимедийного содержания.


База будет выработана в строгом соответствии с
общепринятыми методологическими правилами
всех включенных лингвистических и культурноисторических дисциплин, приспособлена к
требованиям научно-исследовательских проектов
учреждений, являющихся их носителями, и будет
иметь несомненную пользу и для исследований в
более широком кругу гуманитарных и
общественных наук, на отечественном и
международном уровне, а также и для обучения
широких общественных слоев.
Проект был бы важным и для усиливания
международного сотрудничества Республики
Сербии с иностранными партнерами в области
гуманитарных наук.
Download