Дорогие коллеги! Мы рады объявить, что очередная 18-я Международная конференция «Диалог» состоится c 30 мая по 3 июня в Московской области. Конференция проходит под патронажем Российского Фонда Фундаментальных Исследований при организационной поддержке компании ABBYY. В подготовке и проведении «Диалога 2012» участвуют: • Институт лингвистики РГГУ • Институт проблем информатики РАН • Институт проблем передачи информации РАН • Филологический факультет МГУ • Яndex • ABBYY Тематика Диалога 2012 Конференция проводится по следующим направлениям, сочетающим теоретические исследования и приложения: • Формальные модели языка и их применение • Лингвистическая семантика и семантический анализ текста • Лингвистические онтологии • Теоретическая и компьютерная лексикография • Разработка и применение компьютерных лингвистических ресурсов • Корпусная лингвистика: создание, разметка, применение, оценка корпусов • Интернет как лингвистический ресурс. Лингвистические технологии в интернете • Анализ и синтез речи • Машинный перевод • Модели общения. Коммуникация, диалог и речевой акт • Извлечение знаний из текстов • Компьютерный анализ документов: реферирование, классификация, поиск, анализ тональности и т.д. Программа конференции включает пленарные заседания, специальные и стендовые сессии, круглые столы, демонстрации программных систем. Доклады, включенные в программу "Диалога", публикуются в сборнике трудов конференции, издаваемом в бумажной, электронной и интернет-версиях. Доклады, получившие поддержку рецензентов, но не попавшие в основную программу, публикуются (с согласия авторов) на сайте конференции. Доминанты Диалога 2012 Каждый год Программный Комитет выбирает отдельные темы или направления в качестве доминант очередной конференции. Им посвящаются специальные заседания, Круглые столы, обзорные выступления приглашенных докладчиков. В этом году выбраны следующие главные темы: • Оценка тональности текста (sentiment analysis). • Лингвистическое аннотирование текста. Анализ тональности документа (определения отношения автора к описываемому в тексте объекту) является сегодня весьма популярной практической задачей компьютерного анализа документов. Эта задача может рассматриваться как совершенно независимая и решаться средствами машинного обучения с привлечением достаточно простых лингвистических параметров. С другой стороны, определение тональности может основываться и на содержательном анализе документа. Разнообразие возможных подходов делает эту задачу особенно интересной для конференции. Поскольку в этом году одна из дорожек РОМИП посвящена анализу тональности, предполагается обсудить результаты этого творческого соревнования на Диалоге в рамках специального Круглого стола. Лингвистическое аннотирование относится к наиболее актуальным направлениям в современной компьютерной лингвистике. Это связано с тем, что эффективность работы как лингвистов-исследователей, так и специалистов по применению методов машинного обучения существенно определяется наличием лингвистически размеченных корпусов и глубиной и полнотой их разметки. С другой стороны, ручная разметка является чрезвычайно дорогостоящей процедурой, поэтому использование процедур автоматического анализа документов является крайне желательным. Таким образом, задача лингвистического аннотирования естественно объединяет интересы и занятия практически всех участников Диалога. Традицией Диалога становится проведение соревнований систем автоматического анализа документов. Цель таких соревнований не спортивная, а исследовательская: разработка надежных критериев и методик оценки систем автоматического анализа. Особенностью Диалога в этом отношении является то, что оценке подлежат не только прикладные результаты работы таких систем, но и порождаемые ими лингвистические разборы. Так, в этом году на Диалоге на специальном Круглом столе будут подведены итоги соревнования синтаксических парсеров. По традиции, на Диалог будут приглашены некоторые ведущие мировых специалисты в области компьютерной лингвистики. Имена приглашенных докладчиков этого года будут объявлены в следующем информационном письме. Рабочие языки конференции Рабочими языками конференции являются русский и английский. Это отражает одинаковую важность для Диалога двух взаимосвязанных целей: • Создание ресурсов, моделей и технологий для поддержки анализа русского языка. • Преодоление методического и технологического отставания от мирового уровня, которое, несмотря на отдельные успехи российской компьютерной лингвистики в целом, все еще имеет место. При выборе языка доклада, подаваемого на Диалог, надо руководствоваться следующим правилом: те доклады, которые не посвящены непосредственно русскому языку как объекту исследования, должны подаваться на английском языке. Их авторы должны быть также готовы и представлять их на английском языке, если доклад попадет в «международную» секцию программы (о чем ПК сообщит заранее). Авторы докладов, подаваемых и представляемых на русском языке должны подготовить расширенную аннотацию на английском языке. Крайне желательным является и английский язык на слайдах презентаций (там, где это позволяет материал). Это сделает пребывание на Диалоге международных участников более комфортным и продуктивным. Большое количество англоязычных материалов не только подкрепляет международный статус Диалога, но и позволяет привлекать к рецензированию опытных экспертов со всего мира. Это хорошо соотносится и с твердым намерением Редсовета Диалога внедрять современные международные стандарты оценки (evaluation) присылаемых работ. О принципах отбора докладов на Диалог «Диалог» принципиально междисциплинарен и ориентирован на общение лингвистовтеоретиков и разработчиков прикладных лингвистических технологий. Мы просим всех, кто планирует участвовать в «Диалоге», учитывать эту традицию при выборе тем, содержания и формы ваших выступлений. Диалог сохраняет традиционную широту тематики, при этом Программный Комитет оставляет за собой право отклонять доклады, понятные и интересные только узким специалистам. Исследования, выполненные в рамках научных теорий, моделей описания и анализа, не являющихся широко известными, не будут приниматься без введения, представляющего соответствующую исследовательскую парадигму. Наши рецензенты будут обращать особое внимание на наличие в теоретических докладах внятно сформулированной и решенной конструктивной задачи, а в прикладных исследованиях – верифицируемого результата, полученного на адекватном языковом материале. Правила подачи докладов в CMT Полные тексты докладов с аннотациями на русском и английском языках будут приниматься до 10 февраля. Доклады подаются через интернет-систему подачи докладов. Правила подачи докладов в системе рецензирования Conference Management Toolkit Пожалуйста, внимательно ознакомьтесь с правилами подачи докладов. Регистрация в системе 1. Зайдите в систему здесь: https://cmt.research.microsoft.com/DIAL2012/ 2. В поле ввода логина и пароля, не вводя логин, нажмите Sign up, чтобы зарегистрироваться в системе. На открывшейся странице нажмите Next (в правом нижнем углу). 3. Под лицензионным соглашением (Author's EULA - End User License Agreement) нажмите «Yes, I agree to the Author's Statement», нажмите Next. 4. В пустом поле введите код, который видите на изображении, нажмите Next. 5. Введите ваши данные. Внимание! В графе First Name напишите ваше имя и отчество. Графы First Name и Last Name заполните кириллицей (для иностранных участников - латиницей). Графу Middle Initial не заполняйте. Поля First Name, Last Name, Organizations, Phone Number (контактный телефонный номер) и Email обязательны для заполнения. Запомните введенный вами пароль. После заполнения регистрационной формы нажмите Next. 6. Нажмите Finish (кнопка Finish находится в правом нижнем углу экрана) Вход в систему В окне Dialog 2012 Login введите адрес вашей электронной почты (Email) и пароль, который вы указали при регистрации. Если вы забыли пароль. Если вы забыли пароль или хотите его поменять, нажмите «Reset your password». 1. В первом поле введите надпись, которую видите на изображении. 2. Введите адрес вашей электронной почты (Email). 3. Нажмите Submit. Вскоре вам придет письмо, перейдите по ссылке, содержащейся в данном письме. На открытой странице введите адрес электронной почты (email), напишите новый пароль (New Password), подтвердите этот пароль (Confirm Password). Подача доклада 1. Нажмите «Create a new Paper Submission» 2. В графе «Title» введите название вашего доклада на русском языке. 3. В графе «Abstract» напишите аннотацию на английском языке. Обратите внимание, что поле ввода "Abstract" предназначено только для английской аннотации, аннотация на русском языке должна быть включена в текст доклада. Для более подробной информации внимательно ознакомьтесь с требованиями к оформлению докладов. 4. В области Subject Areas выберите направление конференции, в рамках которого написан ваш доклад. 5. В поле Uploaded File загрузите файл с текстом вашего доклада, нажмите Upload File. Напоминаем, что текст следует присылать в формате doc или rtf. 6. Нажмите Submit. Внимание! Если вы не нажмете Submit, введенные вами данные в системе не сохранятся. В течение двух рабочих дней вы получите от секретаря подтверждение о получении вашего доклада. Если вы не получили подтверждение, обратитесь в секретариат ([email protected]) Готовые версии докладов вы сможете разместить в системе (Camera Ready Paper Submission). Кроме текста доклада вы можете выслать презентации в Power Point и любые дополнительные материалы, иллюстрирующие ваше исследование (Presentation Submission). Настоятельная просьба, в целях облегчения работы организаторов конференции по всем вопросам обращайтесь по адресу [email protected] напрямую, не через интерфейс системы Conference Management Toolkit. Требования к оформлению докладов (NB!) С этого года требования к оформлению докладов, подаваемых на конференцию Диалог, существенно изменились. Это связано с требованиями международной базы данных SCOPUS для принятия и индексирования в ней материалов Диалога. Требования к оформлению докладов, подаваемых для публикации в сборнике конференции «Диалог» Общие требования: Объём текста без аннотаций не должен превышать 20000 символов. Объём русской аннотации должен составлять не более 150 слов, объем английской – не менее 150 и не более 250 слов. Файл с текстом доклада должен быть назван по-русски и должен включать в себя фамилию и инициалы автора, например, Иванов И. В.doc (для англоязычных докладов - по-английски). 1. Титульный блок доклада Информация предоставляется на русском и на английском языках. Последовательность в блоке: Название на русском. Название на английском. ФИО авторов на русском, e-mail (в скобках). Название организации, город, страна, ключевые слова - на русском. ФИО авторов на английском, e-mail (в скобках). Название организации, город, страна, ключевые слова – на английском. 1.1. Заголовок доклада набирается заглавными буквами на русском и английском языке, например: ХАРАКТЕР КОРРЕЛЯЦИИ МЕЖДУ ПОРЯДКОМ СЛОВ И КОММУНИКАТИВНОЙ ПЕРСПЕКТИВОЙ В НАУЧНО-ТЕХНИЧЕСКИХ ТЕКСТАХ НА РУССКОМ ЯЗЫКЕ CHARACTERISTIC RELATIONS BETWEEN WORD-ORDER AND COMMUNICATION PERSPECTIVE PATTERNS IN RUSSIAN SCIENTIFIC TEXTS Заглавия научных статей должны быть информативными. В заглавиях статей можно использовать только общепринятые сокращения. В переводе заглавий статей на английский язык не должно быть никаких транслитераций с русского языка, кроме непереводимых названий собственных имен, приборов и др. объектов, имеющих собственные названия; также не используется непереводимый сленг, известный только русскоговорящим специалистам. Это также касается авторских резюме (аннотаций) и ключевых слов. Список авторов 1.2. Список должен быть помещён сразу под названием доклада. Список должен начинаться с фамилии докладчика, который будет представлять доклад на конференции. Фамилии остальных авторов располагаются по алфавиту. Список должен состоять из фамилий авторов и расположенных после них инициалов. После фамилии каждого автора желательно указывать его электронный адрес. После списка авторов следует указать организацию, представляемую этими авторами, например: Цирульник Л.И. ([email protected]), Жадинец Д.В. ([email protected]), Лобанов Б.М. ([email protected]), Сизонов О.Г. ([email protected]) Объединённый институт проблем информатики НАН Беларуси, Минск, Беларусь Если авторы представляют разные организации, то соответствующая организация пишется после электронного адреса автора, например: Соколова Е.Г. ([email protected]), Российский государственный гуманитарный университет Болдасов М.В. ([email protected]), Luxoft 1.3. Русская аннотация (необязательна, но возможна по желанию авторов - для докладов, подаваемых на русском) – не более 150 слов. 1.4. Английская аннотация (обязательна для всех докладов без исключения) – не менее 150 и не более 250 слов. Аннотации должны быть: 1. информативными (не содержать общих слов); 2. оригинальными (англоязычная аннотация не должна быть калькой русскоязычной аннотации); 3. содержательными (отражать основное содержание статьи и результаты исследований); 4. структурированными (следовать логике описания результатов в статье); 5. «англоязычными» (написаны качественным английским языком); 6. компактными (укладываться в объем от 150 до 250 слов). 1.5. Русские и английские ключевые слова Требуется указать минимум 4 ключевых слова Пример правильного оформления «титульного блока» русскоязычной статьи: ПАДЕЖ КАК ПРИЗНАК ИДЕНТИЧНОСТИ ПРИ ЭЛЛИПСИСЕ В РУССКОМ ЯЗЫКЕ CASE AS A CHARACTERISTIC OF IDENTITY UNDER ELLIPSIS IN RUSSIAN Тестелец Я. Г. ([email protected]) Институт лингвистики РГГУ, Москва, Россия Ключевые слова: падеж, эллипсис, идентичность, признак идентичности Testelets Ia. G. ([email protected]) Russian State University for Humanities, Moscow, Russian Federation In Russian, all elliptical operations except N’-ellipsis require the identity of case values in NPs of the antecedent and the elliptical gap, and identity of role or grammatical relation does not suffice when cases are different. Ellipsis follows the six-case model, the peripheral cases, like partitive or ‘the case of expected object’, pattern with their more standard counterparts. With direct and indirect object NPs, however, case values may be different in the antecedent and the gap, e. g. with recipients, addressees, and the genitive of negation. Key words: case, ellipsis, identity, identity characteristic 2. Текст доклада Ориентация страницы должна быть книжной. Формат – А4. В случае наличия в тексте нестандартных шрифтов необходимо также прислать файлы с этими шрифтами. Не следует делать нумерацию страниц и колонтитулы, а также использовать автоматические средства переноса. Примеры оформляются курсивом и нумеруются. Нумерация примеров – сквозная. Номер ставится перед примером в круглых скобках. Пример: (2) Between three thornes pungent (1601) (OED); was whilome used for a pungent spear (1606) (OED); < ...> сutting or pungent instruments (1750) (OED). Нумерация рисунков также сквозная. Подписи под рисунками должны начинаться так: «Рис. <Номер рисунка>. <Название рисунка>» и набраны курсивом. Для докладов на английском – «Fig. <Номер рисунка>. <Название рисунка на английском>» Пример: Рис. 1. Функции плотности вероятности (вверху) и распределения (внизу) частоты основного тона для состояния ≪neutral≫ (серые кривые) и ≪anger≫ (черные) Fig. 3. Syntactic and LF-structure of the sentence Подзаголовки должны быть набраны полужирным курсивом. При делении на разделы разных уровней рекомендуем использовать нумерацию разделов и подразделов (1.1., 1.2., 1.3, 2.1 и т.д.). Сноски также должны быть пронумерованы и помещены внизу страницы. Остальные параметры текста (размер шрифта, интервалы, отступы, цвет и так далее) являются несущественными, так как при вёрстке все эти параметры будут приведены в соответствие со стандартами, указанными верстальщику. 3. Рисунки Все присутствующие в тексте иллюстрации должны быть представлены также отдельными файлами в формате tiff. или bmp. (в формате jpg. нежелательно, но допустимо). Разрешение изображений должно быть не ниже 150 dpi (желательно – 300 и выше). Не следует в состав рисунка включать подпись под ним (его название). Изображение должно быть в режиме оттенков серого или чёрно-белым. Если иллюстрация представляет собой "скриншот", настоятельно просим никак ее не редактировать, а прислать в "изначальном" виде. 4. Пристатейные библиографические списки Пристатейные списки литературы на английском обязательны для всех статей (независимо от языка самой статьи). Пристатейные списки литературы на русском обязательны для статей на русском. Пристатейные списки литературы на русском языке оформляются в соответствии с ГОСТ 7.1–2003. Библиографическая запись. Библиографическое описание. Общие требования и правила составления; формируется в порядке русского алфавита. Пристатейные библиографические списки на английском языке должны быть оформлены в соответствии с требованиями базы SCOPUS (см. ниже), с правильным образом транслитерированными именами. Для этого можно воспользоваться таблицей транслитерации на с.8. Список должен быть сформирован в порядке английского алфавита. 4.1. Структура библиографического описания в соответствии с требованиями БД SCOPUS: Материалы конференций ФИО авторов, перевод названия статьи (если статья была опубликована на русском), транслитерированное название в квадратных скобках, название сборника конференции на языке оригинала (в транслитерации, если нет ее английского названия), выделенное курсивом, в квадратных скобках - перевод названия на английский язык, место проведения конференции, место издания, страницы. Примеры: Usmanov T.S., Gusmanov A.A., Mullagalin I.Z., Muhametshina R.Ju., Chervyakova A.N., Sveshnikov A.V. Features of the design of field development with the use of hydraulic fracturing [Osobennosti proektirovaniia razrabotki mestorozhdenii s primeneniem gidrorazryva plasta]. Trudy 6 Mezhdunarodnogo Simpoziuma “Novye resursosberegayushchie tekhnologii nedropol'zovaniia i povysheniia neftegazootdachi” [Proc. 6th Int. Technol. Symp. “New energy saving subsoil technologies and the increasing of the oil and gas impact”]. Moscow, 2007, pp. 267-272. Zalizniak A.A., Mikaelian I.L. Emailing as a Linguistic Object [Perepiska po Elektronnoi Pochte kak Lingvisticheskii Objekt]. Komp’iuternaia Lingvistika i Intellektual’nye Tekhnologii: Trudy Mezhdunarodnoi Konferentsii “Dialog 2006” [Computational Linguistics and Intellectual Technologies: Proceedings of the International Conference “Dialog 2006”]. Bekasovo, 2006, pp.157–162. Lodi E., Veseley M., Vigen J. Link managers for grey literature, New Frontiers in Grey Literature. Proceedings of the 4th International Conference on Grey Literature. Washington, DC, 1999, pp. 16-34. Статьи из журналов: ФИО авторов, (год публикации), название статьи (в квадратных скобках – транслитерированное название, если статья не на английском), название журнала (курсивом), для русскоязычных – в квадратных скобках перевод на английский названия, номер издания (если есть), страницы. Примеры: Baron R.M., Kenny D.A. (1986), The moderator-mediator variable distinction in social psychological research, Journal of Personality and Social Psychology, Vol. 51, pp. 73-82. Zagurenko A.G., Korotovskikh V.A., Kolesnikov A.A., Timonov A.V., Kardymon D.V. (2008), Techno-economic optimization of the design of hydraulic fracturing [Tekhniko-ekonomicheskaia optimizatsiia dizaina gidrorazryva plasta], Neftyanoe khozyaistvo [Oil Industry], no.11, pp. 5457. Статьи из электронного журнала: ФИО авторов, название статьи (транслитерация названия, если статья на русском, - в квадратных скобках), (год публикации), описание доступа – полный URL Примеры: Pitkow J., Kehoel C. (1997), "GVU's WWW user surveys", available at: www.gvu.gatech.edu Better Business Bureau (2001), "Third-party assurance boosts online purchasing", available at: http://bbbonline.org/about/press/2001/101701.asp Книги (монографии, сборники, материалы конференций в целом): ФИО авторов (год публикации), название книги (курсивом), издательство, место издания Перевод названия дается в квадратных скобках (если книга на русском) Примеры: Nenashev M.F. (1993) Poslednee pravitel’stvo SSSR [Last government of the USSR]. Moscow, Krom Publ. Patton M.Q. (1990), Qualitative Evaluation and Research Methods, Sage, Newbury Park, CA. Глава из книги ФИО авторов статьи (год публикации), название главы (в квадратных скобках – транслитерированное название, если глава на русском), in название книги (курсивом; транслитерация, если книга на русском), перевод названия книги в квадратных скобках (если книга на русском), издательство, место издания, страницы (всей главы) Пример: Bourdieu P.(1977), The forms of capital, in Handbook of Theory and Research for the Sociology of Education, Greenwood Press, New York, NY, pp. 11-56. Ivanov P.A. (2010), The bases of national law [Osnovy gosudarstvennogo prava], in Rossiiskoie pravo [Russian law], Novoe Izdatel’stvo, Perm’, pp.28-29 Таблица транслитерации Система Библиотеки Конгресса США Буква Транслит А A Б B В V Г G Д D Е E Ё E Ж ZH З Z И I й I К K Л L М M Н N О O П P Р R С S Т T У U Ф F Х KH Ц TS Ч CH Ш SH Щ SHCH Ъ " Ы Y Ь ' Э E Ю IU Я IA Формат файла с текстом доклада Текст следует присылать в формате doc. или rtf. Если в тексте присутствуют картинки, рекомендуется присылать ещё и pdf. (для гарантированного сохранения представления о расположении иллюстраций в тексте). Вычитка макетов При наличии в тексте доклада сложных рисунков и схем, нетрадиционных шрифтов, автор доклада может попросить сверстанный макет доклада на вычитку. Если вы хотите вычитать свой доклад после верстки, просьба сообщить об этом секретарю в письме. Порядок рецензирования Результаты рецензирования будут рассылаться Редсоветом c 5 по 19 марта по завершении процедуры рецензирования. Дата принятия решения зависит как от времени подачи доклада авторами, так и от оперативности и единства мнений рецензентов. Авторам довольно часто высказываются пожелания и замечания. В случае необходимости существенной доработки материалов Редсовет проводит повторное рецензирование отдельных работ. Поэтому окончательное решение по некоторым докладам может быть принято несколько позже. С 19 по 31 марта мы ждем от вас итоговые варианты статей, подготовленные с учетом замечаний рецензентов и оформленные в соответствии с требованиями. Дата обычно устанавливается индивидуально в зависимости от даты принятия окончательного решения по докладу. Обращаем ваше внимание на то, что организаторы не гарантируют публикацию статей, присланных с опозданием. Основные даты: Предоставление полных текстов до 10 февраля Решение ПК с 5 до 19 марта Подача статей для сборника с 19 до 31 марта Публикация программы конференции после 5 мая Проведение конференции 30 мая – 3 июня Более подробную информацию можно получить на сайте "Диалога". На специальном форуме вы можете оставить свои предложения по проведению конференции, задать вопросы. Оргкомитет конференции располагает некоторым количеством сборников трудов «Диалога» за разные годы . Мы готовы бесплатно поделиться сборниками с университетами, кафедрами, библиотеками на условиях самовывоза. По всем вопросам обращайтесь к секретарю конференции: [email protected]. Будем рады увидеть Вас на конференции!