TEXTANALYST – ТЕХНОЛОГИЯ ДЛЯ ПРЕДСТАВЛЕНИЯ ТЕКСТА ПОЛЬЗОВАТЕЛЮ Харламов А.А. Крюкова О.П. Сведения о докладчиках Харламов Александр Александрович Крюкова Ольга Павловна ООО НПИЦ «Микросистемы», г. Москва Федеральный институт развития образования Наши проекты и основные направления деятельности Цифровые библиотеки в образовании Развитие речевой, коммуникативной и интеллектуальной деятельности учащегося Какова основная тема и проблема выступления? Инновационная технология работы с текстовой информацией на базе компьютерной технологии (далее «технология ТА») С помощью системы ТекстАналист ( www.Analyst.ru) в автоматизации обмена данными в книжной отрасли Что это за технология? Нейросетевая технология обработки текстовой информации TextAnalyst позволяет анализировать текст независимо от языка и предметной области автоматически извлекать -ключевые понятия из текста (с их смысловыми весами в рамках данного текста), -устанавливать их взаимосвязи в данном тексте (также с их весовыми характеристиками). Что это дает издателю/ редактору? 1. В результате автоматической обработки пользователь мгновенно получает смысловой портрет текста – семантическую сетьсовокупность ключевых понятий в их взаимосвязях , как они даны в данном тексте; Что это дает издателю/ редактору? 2.Технология ТА оказывается удобным средством навигации по тексту . См. комм Что это дает издателю/ редактору? 3. ТА может автоматически создавать реферат , который , в составе наиболее значимых предложений текста, позволяет осуществить первичное и быстрое знакомство с текстом. Что дает технология ТА? На основе семантической сети строится гипертекстовое представление, которое позволяет легко (методом «клика») навигировать по тексту с использованием ассоциативных связей и быстро просматривать контекст конкретных ключевых слов. Что дает технология ТА? (это особенно важно при работе с корпусами текстов ) Вычисление степени пересечения семантической сети запроса с семантическими сетями найденных по запросу текстов дает возможность отранжировать найденные тексты по степени близости к запросу. Что дает технология ТА? Вычисление степени пересечения семантической сети текста с семантическими сетями рубрик позволяет автоматически отнести входной текст к одной или нескольким рубрикам, то есть – отклассифицировать его. Какой опыт использования технологии ТА? С 1996 года технология представлена на российском рынке в виде двух продуктов: персонального продукта для автоматического анализа текстов TextAnalyst и библиотеки COM-модулей для встраивания ее в продукты пользователя – TextAnalyst SDK. Какой опыт использования технологии ТА? С 1998 года те же продукты представлены на рынке США под названием Megaputer’s TextAnalyst (Megaputer Intelligence, Inc., Bloomington – является дистрибутором продуктов ООО НПИЦ «Микросистемы» в США) Рейтинг популярности ТА какой? Which text-mining tools you have used [111 votes total]dt Search (6)5%IMiner for Text (19)17% INTEXT (1)1% TextAnalyst (30)27% TextSmart (6)5% Text-o-Scope (2)2% Wordstat (3)3% Other (10)9%None (34)31% Copyright © 2002 KDnuggets. Subscribe to KDnuggets News! Еще о рейтинге популярности? В 2000 году вышла книга Дэна Салливэна [1], вторая часть которой посвящена сравнению технологии TextAnalyst с аналогичными технологиями фирм IBM и ORACLE. Что нового и полезного появляется в работе издателя/ редактора с помощью ТА ? Таким образом, гипертекстовое представление текстовой информации в составе исходного текста, семантической сети и множества предложений, содержащих понятия сети вполне может использоваться как новый и более точный стандарт в представлении текстовой информации пользователю. Предложения о дальнейшей совместной научно – исследовательской деятельности Становится возможной совместная разработка интеллектуальных инструментов анализа специальных текстовых и терминологических баз и самих текстовых баз данных для широких целей автоматизации в использовании цифрового издательского текстового фонда в образовании, самообразовании, интеллектуальном труде учащегося и, шире, пользователя. Какие новые горизонты издательской деятельности открывает использование интеллектуальных технологий (технологии ТА) ? Расширение сферы коммерческой деятельности издателей при использовании цифровых библиотек собственных архивов Контактная информация [email protected] [email protected]