ABBYY SDK – средства интеграции функций распознавания Шунько Сергей, ABBYY Украина Спектр технологий и средств разработки ABBYY OCR (напечатанный текст) Document Capture (сохранение документа) FineReader Engine Recognition Server ICR (рукописный текст) FlexiCapture Engine DOCFLOW UKRAINE 2009 FineReader Engine Recognition Server FlexiCapture Engine Data Capture (извлечение данных) FlexiCapture Engine Сравнительная таблица ABBYY Engines Спецификация Описание и целевая аудитория Mobile OCR Engine 3.0 Разработка быстрых и компактных приложений для: • Мобильных телефонов • Других мобильных устройствах Обеспечение высокой эффективности и низких требований к ресурсам устройства FRE Embedded OS FRE & FCE Создание высокоэффективных специализированных приложения для: Создание мощных многофункциональных приложений для: • МФУ • Устройств для людей с ослабленным зрением • Машин для сортировки почты • Медицинских устройств • Сканирующих ручек • ПК и серверов • Высокопроизводительных систем Обеспечение доступа ко всем функциям преобразования документов Обеспечение широких возможностей интеграции во встраиваемые системы Технологии: OCR Языки: 60 CPU: x86, ARM OS: Windows CE; Symbian S60 (8.1, 9.1, 9.2, 9.3); Symbian UIQ; ucLinux, Linux; Android; Windows (x86) DOCFLOW UKRAINE 2009 Технологии: OCR (ICR, OMR, OBR, PDF(/A), MRC PDF) Языки: 60 базово (+130 по требованию) CPU: Virtually any CPU type support OS: Virtually any OS Технологии: OCR, ICR, OMR, OBR, PDF conversion Языки 190+ включая CJK, Thai, Hebrew, Vietnamese CPU: x86; PowerPC for MacOS OS: Windows (Vista, XP etc), Linux & FreeBSD, MacOS X ABBYY FineReader Engine •Windows Engine Visual Component •Linux, Mac Os, FreeBsd •Windows Mobile, Symbyan Os ABBYY FineReader Engine – весь спектр технологий распознавания и конверсии документов компании ABBYY для интеграции в ваши приложения, поставляются в виде набора библиотек Engine Visual Component – готовые к использованию компоненты пользовательского интерфейса DOCFLOW UKRAINE 2009 ABBYY FineReader Engine Возможности и функции: OCR - 191 язык распознавания печатного текста - распознавание китайских, японских и корейских иероглифов - распознавание документов напечатанных пишущей машинкой BCR (штрих-код) - распознавание одно-, двумерных штрих-кодов - функция быстрого извлечения штрих-кода Преобразование PDF-файлов Распознавание многоязычных документов Предварительная обработка изображений Ключевые преимущества: - единое API - модульная архитектура - гибкая лицензионная политика - «мультиплатформенность» - еngine может использоваться в приложении с любой архитектурой, любого масштаба и сложности DOCFLOW UKRAINE 2009 Где используется Engine? Позволяет: - Осуществлять низкоуровневую интеграцию технологий ABBYY в собственное ПО - Создавать с нуля собственное масштабируемое решение на базе технологий ABBYY Архивы и системы документооборота Системы контроля для проверки чеков, паспортов, билетов, кредитных карт, водительских лицензий, и т.д. Приложения преобразования документов в форматы PDF, XML, RTF и XLS с полным сохранением форматирования страницы Приложения по обработке факсов для преобразования их в редактируемый текст Решения для мобильных устройств И другие DOCFLOW UKRAINE 2009 Engine Visual Component Функционал: Active X компоненты с независимой функциональностью ● ● ● Пакетная обработка Предобработка изображений, определение параметров распознавания Просмотр и верификация распознанного текста Локализация графического интерфейса Разработчиком Настройка пользовательского меню и панели инструментов Ключевые преимущества: Разработка UI в короткие сроки Низкая стоимость поддержки Использование всех возможностей Engine и готовых компонент для разработки UI DOCFLOW UKRAINE 2009 FRE Embedded OS OCR – новый уровень в использовании Ваших устройств МФУ Сканирование в searchable PDF, PDF/A, PDF with MRC Устройства для людей с ослабленным зрением Сканирование текста и озвучивание Машины для сортировки писем Автоматическое распознавание адреса и сортировка Сканирующие ручки, распознавание визиток Использование OCR-гаджетов Ваше устройство… Представьте его с технологией OCR DOCFLOW UKRAINE 2009 8 ABBYY Recognition Server - Архитектура Серверное решение для автоматического распознавания и конвертирования средних и больших объемов документов Распределённая архитектура: ● все компоненты могут быть установлены как на 1, так и на различные компьютеры в рамках локальной сети DOCFLOW UKRAINE 2009 Как работает Recognition Server 2.0 Полностью готовое приложение Интегрированное приложение COM-based API Интеграция используя XML-описания Web Service API DOCFLOW UKRAINE 2009 Формирование документов по разделительным листам ABBYY Recognition Server Договор №1 Договор №2 Сканирование DOCFLOW UKRAINE 2009 Распознавание Recognition Server vs. FineReader Engine ABBYY FineReader Engine Низкоуровневый доступ к параметрам и результатам распознавания служит для построения собственных приложений (в т.ч. клиентсерверных) с нуля ABBYY Recognition Server Высокоуровневая интеграция может выступать как готовый к встраиванию модуль распознавания/конверсии для серверного приложения и позволяет сэкономить время на разработку DOCFLOW UKRAINE 2009 ABBYY FlexiCapture Engine Средство разработки - для интеграции в Windows-приложения технологий обработки форм и потокового ввода данных - 113 языков распознавания рукописного текста без настройки на почерк - распознавание цифр без настройки на почерк - всевозможные метки и группы меток - 181 язык распознавания печатного текста различных видов - одно-, двумерные штрихкоды DOCFLOW UKRAINE 2009 ABBYY FlexiCapture Engine Что такое извлечение данных? Извлечение данных: Вам нужно извлечь данные из определенных полей документа DOCFLOW UKRAINE 2009 Процесс извлечения информации DOCFLOW UKRAINE 2009 Примеры гибких форм ABBYY FlexiLayout Studio: печатные формы ● счёта-фактуры ● заказы на доставку ● отчеты, и т.д. документы с регулярными полями для индексирования в системах DM, CM, и т.д. ● стандартные заявления ● деловые письма ● типовые договоры, и т.д. неструктурированные документы ● визитки ● чеки, и т.д. документы с «плавающими» полями ● паспорта ● авиабилеты и т.д. DOCFLOW UKRAINE 2009 16 ABBYY FlexiLayout Studio ABBYY FlexiLayout Studio - Инструментарий для разработки решений по автоматизированному вводу «Гибких форм» Для документа известно только взаимное расположение полей, но не заданы точные геометрические характеристики. DOCFLOW UKRAINE 2009 Процесс настройки гибких шаблонов ABBYY FlexiLayout Studio Построение логических гипотез о расположении элементов на изображении относительно друг друга и границ изображения DOCFLOW UKRAINE 2009 ABBYY FlexiCapture Engine Несмотря на то что есть готовый продукт ABBYY FlexiCapture Professional, специфичные бизнес-процессы требуют специфичных сценариев обработки ABBYY FlexiCapture Professional Готовое решение для обработки форм ABBYY FlexiCapture Engine Разработка собственного интерфейса и сценария обработки в соответствии с требованиями конкретного бизнес-процесса Низкоуровневая интеграция технологий извлечения данных в корпоративные системы DOCFLOW UKRAINE 2009 Сценарии работы с бумажными документами DOCFLOW UKRAINE 2009 Сценарии работы с бумажными документами Полнотекстовое распознавание, сохранение изображений + Классификация и атрибутирование ++ Автоматизация всех этапов Recognition Server FineReader Engine FlexiCapture Engine DOCFLOW UKRAINE 2009 Два слова о компании ABBYY ABBYY UK Bracknell, United Kingdom Fremont ABBYY USA ABBYY Europe Munich, Germany ABBYY Software Москва, Россия ABBYY Украина Киев ABBYY Japan Tokyo ABBYY Taiwan, Taipei ABBYY Software House (Москва, Россия) ABBYY Украина (Киев, Украина) ABBYY Europe (Мюнхен, Германия) ABBYY UK (Брекнелл, Великобритания) ABBYY USA (Фримонт, Калифорния, США) ABBYY Japan (Токио) ABBYY Taiwan (Тайпей) DOCFLOW UKRAINE 2009 Партнеры ABBYY Более 600 партнеров по всему миру используют технологии ABBYY: Системные интеграторы Компании-разработчики, производящие ПО под заказ Разработчики собственного ПО ИТ-департаменты крупных предприятий, Сервисные бюро DOCFLOW UKRAINE 2009 Как интегрировать технологии ABBYY? Получить четкое представление о сценарии обработки в потенциальном проекте Получить представление о «IT-Ландшафте» Заказчика Проконсультироваться с нами о возможном SDK Получить испытательную версию В случае положительных результатов, приобрести лицензии для разработки и использования DOCFLOW UKRAINE 2009 Спасибо за внимание! Презентацию для Вас подготовил Шунько Сергей менеджер отдела корпоративных проектов ABBYY Украина + 38 044 490-9999 e-mail: [email protected] DOCFLOW UKRAINE 2009