ПРОГРАММНОЕ ОБЕСПЕЧЕНИЕ ПО РАБОТЕ С ТЕКСТОМ

advertisement
ПРОГРАММНОЕ ОБЕСПЕЧЕНИЕ
СОЗДАНИЯ И ОБРАБОТКИ
ТЕКСТОВ
ВОПРОСЫ:
1.Виды программ работы с текстом.
2.Системы оптического распознавания символов.
3.Текстовые редакторы и процессоры, настольные
издательские системы.
4.Текстовый формат и формат документа.
ВИДЫ ПРОГРАММ РАБОТЫ С ТЕКСТОМ
Программы:
 оптического распознавания символов;
 создания, редактирования и печати
текстовых документов и электронных форм;
 автоматизированного перевода текстов и
словари;
 создания электронных публикаций и книг.
ВИДЫ ПРОГРАММ РАБОТЫ С ТЕКСТОМ
Программы создания, редактирования и печати текстовых документов и
электронных форм:
 текстовые редакторы;
 текстовые процессоры;
 настольные издательские системы;
 программы создания и работы с динамическими бизнес-формами
(MS InfoPath, Adobe Acrobat Professional, Form Pilot Office, ).
ВИДЫ ПРОГРАММ РАБОТЫ С ТЕКСТОМ
Электронная форма
ВИДЫ ПРОГРАММ РАБОТЫ С ТЕКСТОМ
 программы автоматизированного перевода текстов и словари:
PROMT,
Pragma,
ПАРС,
ABBYY Lingvo Live.
 программы создания электронных публикаций и книг:
NeoBook Professional Multimedia,
eBook Maestro,
BookDesigner,
EBook Producer.
СИСТЕМЫ ОПТИЧЕСКОГО РАСПОЗНАВАНИЯ
СИМВОЛОВ
Назначение: автоматизация ввода больших объемов документов
(20-50 документов в минуту).
Повышение скорости обработки документов:
увеличение скорости ввода данных в информационные системы в
3-10 раз.
Повышение удобства и качества работы с данными:
высокий уровень безопасности конфиденциальных данных,
сокращение количества ошибок, связанных с человеческим
фактором.
Снижение затрат на обработку документов:
сокращение суммарных расходов на обработку документов более
чем на 50%.
СИСТЕМЫ ОПТИЧЕСКОГО РАСПОЗНАВАНИЯ
СИМВОЛОВ
OCR (Optical Character Recognition)
Оптическое распознавание символов
ICR (Intelligent Character Recognition)
Интеллектуальное распознавание символов
СИСТЕМЫ ОПТИЧЕСКОГО РАСПОЗНАВАНИЯ
СИМВОЛОВ
СИСТЕМЫ ОПТИЧЕСКОГО РАСПОЗНАВАНИЯ
СИМВОЛОВ
OCR (Optical Character Recognition)
Оптическое распознавание
символов
OMR (Optical Mark Recognition)
Оптическое распознавание меток
ICR (Intelligent Character Recognition)
IDR (Intelligent Document Recognition)
Интеллектуальное распознавание
символов
Интеллектуальное распознавание документов
HCR (Handprint Character Recognition)
Распознавание рукопечатных символов
СИСТЕМЫ ОПТИЧЕСКОГО РАСПОЗНАВАНИЯ
СИМВОЛОВ
СИСТЕМЫ ОПТИЧЕСКОГО РАСПОЗНАВАНИЯ
СИМВОЛОВ
Этапы преобразование документа в электронный вид OCR-системами:
1.
2.
3.
4.
5.
6.
Сканирование и предварительная обработка изображения.
Анализ структуры документа.
Распознавание.
Проверка результатов.
Реконструкция документа (воссоздание его исходного вида).
Экспорт.
СИСТЕМЫ ОПТИЧЕСКОГО РАСПОЗНАВАНИЯ
СИМВОЛОВ
Оптическое распознавание символов:







ABBYY FineReader ,
CuneiForm,
OmniPage Professional,
Microsoft Office Document Imaging,
SimpleOCR,
TextBridge,
Readiris.
СИСТЕМЫ ОПТИЧЕСКОГО РАСПОЗНАВАНИЯ
СИМВОЛОВ
Этапы преобразование информации ICR-системами :
1.
2.
3.
4.
5.
Сканирование и предварительная обработка изображения.
Анализ и воссоздание структуры документа.
Определение назначения элементов и их логической взаимосвязи.
Извлечение необходимых данных.
Передача и сохранение данных в соответствующих полях
информационной системы.
СИСТЕМЫ ОПТИЧЕСКОГО РАСПОЗНАВАНИЯ
СИМВОЛОВ
Технология
Программа
UdaiOMR, queXF, QiuzOMR, ABBYY FineReader
OMR. Оптическое распознавание меток
Engine
IDR. Интеллектуальное распознавание
документов
HCR. Распознавание рукопечатных
символов
Cognitive Forms Bank,
Cognitive Passport,
ABBYY Business Card Reader,
ABBYY FlexiCapture,
ABBYY FineReader Банк,
ITSoft SmartCapture Bank
eDochi HCR, ArioForm, MyScript Studio
ТЕКСТОВЫЕ РЕДАКТОРЫ И ПРОЦЕССОРЫ,
НАСТОЛЬНЫЕ ИЗДАТЕЛЬСКИЕ СИСТЕМЫ
Текстовые редакторы – программы,
выполняющие простейшие операции по
редактированию текста.
Процессоры – программы, обладающие
расширенными
по
сравнению
с
редакторами
возможностями
для
компьютерной обработки текста.
ТЕКСТОВЫЕ РЕДАКТОРЫ И ПРОЦЕССОРЫ,
НАСТОЛЬНЫЕ ИЗДАТЕЛЬСКИЕ СИСТЕМЫ
ТЕКСТОВЫЕ РЕДАКТОРЫ И ПРОЦЕССОРЫ,
НАСТОЛЬНЫЕ ИЗДАТЕЛЬСКИЕ СИСТЕМЫ
Настольные издательские системы программы, предназначенные для
профессиональной издательской деятельности и
позволяющие осуществлять электронную верстку
широкого спектра основных типов документов.
Отличаются расширенными средствами
управления взаимодействием текста с
параметрами страницы и с графическими
объектами.
ТЕКСТОВЫЕ РЕДАКТОРЫ И ПРОЦЕССОРЫ,
НАСТОЛЬНЫЕ ИЗДАТЕЛЬСКИЕ СИСТЕМЫ
Текстовые
редакторы
Редакторы,
встроенные в системы
программирования
или системы
управления базами
данных,
MS Editor,
Multi-Edit,
NotePad.
Текстовые
процессоры
MS Word,
WordPerfect,
AmiPro,
OpenOffice.org Writer,
ChiWriter,
StarWriter,
Adobe InCopy.
Настольные издательские
системы
Corel Ventura,
QuarkXPress,
Scribus,
Adobe PageMaker,
Adobe FrameMaker,
MS Publisher.
ТЕКСТОВЫЙ ФОРМАТ И ФОРМАТ
ДОКУМЕНТА
Формат — способ организации информации в файле того
или иного типа.
ТЕКСТОВЫЙ ФОРМАТ И ФОРМАТ
ДОКУМЕНТА
ТЕКСТОВЫЙ ФОРМАТ И ФОРМАТ
ДОКУМЕНТА
Канонический текстовый формат: расширение .txt.
Формат документа: расширения .docх (Microsoft Word
Open eXtensible Markup Language Document),
.rtf (Rich Text Format).
Download