Uploaded by eisachenko

Л-2. Кодирование и классификация экономической информации-1

advertisement
1
Классификация и
кодирование и
экономической информации
2
Вопросы:
1. Понятие классификатора
2. Кодирование информации
3. Примеры кодирования экономической
информации
3
1. Понятие классификатора
Документ состоит из различных реквизитовпризнаков и оснований.
Технологический процесс предусматривает при этом
автоматическое занесение реквизитовпризнаков в документ.
С этой целью в машинной программе имеется
специальный блок меню: справочники (словари),
которые содержат определенный перечень
номенклатур, используемый в данной задаче.
4
Некоторые номенклатуры, являющиеся
постоянными для данного вида
деятельности (бухгалтерского учета,
банковских операций), содержатся в
программе, другие составляются на месте.
Состав справочника имеет вид:
код-наименование.
5
Для таких справочников предварительно
разработаны отраслевые классификаторы,
являющиеся едиными для определенного
вида деятельности.
6
Кодирование вызвано необходимостью
передачи информации по каналам связи,
хранения ее на внешних носителях и
обработки с помощью вычислительной
техники.
7
Перед тем как произвести кодирование
информации, следует выполнить ее
классификацию.
Система классификации — совокупность правил и
результат распределения объектов заданного
множества на подмножестве в соответствии с
признаками.
Согласно системе применяются два метода
классификации: иерархический и фасетный.
8
Иерархический — это такой метод
классификации, при котором
заданное множество
последовательно делится на
подчиненные подмножества.
9
 Между классификационными
группировками устанавливаются отношения
подчинения, последовательной
детализации свойств типа:
класс–группа–вид и т.д.
 При использовании данной системы
каждый объект попадает только в одну
классификационную группу. Объединение
классификационных группировок на каждом
уровне должно составлять исходное
множество объектов.
10
11
12
 Преимущества:



логичность построения, четкость
определения признаков,
большой объем информации,
удобство использования.
 Недостатки:


жесткая структура,
невозможность группировать объекты по
заранее не предусмотренным сочетаниям
признаков.
13
Фасетный - это такой метод классификации,
при котором заданное множество делится
на независимые группировки по
различным признакам классификации.
14
 Фасет — набор значений одного признака
классификации. Каждый объект может
входить одновременно в разные
классификационные группировки.
Система устанавливает порядок следования
фасетов и количество классификационных
группировок.
15
16
 Процедура классификации состоит в
присвоении каждому объекту
соответствующих значений из фасетов. При
этом могут быть использованы не все
фасеты.
17
 Для каждого объекта задается конкретная
группировка фасетов структурной
формулой, в которой отражается их
порядок следования.
Кs=(Ф1, Ф2, …, Фi, …, Фn ),
где Фi – i-й фасет;
n – количество фасетов.
18
 Преимущества:


гибкость структуры (приспособление к
изменениям в задачах),
дает возможность вводить новые фасеты
или удалять старые.
 Недостатки:

сложность ее построения, т. к. необходимо
учитывать все многообразие
классификационных признаков.
19
Модель категориального маятника
20
Дескрипторная система
классификаций
Используется для классификации объектов на
естественном языке (например библиотечное дело)
1. Подбирается совокупность ключевых слов или
словосочетаний описывающих определенную
область (среди этих признаков могут быть
синонимы);
2. Выбранные ключевые слова подвергаются
процедуре нормализации, т.е. из совокупности
синонимов выбрать один (несколько), которые
используются наиболее часто;
3. Составляется словарь дескрипторов.
21
Между дескрипторами устанавливаются связи, которые
позволяют расширять область поиска информации,
которые бывают трех типов:
• синонимические (студент – ученик – обучающийся)
• родовидовые (университет – факультет – кафедра)
• ассоциативные (студент – учеба – аудитория –
лекция)
22
Международные системы:
• Десятичная классификация Дьюи (ДКД)
• Универсальная десятичная классификация (УДК)
Национальная классификационная система России:
• Библиотечно-библиографическая классификация
(ББК)
23
Универсальная десятичная
классификация (УДК) —
система классификации информации, широко
используется во всём мире для систематизации
произведений науки, литературы и искусства,
периодической печати, различных видов документов
и организации картотек.
24
Основные разделы УДК по ГОСТ 7.90-2007
 Общий
отдел. Наука и знание. Информация. Документация. Библиотечное
дело. Организации. Публикации в целом.
 Философия. Психология.
 Религия. Богословие.
 Общественные науки.
 (Резерв для будущего применения.) Свободен с 1962 года. Содержание
перенесено в отдел 8[5].
 Математика. Естественные науки.
 Прикладные науки. Медицина. Технология.
 Искусство. Фотография. Музыка. Игры. Спорт.
 Языкознание. Лингвистика. Художественная
литература. Литературоведение.
 География. Биографии. История.
25
26
27
Классификаторы имеют двоякое
применение.
Первое - для ручного проставления кодов в
документах.
Во втором случае применения кодов
предусматривается хранение всех
классификаторов в памяти машины, на
машинных носителях в банке данных, в
качестве словарного фонда или условнопостоянной информации.
28
Типы классификаторов
Классификатор - это систематизированный
свод наименований объектов и признаков
классификации и (или)
классификационных группировок и их
кодовых обозначений.
29
 По охвату области применения
классификаторы делятся на:
общегосударственные классификаторы —
разрабатываемые централизовано и
являющиеся едиными для всей страны.
Например, различные классификаторы
статистической отчетности:
общегосударственный классификатор
предприятий и организаций (ОКПО),
общегосударственный классификатор отраслей
народного хозяйства (ОКОНХ);

30
отраслевые классификаторы —
разрабатываемые для классификации объектов
в отдельных отраслях.
 локальные классификаторы —
разрабатываемые для обозначения
номенклатуры объектов, характерных для
конкретного предприятия, организации, банка.
Для обеспечения единого подхода к
классификации экономической информации
используют целый ряд классификаторов
входящих в Единую систему классификации
и кодирования (ЕСКК).

31
2. Кодирование информации
 Кодирование — процесс условного
буквенно-числового обозначения объектов
и их групп по соответствующей системе
кодирования.
 Система кодирования — совокупность
правил присвоения условного обозначения
объектам с использованием кода.
32
 Код (условное обозначение объекта)
базируется на определенном алфавите
(множестве знаков).
 Число знаков алфавита называется
основанием кода.
33
 Системы кодирования можно разбить на
два больших подмножества:


Регистрационные
Классификационные
34
 Регистрационные системы кодирования
независимы от применяемой системы
классификации объектов.
 Такие коды используются для
идентификации объекта при вводе и
передаче информации.
 К регистрационным относятся порядковая
и серийная системы кодирования.
35
Порядковый метод - это такой метод
кодирования, при котором кодовыми
обозначениями служат числа
натурального ряда.
При порядковом методе каждой единице
информации присваивается номер по
порядку без какого-либо пропуска
номеров. Новые элементы получают
номера в конце имеющегося перечня.
36
Серийно-порядковый метод кодирования
предполагает разделение информации по какомулибо признаку на отдельные части (серии).
Для каждой серии отводится своя группа условных
обозначений. При этом номера единиц
информации последующих серий не продолжают
строго последовательно номера имеющихся
единиц информации предыдущей серии, а между
ними делается разрыв.
37
 Классификационные системы
кодирования применяются для отражения
взаимосвязей объектов и групп.
В качестве квалификационных систем
используются:
 последовательная;
 параллельная.
38
Последовательный метод - это такой
метод кодирования, при котором в
кодовом обозначении последовательно
указываются зависимые признаки
классификации.
Кодируемые объекты систематизируются по
признакам на каждом уровне
классификации, каждому признаку
выделяется фиксированное число
разрядов, в пределах которых
кодирование начинается с единицы.
39
Параллельный метод - это такой метод
кодирования, при котором в кодовом
обозначении объекта классификации или
классификационной группировке
указываются независимые признаки
классификации.
40
Система кодирования, использующая
разные методы
Система кодирования
Классификационная
Последовательная
(для
иерархической
классификации)
Параллельная
(для фасетной
классификации)
Регистрационная
Порядковая
Серийнопорядковая
41
Штрих-коды
 Для автоматизации ввода значений числового
кода в информационную систему получили
широкое распространение системы штрихового
кодирования.
 В данном методе применяется принцип двоичного
кодирования информации с помощью 0 и 1.
 Штрих-код представляет собой набор
чередующихся черных и белых полос. Широким
полосам присваивается значение 1, узким — 0.
42
Области применения штрих-кодов
 Основными областями применения штрих-кодов
являются розничная и оптовая торговля,
логистика, складской учет и другие области,
связанные с движением товаров.
43
Системы штрихового кодирования
Система штрихового кодирования — совокупность
вида штрихового кода, технических и программных
средств нанесения кода на поверхность, считывания
кода, верификации предварительной обработки данных.
 Для унификации штриховых кодов используются
унифицированные системы кодирования:

UPC — универсальный торговый код, разработан и
применяется в США и ряде стран Америки;

EAN — товарный код, разработан в Европе;

UCC/EAN — единый стандартизованный штриховой
код; создан объединенными усилиями организаций
США и Канады (Uniform Code Council) и Европейской
ассоциацией товарной нумерации (EAN International).

44
Пример штрих-кода EAN-13
45
 Aztec и PDF 417 standart
46
3. Примеры кодирования
экономической информации
Порядковый метод
Примером использования порядкового метода
кодирования является систематизация домов на
улице, квартир в доме и т.д.
Удобство этого метода в простоте, а к недостаткам
можно отнести отсутствие всякой классификации,
невозможность вставить элемент внутрь,
выделить группы однородных признаков.
47
В качестве примера рассмотрим кодирование
единиц измерения.
Единица измерения
Код
Миллиграмм
01
Грамм
02
Килограмм
03
Центнер
04
Тонна
05
Метр
06
Пара
07
Штуки
08
48
Серийно-порядковый
Метод используется для множеств, имеющих
классификацию по двум признакам:
старшему признаку отводится своя группа
номеров, внутри которой все элементы
младшего признака кодируются по
порядку. Поэтому этот метод и называется
серийно-порядковым.
49
Код 1 признака
(отдел)
Код 2 признака
(сотрудник)
001
0001
010
0001
010
0002
012
0004
Из приведенной таблицы можно получить, например, следующие коды:
0010001 и 0100001 и др.
50
Последовательный
В качестве примера последовательного метода
кодирования рассмотрим присвоение кодовых
обозначений наименованиям материалов по
укрупненной номенклатуре. Для этого материалы
делят на классы, каждый класс - на подклассы,
подкласс - на группы, группы - на подгруппы, а
каждая подгруппа содержит определенное число
наименований, сортов и размеров материалов
51
Например, класс - это основные и
вспомогательные материалы; подкласс это черные, цветные металлы и т. д.;
группа для черных металлов - это чугун,
сталь и т. д.; подгруппа для стали круглая, листовая и т. п.; и наконец, всякий
материал имеет сорт и размер.
52
Класс
(2 разрядаосновные и
вспомогательны
е материалы)
Подкласс
(1 разряд
– черные,
цветные и
т .д.
металлы)
Группа
(1 разряд –
для черных
металлов:
чугун, сталь и
т.д.)
Подгруппа
(2 разряда –
для стали:
круглая,
листовая)
Сорт, размер
(3 разряда)
01
1
1
01
001
01
2
2
05
050
10
1
5
09
120
15
9
9
01
055
15
9
9
02
150
Из приведенной таблицы можно получить, например,
следующие коды: 011101001 и 012205050 и др.
53
 ОКПО – присваивается органами
государственной статистики
предприятиям, организациям, фирмам
любой формы собственности – состоит из
3 блоков.
 1) регистрационный номер – 7 знаков –
для форм финансовой отчетности;
54
 2) наименование организации;
 3) ведомственная, территориальная и
отраслевая принадлежность предприятия,
организации, фирмы – для органов
гостатистики.
55
Параллельный
В качестве примера параллельного метода
рассмотрим классификацию сотрудников
предприятия. Здесь можно учитывать
такие классификационные признаки, как
пол, возраст, образование, семейное
положение и др. Очевидно, что все эти
признаки не зависят друг от друга.
56
Структура кода (в символах) может быть
следующей:
 табельный номер сотрудника - 3
 пол - 1
 возраст - 2
 образование - 1
 семейное положение -1
57
 Отраслевой классификатор – единый для
отдельной отрасли. Как правило,
отраслевые классификаторы
разрабатываются в типовых проектах
автоматизированной обработки.
58
 Например, для банковской информации структура лицевого
счета с 1998 года строится в соответствии с
международным стандартом. Код построен по
комбинированной системе и включает до 11 признаков,
значность кода 20 знаков, но может быть расширен до 25.
 Номер балансового раздела,
 Номер счета первого порядка,
 Номер счета второго порядка,
 Код валюты,
 Защитный ключ,
 Номер филиала,
59
 Номер подраздела,
 Номер счета (порядковый),
 Аналитический код,
 Код внутренней аналитический группы,
 Код внутренней группы.
60
61
 Например, для бухгалтерского учета
составлены коды планов счетов, виды
оплат и удержаний из заработной платы,
виды операций движения материальных
ценностей и др.
Download