Типы данных полей таблиц

advertisement
Атрибутивные данные
Каждый векторный слой обязательно имеет таблицу атрибутов (атрибутивную таблицу).
Каждому пространственному объекту слоя соответствует одна строка атрибутивной таблицы.
Данные, записанные в этой строке, называются атрибутами объекта.
Физически, информация об объекте хранится на диске в виде трёх файлов,
имеющих одно и тоже имя (обязательно!), но разные расширения:
координаты в файлах с расширением shp и shx; атрибуты – в файле с расширением dbf
File_name.shp
File_name.shx
File_name.dbf
Все три файла должны находиться в одной папке на диске.
Кроме того, ArcGis может хранить табличные данные, не связанные с простраственными
объектами. Поддерживаются форматы Database, Exel и текстовый.
Данные этих таблиц
можно добавить к атрибутам пространственных объектов,
использовать для создания точечных объектов (если таблица содержит координаты),
анализировать статистически.
Таблица database (.dbf)
Полный доступ
Таблица MS EXEL (.xls,xlsx)
Таблица текстового файла (.txt)
В таблице содержания
(Table of contents) таблицы
отображаются только в режиме
источника (Source)
Только чтение
Элементы таблицы.
Имя таблицы (уникальное)
Заголовок таблицы
Тело таблицы
Имена таблиц
- должны начинаться с букв, а не с цифр или спецсимволов типа звёздочки (*) или
процента (%).
- не должны содержать пробелов.
- не должно быть зарезервированных слов, таких как select или add. (Не поддерживаются
названия таблиц, начинающиеся с: "gdb_", "sde_", "delta_".).
- не должны составлять более 32 символов.
Названиям таблиц можно присвоить псевдоним.
Тело таблицы разделено на
строки (= кортежи = записи = records ) и
столбцы ( = колонки = поля = атрибуты = fields),
на пересечении которых (в ячейках = sells) содержатся значения данных.
Имена полей в одной таблице должны быть уникальными
Поле
Ячейка
Строка
Каждое поле таблицы имеет
имя тип и размер.
Поле
Имена полей
должны быть уникальными (в пределах одной таблицы)
начинаться с букв,
содержать только буквы, цифры и знаки подчёркивания
(не допускаются символы: тире (например, x-coord), пробелы и скобки)
не должны превышать 11 символов (для Dbase) (но могут иметь псевдонимы)
Имя поля
Каждое поле таблицы имеет определённый тип.
Все значения в ячейках этого поля должны быть такого же типа.
Текстовое
(символьное)
поле
Числовые поля
Типы данных полей таблиц
(число, текст, дата, идентификатор объектов, глобальный идентификатор, геометрия)
Числа.
Тип данных
Диапазон хранимых значений
Размер
(байты)
Кол-во
цифр
Short integer
-32 768 … 32 767
2
-2 147 483 648 … 2 147 483 647
4
-3.4*1038 … 1.2*1038
4
6 (7)
-2.2*10308 … 1.8*10308
8
15
(короткое целое число)
Long integer
(длинное целое число)
Float
(действительное число обычной точности)
Double
(действительное число двойной точности)
Компьютеры могут хранить только ограниченное число цифр, что определяется количеством выделенного дискового
пространства. Поля с типом double могут хранить числа, которые состоят не более, чем из 15 цифр, потому что это
самое длинное число, которое можно «вписать» в 8 байт дискового пространства. Числа, которые имеют более 15 цифр,
будут округляться.
Например, если вы введете двадцатизначное число 12 345 678 901 234 567 890, то оно будет округлено до числа
1.23456789012346E+19. (E+19 определяет местоположение десятичной точки).
12 345 678 901 234 567 890
12 345 678 901 234 567 000
Текст (Text) - набор текстовых символов;
ArcGIS использует для кодирования символов Уникод.
В Уникод имеется уникальный номер для каждого символа основных мировых систем письменности,
а также технических символов, знаков пунктуации и других символов, используемых в письменности.
Уникод содержит 1,114,112 кодовых значений. На настоящий момент времени, для них назначено
более 96,000 символов.
Используются три основные кодировки Уникода: UTF-8, UTF-16 и UTF-32.
Вы можете ввести в ячейку текстового поле до 255 символов
Со значениями текстового поля можно выполнять операции сложения, сравнения,
замены символов и другие.
Например:
ИГ + Б = ИГБ
21 + 3 = 213
Б > Ю = ИСТИНА
Альтернативой повторяющимся текстовым значениям может быть кодирование
текстовых значений целыми числами.
Дата (Date) – формат в Arcgis - mm/dd/yyyy hh:mm:ss (месяц/день/год
часы:минуты:секунды)
пример: 02/21/12 13:45:15
Идентификатор объектов (Object ID) - автоматически поддерживается в ArcGIS и
гарантирует, что у каждой записи в таблице будет свой уникальный идентификатор.
Глобальный идентификатор (Global ID) - уникально определяет объект
или запись таблицы внутри и вне базы геоданных . Этот тип используется только в базе
геоданных
BLOB - Большой двоичный объект представляет собой некоторую часть данных,
хранимую в базе геоданных в виде длинной последовательности двоичных чисел.
ArcGIS хранит в виде больших двоичных объектов аннотации, объекты-размеры,
изображения, мультимедиа, биты кода. Вам будет нужно использовать пользовательский
загрузчик или вьюер или приложение третьих лиц для загрузки объектов в поле типа
BLOB или просмотра его содержания.
Геометрия (Geometry) - определяет тип геометрии объектов
(точка, линия, полигон, мультиточка или мультипатч) которые хранятся в определенной
таблице.
Точка (Point)
Полилиния (Polyline, Arc).
Не имеет площади, не может быть закрашена.
Полигон (Polygon).
Имеет площадь, может быть закрашен.
Мультиточки — пространственные объекты, составленные более чем из одной точки. Мультиточки часто используются для
управления массивами очень больших совокупностей точек, таких как, например кластеры точек LiDAR, которые могут содержать
буквально миллиарды пунктов. Использование одной записи для каждой точки в такой геометрии точек не выполнимо. Объединение
таких данных в группы мультиточечных записей предоставляет возможность базе геоданных управлять массивными наборами
точек.
Мультипатчи — 3D-геометрия, используемая для представления внешней поверхности или оболочки объектов, которые занимают дискретную
область или объем в трехмерном пространстве. Мультипатчи охватывают плоские 3D окружности и треугольники, используемые в комбинации
для моделирования трехмерной оболочки. Мультипатчи могут использоваться для представления всего, начиная от простых объектов,
например сфер и кубов, до сложных объектов, например изо-поверхностей здания.
Поля таблиц
Соотношение типов данных ArcGis и Access
Тип данных ArcGIS
Тип данных Access
OBJECTID
Long Integer
SHORT INTEGER
Integer
LONG INTEGER
Long Integer
FLOAT
Single
DOUBLE
Double
TEXT
Text
DATE
Date/Time
BLOB
OLE Object
GLOBAL ID (GUID)
Number
GEOMETRY
OLE Object
RASTER
Memo
Объекты связывания и встраивания (OLE) представляют собой объекты, которые были созданы в
других приложениях и сейчас связаны с Microsoft Access или встроены в него. Типы данных
Большой двоичный объект (BLOB) и Геометрия (GEOMETRY) не существуют в Access, поэтому
объект ArcGIS связывается с базой данных Access.
Поля таблиц
Домены
Используются для контролирования значений в полях.
2 типа атрибутивных доменов:
домены с диапазоном (интервальные) – определяют диапазон допустимых значений.
домены с кодированными значениями – определяют набор допустимых значений.
Свойствами доменов являются тип поля, тип домена и правила разбиения и слияния.
Атрибутивный домен с кодированными значениями.
Правила разбиения
Значение по умолчанию - атрибуты двух итоговых
объектов используют значение по умолчанию,
заданное для данного класса пространственных
объектов или подтипа.
Дублировать - атрибуты итоговых объектов
используют значение атрибута исходного объекта.
Геометрические пропорции (только для полей
числового типа) – значения присваиваются
пропорционально доли размера нового объекта
относительно размера исходного объекта.
Правила слияния
Значение по умолчанию
Суммарное значение (только для числовых полей) значение итогового объекта равно сумме значений
исходных объектов.
Средневзвешенное геометрии (только для числовых
полей) - значение итогового объекта равно
средневзвешенному значению исходных объектов
Поля таблиц
Классификаторы.
Основная таблица легенды Госгеолкарты-200
L_code — ненулевой и уникальный в пределах компоненты код, назначаемый автором для данного
класса объектов;
B_code — код класса (его условного знака) по Эталонной базе изобразительных средств
Госгеолкарты-200/2 (ЭБЗ-200) (0 — признак отсутствия знака в ЭБЗ);
IdF — ссылка на текстовое описание металлотекта (идентификатор строки таблицы металлотектов)
(0 — признак отсутствия значения);
TypeF — код типа металлотекта (1 — рудогенерирующая, рудоносная материнская, рудоносная
продуктивная формации,
2 — рудовмещающая формация, 0 — признак отсутствия значения);
Соединение таблиц.
+
=
Соединение данных обычно используется для присоединения полей
одной таблицы к полям другой на основании значений общего атрибутивного поля.
При удалении соединенной таблицы все данные из присоединенных
таблиц также удаляются.
Когда вы начали сеанс редактирования и присоединили данные, столбцы
из целевой таблицы могут быть редактированы, но вы не сможете напрямую
редактировать данные в присоединенных столбцах.
Если вы добавляете поле, то оно добавляется в целевую таблицу или
слой и не влияет на присоединенные таблицы. Однако при вычислении значений в
столбцах целевой таблицы можно ссылаться на присоединенные столбцы.
Соединения чувствительны к регистру, следите за этим, если соединяете
текстовые поля. Например, значение NEW YORK не соединится с New York.
Соединение таблиц
результат
Таблица 1
Таблица
перекодировки
Таблица 2
Результирующая
таблица
OID
ID
Data
OID1
OID2
OID
ID
Data
OID
ID
Data1
Data2
1
1
ИГ
1
1
1
1
Б1
1
1
ИГ
Б1
2
1
ИГ
2
4
2
1
М1
2
1
ИГ
Б2
3
1
ИГ
3
3
3
1
Б3
3
1
ИГ
Б3
4
1
ИГ
4
2
4
1
Б2
4
1
ИГ
М1
Таблицы MS EXEL
Таблицы Excel доступны в ArcGIS только для чтения, причем если они открыты в ArcGIS, то они и в
Excel открываются только для чтения.
Названия полей берутся из первой строки каждого столбца на листе.
Тип поля, установленный в EXEL игнорируется. В ArcGIS сканируются значения первых восьми строк
поля и на их основании определяется тип этого поля. Если в результате просмотра в отдельном поле
обнаружатся смешанные типы данных, то поле будет возвращено в виде строкового поля, а значения
будут преобразованы в строки.
Числовые поля преобразуются в тип данных Double (с двойной точностью) в ArcGIS.
Вы не можете создавать новые файлы Excel или экспортировать записи в файл Excel средствами
ArcGIS.
Форматирование таблицы Microsoft Excel для использования в ArcGIS
Проверьте, чтобы первая строка листа была правильно отформатирована, так как она будет
источником названий полей в ArcGIS. Вам надо придерживаться этих общих правил, когда будете
называть поля, особенно если планируете потом соединять таблицы Excel с другими таблицами в
ArcMap:
Имена полей должны начинаться с букв.
Имена полей должны содержать только буквы, цифры и знаки подчёркивания.
Имена полей не должны превышать 64 символа.
Если у вас есть ячейки с числовыми данными, датами и проч., проследите, чтобы они были
правильно отформатированы — иными словами, данные с числами должны быть действительно
числовыми. ArcMap просмотрит первые восемь записей, чтобы определить тип формата данных в поле.
Если в этих строках имеются иные типы данных, поле в ArcMap будет восприниматься как текстовое.
ArcMap может считать лишь первые 255 символов в ячейке. Если у вас там больше символов, ArcMap
конвертирует поле в тип BLOB и вы не сможете прочитать, что там находится.
Таблицы Excel, как любые другие таблицы, не имеющие связанных объектов, будут отражены только
на закладке Источник в таблице содержания ArcMap.
Таблицы в текстовых файлах.
По умолчанию, файлы с расширением .txt, .asc или .csv интерпретируются как с
разделителем-запятой, а файлы с расширением .tab - как с разделителем-tab.
Первая строка вашего текстового файла может содержать заголовки.
(ArcGIS использует провайдер Microsoft OLE DB для драйверов Open Database Communication
(ODBC) и текстовый драйвер Microsoft ODBC Text Driver для текстовых файлов, чтобы получать
доступ к табличным данным из текстовых файлов. Драйвер содержит информацию с описанием
данных (схема) для каждого текстового файла с названием schema.ini так, чтобы к данным можно
было корректно обращаться. Этот файл ссылается только на файлы с текстовыми данными
запрашиваемой директории).
При импорте текстового файла ArcGis создаёт файл Schema.ini в папке откуда импортируется
файл. Этот файл содержит информацию о разделители полей.
Пример файла schema.ini
[demog_tab.tab]
Format=TabDelimited
Если текстовый файл не загружается, измените (или создайте) файл schema.ini, чтобы
указать правильный разделитель, например, для файла customers.txt, использующего в качестве
разделителя точку с запятой, добавьте вот что:
[customers.txt]
Format=Delimited(;)
В именах полей не поддерживаются символы: тире (например, x-coord), пробелы и скобки.
Когда вы экспортируете табличные данные в текстовый файл, в выходном файле всегда по
умолчанию используется разграничитель-запятая. Дополнительно эта информация добавляется в
файл schema.ini. Типичный пример файла с названием Export_Output.txt приведен ниже:
[Export_Output.txt]
ColNameHeader=True
CharacterSet=1252
Format=CSVDelimited
Col1=OID Integer
Col2=NAME Char Width 25
Download