Символы (*)

advertisement
Символы
Знак, который мы видим на экране или
напечатанный на бумаге, называется символ
(character). Пробел между словами – тоже символ.
Числа и символы
 Мы знаем, что привычные для нас десятеричные
числа представлены в компьютере как двоичные. Но
удобно ли будет нам смотреть на длинные ряды
нулей и единиц на экране?
 0000 0001 0010 0011 0100 0101 0110 0111 1000 1001 1010
 В компьютерной технике принято рассматривать
цифру как число и как символ.
 Помимо цифр, на мониторы ЭВМ необходимо
выводить еще и множество символов:
математические знаки, буквы, знаки препинания и т. п.
 Ясно, что для вывода каждого символа необходим
некий машинный код, однозначно соответствующий
каждому символу.
 Согласно этому коду можно организовать корректный
вывод каждого символа на дисплей.
Таблица символов
 Давайте подсчитаем, сколько необходимо символов для
вывода информации на дисплей.
 Исторически сложилось так, что первые разработчики
компьютеров были носителями английского языка. Что им
было необходимо обеспечить для вывода на монитор?
 Во-первых, 26 букв английского алфавита (строчных), вовторых, 26 прописных, 9 знаков препинания (. , : ! " ; ? ( ) ),
пробел, 10 цифр, 5 знаков арифметических действий (+ - * /
^) и специальные символы (№ % _ # $, и так далее & > < | \).
 Получается чуть больше сотни символов.
 Такой набор символов можно закодировать при помощи
семиразрядного двоичного числа, то есть 7 байтами.
 Получилось 128 позиций.
Таблица символов получила название
ASCII (American Standard Code
for Information Interchange - Стандартный
американский код обмена информацией).
Система кодировки ASCII
 Первые 32 символа таблицы ASCII (от 00 до 31)
используются для непечатаемых символов. Они
предназначены для управления печатающим
устройством и т.п.
 Остальная часть – от 32 до 127 – обычные
(печатаемые) символы.
Структурные свойства таблицы
На первый взгляд кажется, что цифры в таблице имеют странные
номера – от 48 до 57. Но это только в десятеричном выражении.
Если мы посмотрим на их номера в двоичном счислении, мы можем
заметить строгую закономерность.
 Цифры 0 — 9
представляются своими
двоичными значениями
(например, 5 = 0101), перед
которыми стоит 0011.
 Таким образом,
числа превращаются в
символы с помощью
простого добавления слева
0011,
а символы в числа, если
слева убрать 0011.
Структура алфавита
 Если мы посмотрим на
двоичные коды букв, мы
увидим следующую
закономерность:
 Перед заглавными
буквами A-Z (верхнего
регистра) стоит 010.
 Перед строчными
буквами a-z (нижнего
регистра) стоит 011.
 Буквы представляются
своими порядковыми
номерами в алфавите,
записанными в двоичной
системе счисления
(00001 – 11010), что
соответствует 1 - 26.
 Это упрощает
преобразование регистра и
сортировку по алфавиту.
Управляющие символы
 Поскольку ASCII изначально предназначался для обмена
информацией (по телетайпу), в нём, кроме информационных
символов, используются символы-команды для управления
связью.
 Управляющие символы имеют коды от 0 до 31, не
выводятся на дисплей и не печатаются.
 Вот некоторые из них:
 03, ETX — End of Text, конец текста. Сочетание клавиш Ctrl-C,
имеющее код 03, часто используется для прекращения
работы программ.
 07, BEL — Bell, звонок, звуковой сигнал.
 08, BS — Backspace, стирает предыдущий символ.
 10, LF — Line Feed, перевод строки.
 12, FF — Form Feed, прогон страницы, новая страница.
 13, CR — Carriage Return, возврат каретки
Download