Теория:

Текст — зафиксированная на каком-либо материальном носителе человеческая мысль; в общем плане связная и полная последовательность символов.
Текст состоит из символов — букв, цифр, знаков препинания и т.д., которые человек различает по начертанию. Компьютер различает вводимые символы по их двоичному коду.
При нажатии на клавиатуре символьной клавиши, в компьютер поступает определённая последовательность электрических импульсов разной силы, которую можно представить в виде цепочки из нулей и единиц (двоичного кода).
Разрядность двоичного кода ( \(i\) ) и количество возможных кодовых комбинаций ( \(N\) ) связаны соотношением: \(2\) в степени \(i = N\).
Восьмиразрядный двоичный код позволяет получить \(256\) различных кодовых комбинаций: \(2\) в степени \(8 = 256\).
 
Обрати внимание!
Все символы, расположенные на клавиатуре кодируются с помощью восьмиразрядного кода. Исходя из формулы N=2i, получим \(256\) кодовых комбинаций. \(256\) комбинаций хватает на кодировку не только букв, цифр, арифметических знаков, но и основных управляющих символов, например delete, backspace и т. п.
Соответствие кодовых комбинаций и символов можно найти в кодовых таблицах.
 
Абсолютно все используемые кодовые таблицы составляются по международным стандартам кодирования символов.

В любой кодовой таблице первые \(128\) кодов одинаковые:
  • коды с номерами от \(0\) до \(32\) соответствуют управляющим символам;
  • коды с номерами от \(33\) до \(127\) соответствуют изображаемым символам — латинским буквам, знакам препинания, цифрам, знакам арифметических операций и т. д.

Эти коды были разработаны в США и получили название ASCII (American Standart Code for Information Interchange — Американский стандартный код для обмена информацией).
Коды с номерами от \(128\) до \(255\) используются для кодирования букв национального алфавита, символов национальной валюты и т.п. Поэтому в кодовых таблицах для разных языков одному и тому же коду соответствуют разные символы. Более того, для многих языков существует несколько вариантов кодовых таблиц (например, коды русских букв представляют в кодировках Windows, КОИ-8).
 
Перекодирование текстовых документов делают специальные программы-конверторы, встроенные в операционную систему и приложения.
Восьмиразрядные кодировки обладают одним серьёзным ограничением: количество различных кодов символов в этих кодировках недостаточно велико, чтобы можно было одновременно пользоваться более чем двумя языками. 
 
В Unicode (новый стандарт кодирования символов) каждый символ кодируется шестнадцатиразрядным двоичным кодом. Такое количество разрядов позволяет закодировать \(65 536\) различных символов:
\(2\) в \(16\) степени — \(65 536\).

Первые \(128\) символов в Unicode совпадают с таблицей ASCII; далее размещены алфавиты других современных языков, а также все математические и иные научные символьные обозначения. С каждым годом Unicode получает всё более широкое распространение.
 
Пример кодирования в разных кодовых таблицах:
 
unicode.png