Кодування текстової інформації в комп'ютері

category Комп'ютери

Комп`ютер - складний пристрій, за допомогою якого можна створювати, перетворювати і зберігати інформацію. Однак ЕОМ працює не зовсім зрозумілим для нас способом - графічні, текстові і числові дані зберігаються у вигляді масивів двійкових чисел. У даній статті ми розглянемо, як здійснюється кодування текстової інформації.

Те, що для нас є текстом, для ЕОМ - послідовність символів. Кожен символ являє собою певний набір нулів і одиниць. Під символами маються на увазі не тільки малі та великі літери латинського алфавіту, але також і розділові знаки, арифметичні знаки, службові символи, спеціальні позначення і навіть прогалину.

Двійкове кодування текстової інформації

При натисканні певної клавіші на внутрішній контролер надсилається електричний сигнал, який перетворюється в двійковий код. Код зіставляється з певним символом, який і виводиться на екран. Для представлення латинського алфавіту в цифровому форматі була створена міжнародна система кодування ASCII. У ній для запису одного символу необхідний 1 байт, отже, символ складається з восьмизначний послідовності нулів та одиниць. Інтервал запису - від 00000000 до 11111111, тобто кодування текстової інформації за допомогою даної системи дозволяє представити 256 символів. У більшості випадків цього буває достатньо. двійкове кодування текстової інформації

ASCII розділена на дві частини. Перші 127 символів (від 00 млн до 01111111) є інтернаціональними і являють собою специфічні символи і букви англійського алфавіту. Друга ж частина - розширення (від 10 млн до 11111111) - призначена для представлення національного алфавіту, написання якого відмінно від латинського.

Кодування текстової інформації в ASCII побудовано за принципом зростаючої послідовності, тобто чим більше порядковий номер латинської літери, тим більше значення її ASCII-коду. Цифри і російська частина таблиці побудовані за тим же принципом.

Однак у світі існує ще кілька видів кодування для букв кирилиці. Найпоширеніші - це ЯКІ-8 (восьмібітного кодування, що застосовувалася вже в 70-х роках на перших руіфіцірованних ОС Unix), ISO 8859-5 (розроблена Міжнародним бюро стандартизації), СР 1251 (кодування текстової інформації, що застосовується в кодування та обробка текстової інформації сучасних ОС Windows), а також 2-байтовая кодування Unicode, за допомогою якої можна уявити 65536 знаків. Таке різноманіття кодувань обумовлено тим, що всі вони розроблялися у різний час, для різних операційних систем і з різних міркувань. Через це часто виникають труднощі при перенесенні тексту з одного носія на іншій - при розбіжності кодувань користувач побачить лише набір незрозумілих значків. Як можна виправити дану ситуацію? В Word, наприклад, при відкритті документа видається повідомлення про проблеми з відображенням тексту і пропонується кілька варіантів перекодування.

Отже, кодування та обробка текстової інформації в надрах комп`ютера - процес досить складно організований і трудомісткий. Усі символи будь-якого алфавіту являють собою лише певну послідовність цифр двійковій системи, один осередок - це один байт інформації.

Схожі повідомлення

Завадостійке кодування: з чого все починалося?

Ні для кого не становить секрету той факт, що при передачі будь-якого повідомлення інформація може бути перекручена, тобто в переданих відомостях можлива поява помилкових даних. Спотворення інформації може відбуватися під дією безлічі…

Кодування html. Як фарбуються веб-сторінки

Як спосіб кодування інформації для здійснення її передачі через мережу Інтернет використовується кодування html. Визначальним параметром в ході цього процесу служить задіяне кількість бітів, саме з їх допомогою передають певний символ. Так один біт…

Яким чином відбувається кодування графічної інформації в комп'ютері?

У середині минулого століття, у зв'язку з потребою наочного подання даних, почало зароджуватися кодування графічної інформації. На сьогоднішній день ми вже не можемо уявити собі повноцінного комп'ютера без великого глянцевого екрану. Сучасні екрани…

Скільки біт в байті? Що таке біт і байт?

Всі фотографії, текстові документи і програми зберігаються в комп'ютерній пам'яті у вигляді бітів і байтів. Що являють собою ці дрібні одиниці інформації і скільки біт в байті?Зберігання даних в пам'ятіКомп'ютерна пам'ять являє собою величезний…

Кодування - це ... Знакові системи: кодування інформації

Кодування інформації - неймовірно широка галузь знань. Зрозуміло, вона безпосередньо пов'язана з розвитком цифрової техніки. У багатьох сучасних навчальних закладах найпопулярніша тема - кодування інформації. Сьогодні ми вивчимо основні трактування…

Розшифровка штрих-коду. Корисна інформація

У даній статті буде розказано, що таке розшифровка штрих-коду, за допомогою якого спрощують запис інформації. Штрих-кодом називають закодовану інформацію, що зчитується спеціальними пристроями. Її наносять на упаковку, вона має вигляд штрихів.…

Номінал резистора - способи запису

Резистори - це елементи електричних ланцюгів, що володіють опором проходженню електричного струму. Вони застосовуються у всіх електричних схемах, навіть у найелементарніших. Розрізняють резистори за такими ознаками: по потужності, за значенням…

Особливості сучасних систем передачі інформації

На перший погляд ці поняття можуть здатися синонімами, однак вони мають зовсім різні значення.Шифром називають спосіб перетворення інформації з метою її захисту від несанкціоннованіх користувачів. Науку, що вивчає ці методи і способи шифрування…

Змістовний і алфавітний підхід до вимірювання інформації

Розвиток комп'ютерної техніки в новому інформаційному столітті викликає безліч додаткових питань, відкриває нові можливості і знання. Але разом з цим і виникає безліч дилем, які необхідно вирішити. Так, наприклад, вивчаючи комп'ютерну техніку,…

UkrGuru.ru » Комп'ютери » Кодування текстової інформації в комп'ютері