Помощничек
Главная | Обратная связь


Археология
Архитектура
Астрономия
Аудит
Биология
Ботаника
Бухгалтерский учёт
Войное дело
Генетика
География
Геология
Дизайн
Искусство
История
Кино
Кулинария
Культура
Литература
Математика
Медицина
Металлургия
Мифология
Музыка
Психология
Религия
Спорт
Строительство
Техника
Транспорт
Туризм
Усадьба
Физика
Фотография
Химия
Экология
Электричество
Электроника
Энергетика

Способы представления информации в ЭВМ



3.1.1. Виды информации

По мере развития вычислительной техники все более расширялись границы применения ЭВМ. Если первоначально они использовались для математических вычислений, то в настоящее время применяются преимущественно для обработки информации. Информация —это одно из наиболее общих понятий, обозначающее некоторые сведения, совокупность каких-либо данных, знаний и т.п.

Все мы существуем в мире информации. Человек непосредственно воспринимает окружающий мир, т.е. получает информациюс помощью органов чувств. Наибольшее количество информации (примерно 80...90%) человек получает с помощью зрения, примерно 10... 15 % — с помощью слуха и только 1 ...2 % — с помощью других органов чувств (обоняния, осязания и вкуса). Полученная в форме зрительных, слуховых и других образов информация сохраняется в памяти человека и используется в повседневной жизни. При этом в мозгу человека происходит обработка информации.На основе информации, полученной с помощью органов чувств, и теоретических знаний, приобретенных в процессе обучения и накопления жизненного опыта, человек создает информационные модели окружающего мира. Такие модели позволяют ему ориентироваться в окружающем мире и принимать разумные решения для достижения поставленных целей.

В процессе общения с другими людьми человек передает и получает информацию. Обмен информацией между людьми может осуществляться в различных формах (письменной, устной или с помощью жестов). Для обмена информацией всегда используется определенный язык (русский, азбука Морзе и т.д.). Для того чтобы информация была понятна, язык должен быть известен всем людям, участвующим в общении. Чем большее количество языков вы знаете, тем шире может быть круг вашего общения.

История человеческого общества — это, в определенном смысле, история накопления и преобразования информации. Весь процесс познания является процессом получения, преобразования и накопления информации (знаний). Но информация может быть получена не только с помощью органов чувств и через общение.

Сам человек может быть творцом информации. Осмысливая (обдумывая) сведения, полученные с помощью собственных органов чувств, различных измерительных приборов, из письменных источников, общения с другими людьми (как непосредственного, так и с помощью радио, телевидения и других средств телекоммуникаций), человек может получать какие-то новые сведения, т.е. переработка информации приводит к появлению новой информации. Таким образом, существует входнаяи выходнаяинформация. Понятие информации является одним из основных в кибернетике — науке об управлении в самых разных системах — технических, биологических, социальных, административных. Важность этого понятия настолько возросла, что появились (выделились из кибернетики) самостоятельные разделы науки, занятые исследованиями самой информации (информатика, информациология) и ее машинной обработки (компьютерная наука — computer science).

Понятие информации обычно предполагает наличие двух объектов — источника информации и ее потребителя (адресата). Для того чтобы информация могла быть передана от источника к адресату, состояние источника должно быть каким-то образом отражено во внешней среде, воздействующей на приемные органы адресата. Материальные объекты, посредством которых происходит перенос информации от источника к адресату, называются носителями информации.Отображение множества состояний источника в множество состояний носителя называется способом кодирования.В общем случае код представляет собой набор некоторого конечного числа символов и систему правил, по которым формируется последовательность этих символов — так называемая кодовая комбинация.С этой точки зрения алфавит, т.е. набор букв, представляет собой код, с помощью которого можно преобразовать устную речь в рукописный или печатный текст. К буквам надо добавить также знаки препинания и пробел, а системой правил можно считать правила грамматики. Для записи мелодии используется набор символов в виде нотных знаков. Информацию о ходе технологического процесса получают с помощью измерительных приборов, показания которых можно записать в виде чисел, а для передачи и хранения этой информации удобно представить ее в виде электрических сигналов. При этом каждому значению напряжения или тока этих сигналов соответствует определенное значение температуры, давления, скорости или иного параметра, характеризующего технологический процесс.

В вычислительной технике, использующей цифровые вычислительные машины, применяются двоичные (бинарные) коды, для которых число символов равно двум (0 и 1). Из этих символов составляется кодовая комбинация — последовательность нулей и единиц. Используя двоичную систему счисления, числа записывают в виде последовательности этих символов. Таким образом, в вычислительной технике с помощью всего двух символов можно и производить вычисления, и обрабатывать любую другую информацию.

В частном случае термин кодированиеможно определить как операцию установления однозначного соответствия между символами или группами символов некоторого кода с символами или группами символов другого кода. В этом смысле перевод чисел из одной системы счисления в другую (например, десятичных чисел в двоичные) — это кодирование.

3.1.2. Количественные характеристики информации

Использование двоичного кода для записи информации позволяет дать количественную оценку информации, т.е. измерить ее. В результате можно определить, много ли мы узнали, получив ту или иную информацию, или сколько информации содержит то или иное сообщение.

Всякая информация извлекается в результате опыта (действия). Таким опытом может быть чтение книги, измерение прибором, визуальное наблюдение событий, консультация со специалистом и т.д. Пусть опыт, который производится с целью получения информации, обусловлен вопросом: «Какой сегодня день недели?» Предположим, что мы не знаем этого и до получения ответа на свой вопрос не можем сами ответить на него однозначно. Таким образом, до опыта имеет место большая или меньшая неопределенность в интересующей нас ситуации. После опыта, т.е. когда мы уже получили ответ, ситуация становится более определенной. На наш вопрос можно ответить либо однозначно (например, «сегодня среда»), либо приблизительно (например, «то ли среда, то ли вторник»). При однозначном ответе неопределенность полностью устраняется (было семь возможных ответов, остался единственный). В случае приблизительного ответа нам число наших возможных ответов уменьшается с семи до двух, т.е. в результате опыта существовавшая ранее неопределенность снижается.

Наиболее удобной для подсчета количества информации является логарифмическая функция. Благодаря применению логарифмов, количества информации, содержащиеся в независимых сообщениях, обладают свойством аддитивности, т.е. общее количество информации равно сумме количеств информации в сообщениях. Выбор коэффициента ки основания алогарифмов не имеет принципиального значения, поскольку они определяют лишь масштаб или единицу количества информации.

Обычно выбирают а = 2 и к =1. При таком выборе единица количества информации называется двоичной.

Двоичную единицу информации часто называют битом. Получение одной двоичной единицы количества информации соответствует случаю, когда мы узнаём, какое из двух равновероятных событий имело место. Если ответом на заданный вопрос может быть с одинаковой априорной вероятностью «да» или «нет», то, получив его, мы тем самым получим одну двоичную единицу информации, или один бит информации.

Удобство применения двоичной единицы информации, в частности, связано с тем, что устройство с двумя устойчивыми со­стояниями может хранить одну двоичную единицу, а птаких уст­ройств могут хранить пбит, так как полное число возможных состояний при этом равно 2n, a log22n = п.

Для ввода текстов в вычислительную машину используются разные правила кодирования. Очень широко применяется кодирование всех знаков (символов), которые могут быть введены с помощью клавиатуры персонального компьютера, восьмиразрядными двоичными комбинациями нулей и единиц. Всего таких комбинаций может быть 28 = 256. Разные кодовые комбинации соответствуют строчным и прописным буквам латинского и русского алфавитов, знакам препинания и пробелу, знакам различных математических операций и некоторым специальным знакам.

Таким образом, при вводе текста с клавиатуры для текстовых символов (буквы русского и латинского алфавитов, цифры, зна­ки препинания) можно использовать восьмиразрядные кодовые комбинации, т.е. п= 8, log228= 8. Следовательно, количество информации в каждом знаке печатного текста можно оценить в 8 бит. Для удобства подсчета количества информации ввели более крупную единицу информации — байт.В одном байте — 8 бит.

Часто при измерении длины, массы, напряжения, сопротивления и многих других физических величин пользуются добавляемыми к наименованию единицы измерения приставками «кило» (к) и «мега» (М), указывающими на увеличение соответственно в тысячу (103) и миллион (106) раз. Аналогичными приставками пользуются и при подсчете большого количества информации, но при этом, поскольку за основу взята не десятичная, а двоичная система счисления, приставка «кило» (в данном случае сокращен­ное обозначение К) указывает на увеличение в 210 = 1024, а мега — 220 = 1 048 576 раз. Для приблизительной оценки количества информации вполне можно принимать, что один килобайт (1 Кбайт) — это примерно тысяча байт, а один мегабайт (1 Мбайт) — примерно миллион байт.

В связи с увеличением числа разнообразных символов появляется необходимость применять более длинные двоичные кодовые комбинации. Например, кодировка Юникод (Unicode) использует 16 разрядов, что соответствует 216 = 65 536 различным комбинациям. В этой кодировке возможен ввод букв алфавитов разных языков, математических, декоративных и иных символов.

В виде двоичных кодовых комбинаций можно представить и рисунки. Черно-белый рисунок на экране компьютера — это совокупность черных и белых точек. Пусть на экране 200 строк, а в каждой строке 300 точек, т.е. общее число точек 300*200=60000. Для обозначения каждой точки можно использовать двоичные цифры (например, 1 — белая, 0 — черная). Весь рисунок займет 60 000 бит, т.е. примерно 7,5 Кбайт.

Всю информацию, которую мы получаем благодаря зрению, тоже можно закодировать двоичными комбинациями и количественно оценить. При этом надо учитывать, что мы видим движущееся изображение. По аналогии с телевизионным изображением можно считать, что за 1 с перед нашими глазами сменяют друг друга 50 неподвижных кадров. Если воспользоваться результатом предыдущего примера, то можно предположить, что благодаря зрению мы воспринимаем информацию в объеме, как минимум, 7,5-50 = 375 Кбайт за 1 с. Но мы ведь видим не черно-белое, а цветное изображение. Пусть каждая точка будет окрашена в один из 16 цветовых оттенков (цветные рисунки на компьютере могут иметь 16, или 256, или и даже большее число градаций, т.е. оттенков). В этом случае можно считать, что каждую секунду через глаза в наш мозг поступает поток информации в количестве 375 • 16 = = 6000 Кбайт ≈ 6 Мбайт.

Звуковую информацию тоже можно кодировать. Например, для записи двоичным кодом человеческой речи используется такая последовательность преобразований. Сначала с помощью микрофона звуковые колебания преобразуются в изменение электрического сигнала. Затем непрерывно изменяющийся во времени сигнал делают прерывистым (дискретным). Этот процесс называют дискретизацией,или квантованием.

Таким образом, для передачи текста, графической информации и звука можно применять двоичные кодовые комбинации. Такое представление информации и используется в вычислительной технике.

3.1.3. Достоинства дискретного сигнала

Первым, главным, достоинством дискретного двоичного сигнала с точки зрения его применения в вычислительной технике является то, что технически очень просто представить два используемых при этом символа (0 и 1). Для этого необходимо электрическое устройство, способное находиться только в двух устойчивых состояниях, которые легко различимы. Такое устройство называется триггером. Триггер содержит два транзистора. В одном состоянии первый транзистор открыт, а второй — заперт, в другом состоянии — наоборот. Иные состояния невозможны. Благодаря успехам микроэлектроники в настоящее время возможно в одной микросхеме разместить миллионы транзисторов. Для записи и хранения большого количества информации используют магнитные и оптические диски. В первых каждый бит информации представлен в виде намагниченной или размагниченной точки, во вторых — в виде наличия или отсутствия крошечной ямки. Современные запоминающие устройства позволяют записать миллиарды бит информации, поэтому, когда речь идет о ее количестве, все чаще используются приставки «гига» (Г), указывающая на увеличение в миллиард (109) раз (для двоичной системы счисления — 230 = = 1 073 741 824 раз), и «тера» (Т), указывающая на увеличение в тысячу миллиардов (1012) раз (для двоичной системы — 240 раз).

Вторым важным достоинством дискретного сигнала является то, что в промежутках между соседними отсчетами одной величины можно передавать отсчеты других величин. Следовательно, по одному и тому же каналу связи можно передавать множество самых разных сообщений. Нередко говорят, что они передаются одновременно, хотя на самом деле один замер от другого отделен некоторым очень малым промежутком времени. При указании величин этих крошечных промежутков времени требуются иные приставки, чем те, что используются при количественной оценке информации: «милли» (тысячная доля, или 10-3), «микро» (миллионная доля, или 10-6), «нано» (миллиардная доля, или 10-9), «пико» (10-12).

Благодаря передаче по одному каналу информации от большого числа источников оказывается возможным объединение нескольких вычислительных машин в сеть, создание глобальных сетей. В этих сетях промежутки между отдельными сигналами, соответствующими 0 и 1, составляют наносекунды.

Третье важное достоинство дискретного сигнала обусловлено тем, что он короткий и отделен от соседнего промежутком (перерывом). Поэтому нагрев электрических схем значительно меньше, чем при передаче непрерывных сигналов, и не требуется большая теплоотводящая поверхность. Значит, размеры элементов могут быть резко уменьшены. Отчасти благодаря этому удается в больших интегральных микросхемах разместить миллионы элементов, хотя главная причина столь большого уровня интеграции — передовые технологии.

Системы счисления

Человек мыслит и обменивается мыслями с себе подобными. Обмен этот осуществляется в основном с помощью звуков — речи, состоящей из отдельных слов. Для сохранения мыслей, выраженных словами, служит письмо, т.е. запись речи определенными значкам. Наибольшее распространение получила буквенная запись, когда для обозначения каждого из звуков, составляющих слово, служит определенный знак. Для обозначения количественных соотношений между объектами, ситуациями, процессами используются числа, которые также могут быть выражены словами. Но для записи чисел используется более экономный способ, чем буквенная запись слов. Числа могут быть записаны с помощью специальных знаков — цифр.

Современное написание цифр десятичной системы счисления пришло к нам из Индии через арабов. Само слово «цифра» происходит от арабского слова «сифр». В XIII в. этими цифрами стали пользоваться в Италии благодаря флорентийским купцам, торговавшим с арабскими. Использование так называемых арабских цифр стало повсеместным в XV в.

При создании ЭВМ надежнее пользоваться схемами, которые могут быть только в двух устойчивых положениях. Например, электромагнитное реле может иметь замкнутый или разомкнутый контакт, определенный участок магнитной ленты может быть намагничен или размагничен и т.д. Поэтому, большинство ЭВМ оперирует числами, записанными при помощи только двух цифр — 0 и 1. Как же представить любое число при помощи только двух цифр? Для этого необходимо использовать двоичную систему счисления.

Счислением называется совокупность приемов наименования и обозначения чисел. Существуют различные системы счисления. Прежде всего они различаются по количеству используемых знаков, т.е. цифр. При записи чисел в десятичной системе счисления пользуются десятью цифрами: 0, 1,2, 3, 4, 5, 6, 7, 8 и 9. Десятичная система является позиционной, поскольку значение каждой цифры в числе зависит от ее положения (позиции) среди других цифр этого числа. Например, в числе 2724,25 имеются три цифры 2. Все они имеют разные значения. Левая цифра указывает значение тысяч (2 тысячи), средняя — значение десятков (2 десятка), а правая (справа от запятой) — значение десятых долей (2 десятых доли). Указанное число является сокращенной записью следующей суммы:

2724,25 = 2 · 103 + 7 · 102 + 2 · 101 + 4 · 10° + 2 · 10-1 + 5 · 10-2.

В числе имеется шесть позиций, т.е. шесть разрядов. Единица каждого разряда равна десяти единицам предыдущего разряда.

В двоичной системе счисления единица каждого разряда равна двум единицам предыдущего разряда. Слева от разряда единиц расположены разряды двоек, четверок, восьмерок и т.д. Чтобы записать число в двоичной системе, нужно представить его в виде суммы последовательных степеней числа 2, умноженных на 0 или 1:

2724,25 = 1 • 211 + 0 • 210 + 1 • 29 + 0 • 28 + 1 • 27 + 0 • 26 + 1 • 25 + 0 • 24 + 0 • 23 +

+ 1 • 22 + 0 • 21 + 0 • 2° + 0 • 2-1 + 1 • 2-2.

Вместо того чтобы записывать десятичное число как сумму последовательных степеней числа 10, умноженных на одну из цифр от 0 до 9, мы пользуемся сокращенной записью (2724,25), т.е. выписываем подряд те цифры, на которые умножаются различные степени числа 10. Аналогично при записи чисел в двоичной системе счисления, вместо того чтобы записывать сумму последовательных степеней числа 2, умноженных на 0 или 1, выписывают только те цифры, на которые эти степени умножаются. Таким образом, (2724,25)10 = (101010100100,01)2.

При двоичной системе счисления приходится записывать большое количество нулей и единиц. Это очень неудобно, особенно при ручном счете или вводе в ЭВМ. Поэтому в вычислительной технике довольно широко применяются и иные системы счисления, прежде всего восьмеричная и шестнадцатеричная.

При записи чисел в восьмеричной системе единица в каждом разряде равна восьми единицам предыдущего разряда. Поэтому в этой системе счисления пользуются только восемью цифрами: 0, 1,2, 3, 4, 5, 6, 7. Запишем число (9775)10 в восьмеричной системе счисления:

(9775)10 = 2 • 84 + 3 • 83 + 0 • 82 + 5 • 81 + 7 • 8° = (23057)8.

Шестнадцатеричная система нередко оказывается еще более удобной при составлении программ. Поскольку арабских цифр у нас только десять (от 0 до 9), то вместо недостающих шести цифр применяют прописные буквы латинского алфавита. Весь набор цифровых символов для шестнадцатеричной системы счисления выглядит так: 0, 1,2, 3, 4, 5, 6, 7, 8, 9, А, В, С, D, Е, F.

При записи чисел в шестнадцатеричной системе единица в каждом разряде равна шестнадцати единицам предыдущего разряда. Запишем число (9775)10 из предыдущего примера в шестнадцатеричной системе счисления:

(9775)10 = 2 • 163 + 6 • 162 + 2 • 16' + F • 16° = (262F)16.

Представление информации в шестнадцатеричной системе гораздо компактнее, поскольку каждая группа из четырех двоичных цифр заменяется одним символом. Запомнить информацию в шестнадцатеричной системе (например, из трех символов) человеку легче, чем в двоичной (из двенадцати символов).

 




Поиск по сайту:

©2015-2020 studopedya.ru Все права принадлежат авторам размещенных материалов.