Содержащее большой объем информации. Урок информатики и ИКТ "Измерение информации. Алфавитный подход". Разделы на этой странице

09.02.2019
Алфавитный подход к измерению информации

Однако любое техническое устройство не воспринимает содержание информации.Поэтому в вычислительной технике используется другой подход к определению количества информации. Он называется алфавитным подходом .

При алфавитном подходе к определению количества информации отвлекаются от содержания информации и рассматривают информационное сообщение как последовательность знаков определенной знаковой системы.
Проще всего разобраться в этом на примере текста, написанного на каком-нибудь языке. Для нас удобнее, чтобы это был русский язык.
Все множество используемых в языке символов будем традиционно называть алфавитом. Обычно под алфавитом понимают только буквы, но поскольку в тексте могут встречаться знаки препинания, цифры, скобки, то мы их тоже включим в алфавит. В алфавит также следует включить и пробел, т.е. пропуск между словами.

Если вы не нашли ответ, который вы ищете, вы можете использовать раздел комментариев, чтобы прокомментировать новый вопрос. Наша система позволяет создавать коды со следующими типами информации. Если вы внесете какие-либо изменения, настоятельно рекомендуется выполнить тесты, чтобы прочитать код, чтобы обеспечить его правильную функциональность.

Рассчитайте, сколько вариантов можно выделить по заданному числу вопросов и наоборот. В каких единицах измеряется информация, что представляет собой один бит информации.

  • Оцените взаимную независимость отчетов.
  • Как измеряется информация и почему?
  • Рассчитайте объем информации в этом отчете.
Счастливая и счастливая жизнь может, без сомнения, жить, не зная, как получить информацию. Но если мы сформулируем полученные выводы как «упавшие с неба», гимназист останется недовольным. Найти подходящую меру для количества является довольно необычной, но более интересной задачей.

Алфавит - множество символов, используемых при записи текста.

Мощность (размер) алфавита - полное количество символов в алфавите.

Будем обозначать эту величину буквой N . Например, мощность алфавита из русских букв и отмеченных дополнительных символов равна 54.
Представьте себе, что текст к вам поступает последовательно, по одному знаку, словно бумажная ленточка, выползающая из телеграфного аппарата. Предположим, что каждый появляющийся на ленте символ с одинаковой вероятностью может быть любым символом алфавита. В действительности это не совсем так, но для упрощения примем такое предположение. В каждой очередной позиции текста может появиться любой из N символов. Тогда, согласно известной нам формуле N = 2 I (см. ) каждый такой символ несет I бит информации, которое можно определить из решения уравнения: 2 I = 54. Получаем: I = 5.755 бит - такое количество информации несет один символ в русском тексте.

Разделы на этой странице

Поэтому мы написали этот относительно естественный вывод. Но не следует ожидать, что студенты придут сами. Этот урок является более интерпретирующим по сравнению с другими, студенты выполняют довольно частичные и однозначно назначенные задачи. Тщательное внимание должно быть уделено пониманию того, что мы делаем и что делаем мы все время. Не менее важно хорошее понимание предыдущей ткани, что упрощает рассмотрение.

Единицы измерения количества информации

Точно так же студенты не могут рассчитывать на вычеты. Как и в случае с другими субъектами, целью здесь является передача упрощенного мыслительного процесса, который приведет к информированию. Помните, что ученики будут конечными знаниями и опытом для их получения.

Чтобы найти количество информации во всем тексте, нужно посчитать число символов в нем и умножить на I.
Посчитаем количество информации на одной странице книги. Пусть страница содержит 50 строк. В каждой строке - 60 символов. Значит, на странице умещается 50x60=3000 знаков. Тогда объем информации будет равен: 5,755 х 3000 = 17265 бит.

При алфавитном подходе к измерению информации количество информации зависит не от содержания, а от размера текста и мощности алфавита.

Мы работаем с примером неизвестного времени суток, что является доступной для студентов ситуацией, но в то же время достаточно богатой для различных отчетов. Мы формулируем требования к «масштабности» информации и пытаемся выяснить, какие требования будут соответствовать. Существенным является требование подсчета количества информации в независимых отчетах. Именно в нашей упрощенной школьной ситуации, а также в реальном деривации с энтропией это приводит к использованию логарифма. Мы постепенно изучим несколько вариантов измерения информации.

Таким образом, алфавитный подход к измерению информации можно изобразить в виде таблицы:




При использовании двоичной системы (алфавит состоит из двух знаков: 0 и 1) каждый двоичный знак несет 1 бит информации.

Применение алфавитного подхода удобно, прежде всего, при использовании технических средств работы с информацией. В этом случае теряют смысл понятия «новые - старые», «понятные - непонятные» сведения.

Для первых двух мы находим примеры, которые нарушают наши требования. Только сохраненные вопросы работают, как ожидалось. Сохраненные вопросы уже являются логарифмом. Это, как правило, трудная тема для студентов. Вот почему мы кружили его долгое время. При необходимости его можно вообще избегать и работать только с приблизительно числом вопросов, соответственно. высота решение деревья.

Конечно, нет необходимости действовать точно в соответствии с учебником. Студенты могут, например, пропустить что-то вроде тривиальной проницательности или найти что-то самостоятельно, но в неожиданном порядке. В таком случае нет смысла препятствовать им пытаться вернуть их на «правильный путь».

Алфавитный подход является объективным способом измерения информации в отличие от субъективного содержательного подхода.

Удобнее всего измерять информацию, когда размер алфавита N равен целой степени двойки. Например, если N=16, то каждый символ несет 4 бита информации потому, что 2 4 = 16. А если N =32, то один символ «весит» 5 бит.

Информационный объем текста и единицы измерения информации

Этот урок достаточно требовательный для внимания студентов и абстрактного мышления, но вознаграждение - это способность подсчитывать количество информации в отчете. Разумеется, все подсчеты в течение часа могут быть проще с помощью компьютеров. В этой главе вы найдете некоторые из наиболее важных частей теории информации. На основе предыдущих подготовительных работ мы, наконец, узнаем, как измерить объем информации. Во-первых, мы думаем о том, чего мы ожидаем от измерения информации. Затем, с помощью примера дневного времени, мы исследуем несколько способов подсчета, и мы постепенно поправимся.

Ограничения на максимальный размер алфавита теоретически не существует. Однако есть алфавит, который можно назвать достаточным. С ним мы встречались при рассмотрении темы . Это алфавит мощностью 256 символов. В алфавит такого размера можно поместить все практически необходимые символы: латинские и русские буквы, цифры, знаки арифметических операций, всевозможные скобки, знаки препинания....
Поскольку 256 = 2 8 , то один символ этого алфавита «весит» 8 бит. Причем 8 бит информации - это настолько характерная величина, что ей даже присвоили свое название - байт.
1 байт = 8 бит.

Эта глава не просто читается в трамвае, и вы можете не понимать все прямо сейчас. Не делайте ничего об этом и возвращайтесь к тексту вовремя. Когда вы знаете, где, где и почему это происходит, вы будете читать и понимать намного проще. В любом случае, наконец, необходимо знать, как рассчитывается количество информации.

Сколько вопросов о количестве опций?

В конце главы мы используем математическую функцию логарифма. Если вы еще этого не сделали, пропустите проходы и верните их позже. Незначительное напоминание: наибольшее количество вопросов, необходимых для принятия решения по данному дереву, также называется высотой дерева. Если дерево оптимально, высота дерева соответствует оптимальному числу вопросов.

Цель урока: познакомить с понятиями: “измерение информации”, “алфавит”, “мощность алфавита”, “алфавитный подход в измерении информации”, научить измерять информационный объём сообщений, с учётом информационного веса символов.

Тип урока: объяснительно-демонстрационный с элементами практикума.

Нагляднось: презентация “Измерение информации” (приложение 1).

Если мы сделаем все возможное, мы раскроем один из шестнадцати вариантов с четырьмя вопросами. Сколько из возможностей мы можем решить, если у нас есть 5 вопросов? Вам не нужно беспокоиться о том, чтобы вообразить деревья, которые вы нарисовали. Сформулируйте свой собственный результат и свои собственные рассуждения, затем сравните с предложением. Проверьте, подходит ли выбранная аргументация для других случаев - один, два и три вопроса. Попытайтесь построить соответствующее оптимальное дерево решений с пятью вопросами. Вы уже можете выяснить, сколько ответов вы получили от простой формы дерева. Признайте, что нет необходимости дополнять конкретные вопросы и варианты. . Та же ситуация с другой стороны: на сколько вопросов вы смеете угадывать один вариант из 256?

Учебная литература: учебник “Информатика”. 8-й класс (базовый курс) И.Г.Семакин, “Информатика” задачник-практикум (1 часть) И.Г.Семакин.

Требования к знаниям и умениям:

Учащиеся должны знать:

  • что такое “алфавит”, “мощность алфавита”, “алфавитный подход в измерении информации”;
  • как измерить информационный объём;
  • как определяется единица измерения информации бит;
  • что такое байт, килобайт, мегабайт, гигабайт.

Учащиеся должны уметь:

Формула вычисления количества информации

Используйте процедуру, аналогичную предыдущему вопросу. Кроме того, вы также можете использовать найденный ответ. Создайте утилиту электронной таблицы, чтобы определить количество разрешимых параметров по количеству вопросов. К примеру, количество вопросов может увеличиваться в один столбец, соответствующее количество опций рассчитывается в следующем столбце.

Взаимосвязь между количеством опций и количеством необходимых вопросов можно охарактеризовать как количество последовательных разделов числа опционов на два. Вы знаете математическую функцию, которая выражает это? Кто честно построил деревья, благополучно показал, как исходить от количества вопросов к числу вариантов и наоборот. Один вопрос различает два варианта. С двумя вопросами мы будем различать четыре варианта. Кроме того, каждый вопрос означает один дополнительный параметр, позволяющий начать с двух раз больше вариантов.

  • приводить примеры сообщений, несущих 1 бит информации;
  • измерять информационный объем текста;
  • представлять количество полученной информации в различных единицах (битах, байтах, килобайтах, мегабайтах, гигабайтах).

План урока

  1. Орг. момент - 1 мин.
  2. Проверка домашнего задания - 2 мин.
  3. Новый материал. Измерение информации. Алфавитный подход - 25 мин.
  4. Закрепление изученного - 14 мин.
  5. Подведение итогов урока. - 2 мин.
  6. Домашнее задание - 1 мин.

I. Орг. момент.

Если, с другой стороны, мы хотим узнать количество вопросов, которые нам нужно угадать, номер из заданного диапазона, мы можем рассчитать, сколько раз мы делим диапазон на два, прежде чем мы перейдем к единственным оставшимся параметрам. Нам интересно, сколько вопросов угадано, даже если мы совсем не счастливы. Например, рассмотрите 23 варианта. Сколько вопросов у вас есть, чтобы угадать один номер из 23 возможных?

Мы можем ошибаться и устранять «меньшую половину» опций. Поэтому для следующего расщепления мы всегда должны рассчитывать на «большую половину». В 23 вариантах разделение будет следующим. Возможности прыгнули пять раз, поэтому нам нужно 5 вопросов. Если нам повезет, количество вариантов может быть уменьшено следующим образом: 23 → 11 → 5 → 2 → В этом случае достаточно четырех вопросов. Но мы не хотим полагаться на счастье, поэтому мы скорее рассчитываем на дополнительный вопрос.

II. Проверка домашнего задания.

Задачник-практикум № 1. с. 11 № 2, 5, 8, 11, 19 *.

III. Новый материал.

1. Введение.

Процесс познания окружающего мира приводит к накоплению информации в форме знаний.

Как же узнать, много получено информации или нет?

Необходимо измерить объём информации. А как это сделать мы сегодня узнаем.

Некоторым людям может показаться странным, что разное количество вариантов требует одинакового количества вопросов. Это результат структуры дерева решений. Подумайте: вам кажется странным, что у вас есть два родителя, четыре бабушки и дедушки, восемь бабушек и дедушек и т.д.

Нет поколений, в которых вам нужны 6 или 7 прямых предков. Правильно думать, что «лишний» вариант должен взять где-то. Разница будет отражена в количестве вопросов, которые необходимо повторить. В дополнение к «еще одному вопросу, мы можем признать двойную возможность», мы также можем сказать: «с удвоенным числом мы узнаем вторую силу исходного количества возможностей».

Получение новой информации приводит к расширению знаний или, как иначе можно сказать, к уменьшению неопределённости знания.

Если некоторое сообщение приводит к уменьшению неопределённости нашего знания, то можно сказать, что такое знание содержит информацию (рисунок 1).

2. Как можно измерить количество информации.

Для измерения различных величин существуют эталонные единицы измерения.

Обратите внимание на эту диспропорцию: добавление одного вопроса удваивает количество доступных для поиска параметров. Есть 4 вопроса для 16 вариантов, 5 для 32 вопросов. В то же время наивное опрокидывание вопросов потребует в среднем полмиллиона, а с несколькими ошибками почти миллион! Как и в других местах, даже в информатике лучшие практики лучше всего отражают в широких масштабах.

Объем информации, количество исключенных опций и независимые отчеты

Количество информации в сообщении не просто свойство этого сообщения. Это свойство сообщения вместе с получателем. Таким образом, когда два разных получателя рассматривают разные варианты, информационное значение одного и того же сообщения может быть очень различным для них.

Например:

  • Расстояние измеряют в миллиметрах, сантиметрах, дециметрах…
  • Массу измеряют в граммах, килограммах, тоннах…
  • Время измеряют в секундах, минутах, сутках, годах…

Следовательно, для измерения информации должна быть введена своя эталонная единица.

Существует два подхода к измерению информации:

Аналогично, количество информации изменяется в том же сообщении, которое неоднократно получало тот же получатель. Сначала принимая сообщение, он узнает что-то новое, количество полученной информации положительно. Однако, когда сообщение будет получено снова, ничего нового не придет к ней, поэтому количество полученной информации равно нулю.

VI. Домашнее задание

Мы уже немного знаем об этой информации: что это такое, как эффективно их использовать и как долго она длится. Итак, как мы измеряем, какое сообщение приносит больше информации? Можно ли количественно определить количество информации? Насколько мы узнали, принимая отчет, можно рассматривать как разницу между тем, насколько мы не знали, прежде чем мы получили отчет, и насколько мы не знали после его получения. Итак, мы будем искать шаблон в форме.

б) Алфавитный. Позволяет измерять информационный объём текста на любом языке (естественном или формальном), при использовании данного подхода объём информации не связывают с содержанием текста, в данном случае, объём зависит от информационного веса символов.

3. Алфавитный подход к измерению информации.

Давайте вспомним, что же такое алфавит?

Вопросы для самопроверки

«Объем информации» = «неопределенность перед сообщением» - «неопределенность после сообщения». Скорость неопределенности зависит от количества оставшихся вариантов: чем больше мы знаем, тем меньше мы знаем. Меня интересует время с минимальной точностью. Вопрос: Сколько минут доступно для летнего времени?

Вопрос в том, сколько существует разных дней? Если вам это не подходит, вам придется перечислить их все. С течением времени вы узнаете, как сохранить свою работу и быстрее получить результат. Вопрос: Сколько хороших вопросов дает результат Самый короткий путь. с двумя возможными ответами, достаточно ли определить время суток с минимальной точностью?

  • Алфавит – весь набор букв, знаков препинания, цифр, скобок и других символов, используемых в тексте.

*Алфавит включают и пробел (пропуск между словами).

Что такое мощность алфавита?

Например: мощность алфавита русских букв и используемых символов равна 54:

33 буквы + 10 цифр + 11 знаков препинания, скобки, пробел.

Наименьшую мощность имеет алфавит, используемый в компьютере (машинный язык), его называют двоичным алфавитом, т.к. он содержит только два знака “0”, “1”.

Информационный вес символа двоичного алфавита принят за единицу измерения информации и называется 1 бит.

Попробуйте определить объём информационного сообщения:

Информация, записанная на машинном языке, весит:

01110 - … бит

010010 - … бит

010 - … бита

0111111011110 - … бит

При алфавитном подходе считают, что каждый символ текста, имеет информационный вес.

Информационный вес символа зависит от мощности алфавита.

С увеличением мощности алфавита, увеличивается информационный вес каждого символа.

Для измерения объёма информации необходимо определить сколько раз информация равная 1 биту содержится в определяемом объёме информации.

Например:

1) Возьмём четырёхзначный алфавит (придуманный), (рисунок 2).

Все символы исходного алфавита можно закодировать всеми возможными комбинациями, используя цифры двоичного алфавита.

Получим двоичный код каждого символа алфавита. Для того чтобы закодировать символы алфавита мощность которого равна четырём, нам понадобится два символа двоичного кода.

Следовательно, каждый символ четырёхзначного алфавита весит 2 бита.

2) Закодируйте с помощью двоичного кода каждый символ алфавита, мощность которого равна 8 (рисунок 3) .

Вывод. Весь алфавит, мощность которого равна 8 можно закодировать на машинном языке с помощью трёх символов двоичного алфавита (рисунок 4).

Как вы думаете, каков информационный объём каждого символа восьмизначного алфавита?

Каждый символ восьмизначного алфавита весит 3 бита.

3). Закодируйте с помощью двоичного кода каждый символ алфавита, мощность которого равна 16.

Какой можно сделать вывод?

Алфавит из шестнадцати символов можно закодировать с помощью четырёхзначного двоичного кода.

Решите задачу.

Задача: Какой объём информации содержат 3 символа 16 – символьного алфавита?

Так как каждый символ алфавита мощностью 16 знаков можно закодировать с помощью четырёхзначного двоичного кода, каждый символ исходного алфавита весит 4 бита.

Так как всего использовали 3 символа алфавита мощностью 16 символов, следовательно: 4 бит 3 = 12 бит

Ответ: объём информации записанный 3 знаками алфавита мощностью 16 символов равен 12 бит.

Запишем таблицу соответствия мощности алфавита (N) и количеством знаков в коде (b) - разрядностью двоичного кода.

Найдите закономерность (рисунок 5)!

Какой вывод можно сделать?

Информационный вес каждого символа, выраженный в битах (b), и мощность алфавита (N) связаны между собой формулой: N = 2 b

Алфавит, из которого составляется на компьютере текст (документ) состоит из 256 символов.

Этот алфавит содержит символы: строчные и прописные латинские и русские буквы, цифры, знаки арифметических операций, всевозможные скобки, знаки препинания и другие символы.

Узнайте, какой объём информации содержится в одном символе алфавита, мощность которого равна 256.

Решение. Из формулы N = 2 b следует 256 = 2 8 .

Вывод. Значит, каждый символ алфавита используемого в компьютере для печати документов весит 8 бит.

Эту величину приняли так же за единицу измерения информации и дали название байт.

8 бит = 1 байт

Задача. Статья содержит 30 страниц, на каждой странице - 40 строк, в каждой строке 50 символов. Какой объём информации содержит статья?

Ход решения.

1) На каждой странице 50 40 = 2000 символов;

2) во всей статье 2000 30 = 60000 символов;

3) т.к. вес каждого символа равен 1 байту, следовательно, информационный объём всей статьи 60000 1 = 60000 байт или 60000 8 = 480000 бит.

Как видно из задачи байт “мелкая” единица измерения информационного объёма текста, поэтому для измерения больших объёмов информации используются более крупные единицы.

Единицы измерения информационного объёма:

1 килобайт = 1 Кб = 210 байт = 1024 байт

1 мегабайт = 1 Мб = 210 Кб = 1024 Кб

1 гигабайт = 1 Гб = 210 Мб = 1024 Мб

Попробуйте перевести результат задачи, в более крупные единицы измерения:

    60000 байт 58,59375 Кб

    60000 байт 0,057 Мб

IV. Закрепление изученного.

Задачник-практикум № 1. С. 19 № 19, 20, 22, 23, 25.

V. Подведение итогов.

VI. Домашнее задание.

Задачник-практикум № 1. с. 20 № 21, 24, 26.