Урок №11. Разнообразие языков и алфавитов. Естественные и формальные языки.
Информация, полученная человеком из опыта, наблюдений или путём размышлений, должна быть некоторым образом зафиксирована в материальной форме для сохранения и сообщения (передачи) другому человеку.
Всю свою историю для сохранения и передачи информации человечество пользуется разнообразными знаками.
Знак представляет собой заменитель объекта — предмета, явления, действия, свойства или отношения. Знак (набор знаков) позволяет передающему информацию вызвать в сознании принимающего информацию образ объекта.
Знак — это явное или неявное соглашение о приписывании некоторому чувственно воспринимаемому объекту определённого смысла. Соглашение явное, если форма знака позволяет догадаться о его смысле; знаки в этом случае называют пиктограммами (рис. 1.3). Если связь между формой и значением знака устанавливается по договорённости (неявное соглашение), то такие знаки называют символами (рис. 1.4).

Если соглашения о связи формы и значения знаков неизвестны, то невозможно выяснить смысл сообщений, представленных такими знаками. До сих пор не разгаданы письмена острова Пасхи, надписи на Фестском диске и многих других археологических находках. Но некоторые древние письмена учёные всё же смогли расшифровать. О том, как им это удалось, можно узнать из книги Б. Казанского «О том, как были расшифрованы древние письмена». Её можно найти в Интернете.
Люди используют отдельные знаки и знаковые системы.
Знаковая система определяется множеством всех входящих в неё знаков (алфавитом) и правилами оперирования этими знаками. Примером знаковой системы является язык, которым человек пользуется для выражения своих мыслей в общении с другими людьми.
В большинстве современных языков используется алфавитное письмо, где каждый знак (или сочетание знаков) обозначает некоторый звук, так что с помощью небольшого набора знаков {алфавита) можно записать любые слова устной речи.
Алфавит — это набор знаков, который используется в языке.
Обычно знаки в алфавите расположены в определённом порядке.
Вспомните, сколько знаков входит в русский и английский алфавиты.
К алфавиту языка, вообще говоря, нужно отнести пробел (пропуск между словами), цифры (знаки для записи чисел), знаки препинания, скобки.
Мощность алфавита — это количество знаков в алфавите.
Общение между людьми может проходить в устной или письменной форме с использованием соответствующих звуковых или зрительных знаков.
Из курса истории вы знаете, что сначала у человека появилась речь. Значительно позже появилась письменность — знаковая система фиксации мыслей и речи, позволяющая с помощью начертательных элементов закреплять информацию во времени и передавать на расстояние.
В Интернете вы можете найти электронную версию брошюры В. А. Висковатова «Как люди научились писать», изданной в 1886 году. Её оригинал хранится в Государственной публичной исторической библиотеке России. Благодаря современным техническим возможностям вы можете, сидя за своим компьютером, познакомиться с этой книгой и узнать из неё много интересного.
Звуковые знаки, из которых складывается наша устная речь, называются фонемами. Из фонем складываются слоги, из слогов — слова, из слов — фразы. На письме каждую фонему мы обозначаем отдельной буквой или сочетанием букв. Такая письменность называется буквенно-звуковой. Кроме неё, существует слоговое и идеографическое письмо. Слоговое письмо принято в Японии, где отдельным значком обозначается каждый слог. В Китае отдельные значки (иероглифы) используются для обозначения слов; такой способ письма называется идеографическим.
Языки, используемые для общения людей, называются естественными языками. Их насчитывается несколько тысяч. Самым массовым естественным языком считается китайский язык, являющийся родным более чем для миллиарда человек. К числу самых распространённых в мире относится английский язык, используемый более чем в ста странах. Естественные языки характеризуются:
- широкой сферой применения — естественный язык известен всему национальному сообществу;
- наличием большого количества правил, одни из которых сформулированы явно (правила грамматики), другие — неявно (правила смысла и употребления);
- гибкостью — естественный язык применим для описания любых, в том числе новых, ситуаций;
- открытостью — естественный язык позволяет говорящему порождать новые и при этом понятные для собеседника слова, а также использовать существующие слова в новых значениях;
- динамичностью — естественный язык быстро приспосабливается к многообразным потребностям межличностного взаимодействия людей.
Развитие науки и техники повлекло создание формальных языков, применяемых специалистами в профессиональной деятельности. При этом многие формальные языки имеют международное употребление.
Формальный язык — это такой язык, в котором одинаковые сочетания знаков всегда имеют одинаковый смысл. К формальным языкам относятся системы математических, химических символов, нотная грамота, азбука Морзе и многие другие языки. Формальным языком является используемая повсеместно десятичная система счисления, позволяющая именовать и записывать числа, а также выполнять над ними арифметические операции. К формальным языкам относятся языки программирования, с которыми вы будете знакомиться на уроках информатики.
Особенностью формальных языков является то, что все правила в них задаются в явной форме; это обеспечивает однозначность записи и восприятия сообщений на этих языках.
Одна и та же информация может быть выражена разными способами. Человек может представить информацию в знаковой или образной форме (рис. 1.5).

Представление информации с помощью некоторой знаковой системы дискретно (составлено из отдельных значений). Образное представление информации непрерывно.
Для решения своих задач человеку часто приходится преобразовывать имеющуюся информацию из одной формы представления в другую. Например, при чтении вслух происходит преобразование информации из дискретной (текстовой) формы в непрерывную (звук). Во время диктанта на уроке русского языка, наоборот, происходит преобразование информации из непрерывной формы (голос учителя) в дискретную (записи учеников).
Информацию, представленную в дискретной форме, удобно передавать, хранить или обрабатывать с помощью компьютерной техники. Поэтому в наше время большое внимание уделяется методам преобразования информации из непрерывной формы в дискретную.
На метеорологических станциях имеются самопишущие приборы для непрерывной записи атмосферного давления. Результатом их работы являются барограммы — кривые, показывающие, как изменялось давление в течение длительных промежутков времени. Одна из таких кривых, вычерченная прибором в течение семи часов проведения наблюдений, показана на рис. 1.6.

На основании полученной информации можно построить таблицу, содержащую показания прибора в начале измерений и на конец каждого часа наблюдений (табл. 1.1).

Полученная таблица даёт не совсем полную картину того, как изменялось давление за время наблюдений: например, не указано самое большое значение давления, имевшее место в течение четвёртого часа наблюдений. Но если занести в таблицу значения давления, наблюдаемые каждые полчаса или 15 минут, то новая таблица будет давать более полное представление о том, как изменялось давление.
Таким образом, информацию, представленную в непрерывной форме (барограмму, кривую), мы с некоторой потерей точности преобразовали в дискретную форму (таблицу с числами).
С точки зрения теории информации, сообщение — это любой набор знаков некоторого алфавита. Пусть мы хотим отправлять различные сообщения одинаковой длины, используя какой-то алфавит. Конечно, чем короче будет длина сообщений, тем быстрее можно будет их передать. Но вместе с тем если сообщения будут слишком короткими, то количество различных сообщений может оказаться недостаточным. Например, из двух двоичных цифр можно составить только четыре разных сообщения: 00, 01, 10 и 11 — больше, как ни комбинируй, не получится.
Рассмотрим алфавит из четырёх знаков: @#$%. Постройте все возможные сообщения из одного знака. Постройте все возможные сообщения из двух знаков, которые начинаются с буквы @ (вторая буква может быть любой).
Для алфавита @#$% в сообщении из двух знаков первый знак можно выбрать четырьмя способами, и для каждого из них есть 4 варианта выбора второго знака. Поэтому сообщений, состоящих из двух знаков, будет 42 = 16 (рис. 2.2).

Для алфавита из четырёх знаков определите:
- количество сообщений из двух знаков;
- количество сообщений из трёх знаков;
- количество сообщений из четырёх знаков;
- количество сообщений из L знаков.
Для алфавита из М знаков определите:
- количество сообщений из двух знаков;
- количество сообщений из трёх знаков;
- количество сообщений из четырёх знаков;
- количество сообщений из L знаков.
Если алфавит языка состоит из М знаков (имеет мощность М), количество различных сообщений длиной L знаков вычисляется как
N = ML
Для двоичного алфавита (его мощность равна М = 2), получается:
N = 2L.
Алфавит языка содержит буквы «А» и «У». Определите, сколько сообщений из трёх знаков можно записать с помощью этого языка.
Алфавит языка содержит буквы «А», «О» и «У». Определите, сколько сообщений длиной не больше четырёх знаков можно записать с помощью этого языка.
Если длина сообщений может меняться (может быть равна L1 Ь2, LK), то для вычисления общего количества различных сообщений нужно сложить количества сообщений для каждой возможной длины:
N = Nt + N2 + … + NK.