THE BELL

Есть те, кто прочитали эту новость раньше вас.
Подпишитесь, чтобы получать статьи свежими.
Email
Имя
Фамилия
Как вы хотите читать The Bell
Без спама

Cемантика устанавливает смысловую связь между внутренним языком системы и языком внешней среды. И в отношении этой взаимосвязи информация обладает определенными специфическими свойствами, получившими название семантических.

Оценка объема семантической информации возможна различными способами. Все они в принципе сводятся к получению так называемого семантического конденсата сообщения. В частности, это может быть реализовано путем последовательного исключения из поступившего сообщения элементов, не несущих дополнительной по отношению к остающейся его части смысловой нагрузки.

Необходимо отметить, что понятие смысла сообщения не является вполне однозначным, так как смысл того или иного сообщения зависит и от того, что пытается передать источник информации, и от того, что в этом сообщении является интересным для получателя. Например, один собеседник говорит другому: «Нектоприобрел обалдевающе шикарный , cтрашно дорогой , импортный костюм ».

Объем информации (в предположении равновероятности появления отдельных символов алфавита) будет равен

где m – количество символов алфавита; n – количество символов, вошедших в сообщение, или его семантический конденсат.

Если систем-приемник не интересуют эмоциональные всплески источника, то при оценке объема семантической информации он удалит из текста такие слова, как «обалдевающе» и «страшно». В этом случае объем семантической информации будет равен

Если же получателя интересует только сам факт приобретения, то объем семантической информации еще более уменьшится, поскольку в конденсате останутся только подчеркнутые слова. В этом случае будем иметь

Однако получатель информации может извлечь из этого сообщения такой смысл, о котором источник, возможно, и не думал. Действительно, он может из этого утверждения заключить, что источник завидует купившему. В этом случае конденсат будет выглядеть так:

«Некто приобрел страшно дорогой костюм – завидно».

(Величина I будет равна бит.)

Возможность вывода различных как чисто логических, так и чисто ассоциативных суждений в системе знаний получателя на основе одного и того же информационного сообщения выражает свойство интерпретируемости последнего.

В силу свойства дополняемости, о котором речь пойдет далее, сообщение, поступившее в некоторую систему знаний, может привести к появлению в ней некоторого дополнительного объема ассоциированной информации, получающейся путем логического, правдоподобного вывода или на основе каких-либо иных ассоциаций, связанных с воспринятым информационным образом. В связи с этим мы можем говорить и о количестве ассоциированной информации. Заметим, однако, что речь в данном случае идет только о такого рода информации, истинность которой не могла быть доказана в рассматриваемой системе знаний до появления данного сообщения или требовала дополнительных подтверждений.

Например, основываясь на полученном выше сообщении, адресат может сделать еще один неожиданный для себя вывод:

«Некто богат!» бит.)

«Да, некто модник». бит.).

Помимо этого, в разгоряченном мозгу могут возникнуть и другие, не менее удивительные предположения:

«Да, некто не собирается ли жениться?» бит.)

Мы видим, что получение некоторого сообщения может вызвать у получателя волнообразный, а иногда и лавинообразный процесс генерации ассоциативной информации; в некоторых случаях это может привести к весьма печальным последствиям.

Таким образом, общее количество семантической информации в принципе может превышать количество информации в сообщении. В общем случае величина и характер расхождения указанных мер зависят, помимо всего прочего, от систем знаний участников информационного обмена.

Если один и тот же текст записать дважды, то общее количество информации в этой записи будет ровно в два раза больше, чем в исходном тексте. Объем же семантической информации останется прежним.

Отношение объема семантической информации к общему объему (количеству) информации характеризует информативность сообщения :

В качестве примера сообщения, обладающего почти 100%-ной информативностью, можно привести известную стихотворную фразу: «Aх! Наконец достигли мы ворот Мадрида!..» (А.С. Пушкин. Каменный гость).

Каждое слово в этой фразе несет важную смысловую нагрузку: трудность долгого пути, желанность цели и т.п. Уберите из текста любое из этих слов и вы потеряете какую-то связанную с ним ассоциацию. Очевидно, что разные люди воспринимают смысл сообщений по-разному. И вполне очевидно, что характер и глубина ассоциативного осмысления зависят от уровня развития и индивидуальных особенностей их систем знаний. Не с этим ли связано такое разнообразие эстетических предпочтений?

В отношении систем, выступающих в роли источников знаний, данное свойство проявляется как информированность. Именно с этим свойством связаны некоторые методики оценки квалификации специалистов.

Семантически связанная область каких-либо знаний формально может быть представлена в виде некоторой информационной структуры, называемой тезаурусом. Он представляет собой упорядоченную по степени общности совокупность понятий, связанных между собой соответствующими отношениями. Общий образ бытия внешнего мира в системе естественного языка составляет его тезаурус. Путем иерархического деления последнего из него могут быть вычленены частные тезаурусы отдельных отраслей знаний. Понятие тезауруса сформировалось в процессе развития компьютерной обработки информации.

Между тезаурусами различных систем знаний могут существовать определенные несоответствия и даже противоречия. Например, понятие «функция» имеет совершенно различный смысл в математике и теории организаций.

Истинность – свойство информации, заключающееся в соответствии (изоморфизме) извлекаемого из нее образа тому прообразу исходного оригинала, который существует в системе знаний и к которому может быть приведен этот образ путем выполнения соответствующих процедур интерпретации.

Из этого определения, в частности, следует, что изображение какого-либо объекта или субъекта в кривом зеркале можно рассматривать как истинное только в том случае, если субъект, воспринимающий этот образ, способен так его интерпретировать, чтобы он совпал с прообразом его оригинала. В этой трактовке истинность и узнаваемость есть понятия, весьма близко связанные между собой. Поскольку истинность означает непротиворечивость утверждения, содержащегося в сообщении, в некоторой логической системе, опирающейся на свои аксиомы, то она, вообще говоря, имеет неоднозначный характер, так как источники и получатели информации могут обладать разными логическими системами (существует же, например, так называемая женская логика, и не все понимали язык Эзопа).

Заметим, что истинность очень часто носит вероятностный характер. Адекватная данной системе знаний оценка истинности сообщения осуществляется путем сравнительного анализа аргументов за и против относительно утверждения, извлекаемого из этого сообщения, и возможных его альтернатив, синтезируемых в рамках данной системы знаний. При этом, очевидно, что чем полнее синтезированное множество альтернатив, тем достовернее будет эта оценка. Однако следует иметь в виду, что свойство истинности в таком частичном его толковании следует рассматривать только лишь относительно рациональной информации. Поэтому данное свойство следовало бы трактовать как правдивость. Ведь относительность –атрибут скорее правдивости, нежели истинности. Истина в высшем смысле этого слова абсолютна и является предметом Веры.

Как показывает практический опыт, интерес человека к тому или иному сообщению существенно зависит от того, насколько велика степень новизны содержащейся в нем семантической информации (рис. 1.4.4).

Новизна информации свидетельствует, что в сообщении содержатся утверждения (образы), которыми система знаний до получения этой информации в явном виде не располагала. Последнее замечание весьма существенно, поскольку язык данной системы в принципе позволяет получить любые, допустимые в нем утверждения (в том числе, очевидно, и принятое). Поэтому новизну следует понимать только в плане интерпретации, т.е. в том плане, что указанное утверждение не выведено путем соответствующих преобразований имеющейся в системе знаний информации и не сопоставлено с приходящими извне образами (т.е. заранее предполагалась). Оправдывающееся предположение не есть абсолютно новая информация. Степень новизны может быть оценена как отношение

где – объем семантической информации, представляющейся получателю сообщения X новой; – общий объем семантической информации в сообщении X .


Рис. 1.4.4. Качественная зависимость интереса индивида
к тому или иному сообщению от степени новизны
семантической информации (пунктир – зависимость риска
разрушения системы знаний от степени новизны)

Влияние степени новизны на интерес внешне проявляется, например, в том, что много раз слышанное (или виденное) вызывает обычно скуку и порой даже отвращение, а чрезмерно новое и непонятное часто просто пугает. Однако внутренний смысл подобной зависимости связан с действием принципа сохранения, защищающего в данном случае систему знаний от проникновения в нее чужеродной, разрушительной информации. На рис. 1.4.4, помимо кривой интереса, представлена кривая степени риска разрушения системы знаний. Блокирование, снижение интереса фактически означает сопротивление системы вторгающейся в нее информации, сокращение интенсивности ее переработки. Можно сказать, что система отказывается от приема «неизвестной ей пищи, боясь быть отравленной».

Одна и та же семантическая информация может быть представлена в различной форме (не говоря уже о различных языках). При этом, как правило, ее общий объем существенным образом зависит от выбранной формы сообщения. Например, информацию о том, что решением данного уравнения является синус, можно передать в виде сообщения

или сообщения

Оба сообщения в семантическом плане будут эквивалентны. Однако объемы информации в них будут значительно отличаться.

Условием, определяющим выбор формы сообщения, являются возможности системы знаний источника и получателя. Действительно, форма сообщения должна быть такой, чтобы оно могло быть интерпретировано соответствующей системой знаний. Из сказанного следует, что, передавая или просто преобразуя информацию, можно осуществлять ее сжатие (уменьшение объема). Указанная возможность составляет суть свойства сжимаемости, характеризуемое коэффициентом сжимаемости

где – объем (количество) информации в сообщении ; и – семантически эквивалентные сообщения.

Как уже отмечалось выше, допустимая для данного сообщения величина сжатия определяется характером и уровнем развития соответствующих систем знаний (язык, память, интерпретатор). В природе и обществе существует невообразимое большое число различных форм представления информации, обеспечивающих достаточно высокую степень сжатия. Однако наиболее мощный способ сжатия информации – представление ее в форме некоторого закона (правила), позволяющего в случае необходимости перевести ее в развернутую форму. Так, вместо записанного выше бесконечного ряда можно использовать такую форму его представления:

Сжимаемость есть проявление принципа семантической эквивалентности различных форм представления информации. Сжимаемость заключается в возможности передачи одной и той же семантической информации (вообще знаний) в различных формах.

Свойство дополняемости отражает активную роль информации, которая, проникая в систему знаний, активизирует последнюю, индуцируя в ней некоторый дополнительный объем ассоциированной семантической информации. В результате этого, как отмечалось выше, реальный объем семантической информации может существенно измениться. Сообщение, проникая в систему, как бы обволакивается своеобразной информационной "шубой", дополняющей его в семантическом плане. Если бы информация не обладала свойством дополняемости, то она не могла бы обладать свойством сжимаемости, а значит, и в принципе не могла быть интерпретируемой. Ведь при интерпретации выявляются смысловые связи между элементами сообщения и элементами системы знаний.

Дополняемость порождает весьма важное свойство систем – способность восстанавливать смысл сообщения даже в случае потери некоторой части содержащейся в нем информации. Очевидно, что в каждом конкретном случае существует некоторый предельный объем потерь, при превышении которого восстановление становится невозможным.

Необходимым условием восстанавливаемости является наличие в апостериорной информации определенных закономерностей, выявляемых с помощью априорной информации (с помощью знаний). В этом смысле восстановление информационных сообщений есть, по сути дела, распознавание. Например, если вы знаете, что сумма углов плоского треугольника равна 180 0 , то вы сможете по двум известным (заданным) углам определить величину третьего.


Похожая информация.


Для измерения информации вводятся два параметра: количество информации I и объем данных V д.

Эти параметры имеют разные выражения и интерпретацию в зависимости от рассматриваемой формы адекватности.

Синтаксическая адекватность. Она отображает формально-структурные характеристики информации и не затрагивает ее смыслового содержания. На синтаксическом уровне учитываются тип носителя и способ представления информации, скорость передачи и обработки, размеры кодов представления информации, надежность и точность преобразования этих кодов и т. п.

Информацию, рассматриваемую только с синтаксических позиций, обычно называют данными, так как при этом не имеет значения смысловая сторона.

Семантическая (смысловая) адекватность. Эта форма определяет степень соответствия образа объекта и самого объекта. Семантический аспект предполагает учет смыслового содержания информации. На этом уровне анализируются те сведения, которые отражает информация, рассматриваются смысловые связи. В информатике смысловые связи устанавливаются между кодами представления информации. Эта форма служит для формирования понятий и представлений, выявления смысла, содержания информации и ее обобщения.

Прагматическая (потребительская) адекватность. Она отражает отношение информации и ее потребителя, соответствие информации цели управления, которая на ее основе реализуется. Проявляются прагматические свойства информации только при наличии единства информации (объекта), пользователя и цели управления.

Прагматический аспект рассмотрения связан с ценностью, полезностью использования информации при выработке потребителем решения для достижения своей цели. С этой точки зрения анализируются потребительские свойства информации. Эта форма адекватности непосредственно связана с практическим использованием информации, с соответствием ее целевой функции деятельности системы.

Каждой форме адекватности соответствует своя мера количества информации и объема данных (рис. 2.1).

Рис. 2.1. Меры информации

2.2.1. Синтаксическая мера информации

Синтаксическая мера количества информации оперирует с обезличенной информацией, не выражающей смыслового отношения к объекту.

Объем данных V д в сообщении измеряется количеством символов (разрядов) в этом сообщении. В различных системах счисления один разряд имеет различный вес и соответственно меняется единица измерения данных:

  • в двоичной системе счисления единица измерения — бит ( bit — binary digit — двоичный разряд);
  • в десятичной системе счисления единица измерения — дит (десятичный разряд).

Пример. Сообщение в двоичной системе в виде восьмиразрядного двоичного кода 10111011 имеет объем данных V д = 8 бит.

Сообщение в десятичной системе в виде шестиразрядного числа 275903 имеет объем данных V д = 6 дит.

Количество информации определяется по формуле:

где H (α) - энтропия, т.е. количество информации измеряется изменением (уменьшением) неопределенности состояния системы.

Энтропия системы Н (α), имеющая N возможных состояний, согласно формуле Шеннона, равна:

где p i - вероятность того, что система находится в i -м состоянии.

Для случая, когда все состояния системы равновероятны, ее энтропия определяется соотношением

где N - число всевозможных отображаемых состояний;

m - основание системы счисления (разнообразие символов, применяемых в алфавите);

n - число разрядов (символов) в сообщении.

2.2.2. Семантическая мера информации

Для измерения смыслового содержания информации, т.е. ее количества на семантическом уровне, наибольшее признание получила тезаурусная мера, которая связывает семантические свойства информации со способностью пользователя принимать поступившее сообщение. Для этого используется понятие тезаурус пользователя .

Тезаурус — это совокупность сведений, которыми располагает пользователь или система.

В зависимости от соотношений смыслового содержания информации S и тезауруса пользователя S p изменяется количество семантической информации I с , воспринимаемой пользователем и включаемой им в дальнейшем в свой тезаурус. Характер такой зависимости показан на рис.2.2:

  • при S p =0 пользователь не воспринимает, не понимает поступающую информацию;
  • при S p → ∞ пользователь все знает, поступающая информация ему не нужна.

Рис. 2.2. Зависимость количества семантической информации, воспринимаемой потребителем, от его тезауруса I с = f (S p )

При оценке семантического (содержательного) аспекта информации необходимо стремиться к согласованию величин S и S p .

Относительной мерой количества семантической информации может служить коэффициент содержательности С , который определяется как отношение количества семантической информации к ее объему:

2.2.3. Прагматическая мера информации

Эта мера определяет полезность информации (ценность) для достижения пользователем поставленной цели. Эта мера также величина относительная, обусловленная особенностями использования информации в той или иной системе. Ценность информации целесообразно измерять в тех же самых единицах (или близких к ним), в которых измеряется целевая функция.

Для сопоставления введенные меры информации представим в табл. 2.1.

Таблица 2.1. Единицы измерения информации и примеры

Мера информации Единицы измерения Примеры (для компьютерной области)
Синтаксическая:

шенноновский подход

компьютерный подход

Степень уменьшения неопределенности Вероятность события
Единицы представления информации Бит, байт, Кбайт и т.д.
Семантическая Тезаурус Пакет прикладных программ, персональный компьютер, компьютерные сети и т.д.
Экономические показатели Рентабельность, производительность, коэффициент амортизации и т.д.
Прагматическая Ценность использования Денежное выражение
Емкость памяти, производительность компьютера, скорость передачи данных и т.д. Время обработки информации и принятия решений

Раздел очень прост в использовании. В предложенное поле достаточно ввести нужное слово, и мы вам выдадим список его значений. Хочется отметить, что наш сайт предоставляет данные из разных источников – энциклопедического, толкового, словообразовательного словарей. Также здесь можно познакомиться с примерами употребления введенного вами слова.

Что значит "семантическая информация"

Семантическая информация

в логике, характеристика содержания, которая передаётся в некотором сообщении. Существуют разные подходы к измерению С. и. В концепции И. Бар-Хиллела (США) и Р. Карнапа (Австрия) сообщение понимается как пропозициональная формула (высказывание), а С. и. измеряется числом состоянии универсума, при которых эта формула ложна. Это реализация идеи Г. В. Лейбница о том, что логически истинные предложения, верные во всех возможных мирах, не могут нести фактической информации. А. А. Харкевич предложил измерять ценность информации через изменение вероятности достижения определённой цели, возникающее под воздействием данного сообщения. С. и. сообщения любой природы можно оценивать как степень изменения системы знаний (тезауруса) адресата в результате восприятия данного сообщения. Эта мера одновременно оценивает новизну и доступность сообщения относительно данного адресата, тем самым такая трактовка С. и. является в значительной мере прагматической (см. Прагматика). Отправитель сообщения тоже получает С. и., которая характеризуется возникшим у него новым знанием о состояниях тезаурусов адресатов.

Лит.: Bar-HillieI Y., Carnap R., Semantic information, «The British Journal for the Philosophy Science», 1953, v. 4, ╧ 14; Харкевич А. А., О ценности информации, «Проблемы кибернетики», 1960, в. 4; Шрейдер Ю. А., Об одной модели семантической теории информации, там же, 1965, в. 13; Финн В. К., О семантической информации, в кн.: Джордж Ф., Мозг как вычислительная машина, М., 1963, с. 479≈485; Information and inference, ed. by I. Hintikka and P. Suppes, Dordrecht, 1970.

Ю. А. Шрейдер.

Википедия

Семантическая информация

Семантическая информация - смысловой аспект информации, отражающий отношение между формой сообщения и его смысловым содержанием.

Начиная с работ Клода Шеннона, принято считать, что понятие информации складывается из трех аспектов: синтаксического, семантического и прагматического. Синтаксический связан с техническими проблемами хранения и передачи информации, семантический имеет отношение к смыслу и значению истинности сообщений, прагматический затрагивает вопросы влияния информации на поведение людей. Теория семантической информации исследует область человеческих знаний и является составной частью искусственного интеллекта.

Для измерения смыслового содержания информации, т.е. ее количества на семантическом уровне, наибольшее признание получила тезаурусная мера, которая связывает семантические свойства информации со способностью пользователя принимать поступившее сообщение. Для этого используется понятие тезаурус пользователя.

Тезаурус - это совокупность сведений, которыми располагает пользователь или система.

В зависимости от соотношений между смысловым содержанием информации S и тезаурусом пользователя S p изменяется количество семантической информации I c , воспринимаемой пользователем и включаемой им в дальнейшем в свой тезаурус. Характер такой зависимости показан на рис.2.2. Рассмотрим два предельных случая, когда количество семантической информации I c равно 0:

при S p 0 пользователь не воспринимает, не понимает поступающую информацию;

при Sp; пользователь все знает, н поступающая информация ему не нужна.

Рис. 2.2. Зависимость количества семантической информации. воспринимаемой потребителем, от его тезауруса Ic=f(Sp)

Максимальное количество семантической информации I c потребитель приобретает при согласовании ее смыслового содержания S со своим тезаурусом S p (S p = S p opt), когда поступающая информация понятна пользователю и несет ему ранее не известные (отсутствующие в его тезаурусе) сведения.

Следовательно, количество семантической информации в сообщении, количество новых знаний, получаемых пользователем, является величиной относительной. Одно и то же сообщение может иметь смысловое содержание для компетентного пользователя и быть бессмысленным (семантический шум) для пользователя некомпетентного.

При оценке семантического (содержательного) аспекта информации необходимо стремиться к согласованию величин S и S p .

Относительной мерой количества семантической информации может служить коэффициент содержательности С , который определяется как отношение количества семантической информации к ее объему:

Прагматическая мера информации

Эта мера определяет полезность информации (ценность) для достижения пользователем поставленной цели. Эта мера также величина относительная, обусловленная особенностями использования этой информации в той или иной системе. Ценность информации целесообразно измерять в тех же самых единицах (или близких к ним), в которых измеряется целевая функция.



Пример 2.5. В экономической системе прагматические свойства (ценность) информации можно определить приростом экономического эффекта функционирования, достигнутым благодаря использованию этой информации для управления системой:

Inb(g)=П(g /b)-П(g),

где Inb(g) -ценность информационного сообщения b для системы управления g,

П(g) -априорный ожидаемый экономический эффект функционирования системы управления g,

П(g /b) - ожидаемый эффект функционирования системы g при условии, что для управления будет использована информация, содержащаяся в сообщении b.

Для сопоставления введенные меры информации представим в табл.2.1.

Таблица 2.1. Единицы измерения информации и примеры

КАЧЕСТВО ИНФОРМАЦИИ

Возможность и эффективность использования информации обусловливаются такими основными ее потребительскими показателями качества, как репрезентативность, содержательность, достаточность, доступность, актуальность, своевременность, точность, достоверность, устойчивость.

  • Репрезентативность информации связана с правильностью ее отбора и формирования в целях адекватного отражения свойств объекта. Важнейшее значение здесь имеют:
  • правильность концепции, на базе которой сформулировано исходное понятие;
  • обоснованность отбора существенных признаков и связей отображаемого явления.
  • Нарушение репрезентативности информации приводит нередко к существенным ее погрешностям.
  • Содержательность информации отражает семантическую емкость, равную отношению количества семантической информации в сообщении к объему обрабатываемых данных, т.е. C=Ic/Vд.

С увеличением содержательности информации растет семантическая пропускная способность информационной системы, так как для получения одних и тех же сведений требуется преобразовать меньший объем данных.

Наряду с коэффициентом содержательности С, отражающим семантический аспект, можно использовать и коэффициент информативности, характеризующийся отношением количества синтаксической информации (по Шеннону) к объему данных Y=I/Vд.

  • Достаточность (полнота) информации означает, что она содержит минимальный, но достаточный для принятия правильного решения состав (набор показателей). Понятие полноты информации связано с ее смысловым содержанием (семантикой) и прагматикой. Как неполная, т.е. недостаточная для принята правильного решения, так и избыточная информация снижает эффективность принимаемых пользователем решений.
  • Доступность информации восприятию пользователя обеспечивается выполнением соответствующих процедур ее получения и преобразования. Например, в информационной системе информация преобразовывается к доступной и удобной для восприятия пользователя форме. Это достигается, в частности, и путем согласования ее семантической формы с тезаурусом пользователя.
  • Актуальность информации определяется степенью сохранения ценности информации для управления в момент ее использования и зависит от динамики изменения ее характеристик и от интервала времени, прошедшего с момента возникновения данной информации.
  • Своевременность информации означает ее поступление не позже заранее назначенного момента времени, согласованного с временем решения поставленной задачи.
  • Точность информации определяется степенью близости получаемой информации к реальному состоянию объекта, процесса, явления и т.п. Для информации, отображаемой цифровым кодом, известны четыре классификационных понятия точности:
  • формальная точность, измеряемая значением единицы младшего разряда числа;
  • реальная точность, определяемая значением единицы последнего разряда числа, верность которого гарантируется;
  • максимальная точность, которую можно получить в конкретных условиях функционирования системы;
  • необходимая точность, определяемая функциональным назначением показателя.

Достоверность информации определяется ее свойством отражать реально существующие объекты с необходимой точностью. Измеряется достоверность информации доверительной вероятностью необходимой точности, т.е. вероятностью того, что отображаемое информацией значение параметра отличается от истинного значения этого параметра в пределах необходимой точности.

Устойчивость информации отражает ее способность реагировать на изменения исходных данных без нарушения необходимой точности. Устойчивость информации, как и репрезентативность, обусловлена выбранной методикой ее отбора и формирования.

В заключение следует отметить, что такие параметры качества информации, как репрезентативность, содержательность, достаточность, доступность, устойчивость, целиком определяются на методическом уровне разработки информационных систем. Параметры актуальности, своевременности, точности и достоверности обусловливаются в большей степени также на методическом уровне, однако на их величину существенно влияет и характер функционирования системы, в первую очередь ее надежность. При этом параметры актуальности и точности жестко связаны соответственно с параметрами своевременности и достоверности.

THE BELL

Есть те, кто прочитали эту новость раньше вас.
Подпишитесь, чтобы получать статьи свежими.
Email
Имя
Фамилия
Как вы хотите читать The Bell
Без спама