Вербальная форма представления информации
Основным видом продукции информационного производства являются документы, содержащие текстовую и/или табличную запись каких-либо сведений. Такие средства представления сведений принято называть вербальными. Вербальная форма описания сведений присуща человеку. Вербальное мышление — наиболее доступная современным исследователям форма мышления. Наиболее мощные средства информационного производства, в частности электронные вычислительные машины и автоматизированные средства связи и телекоммуникации, также имеют дело с вербальной информацией. Даже традиционные системы управления объектами техники, имеющие дело с датчиками и исполнительными органами и использующие аналоговые (не вербальные) способы задания информации, более или менее сложные преобразования информации проводят в цифровой или символьной, то есть вербальной, форме представления. О главной закономерности развития вербальных языков лингвисты говорят так: «Языковые конструкции живут, пока и поскольку они используются в реальном информационном производстве».Под языковыми конструкциями здесь понимаются отдельные символы, слова и словосочетания, имеющие определенный смысл в том или ином информационном производстве. Уровень развития какого-либо языка определяется потребностями информационного производства, многообразием и сложностью операций с информацией в этом производстве. При ограниченных потребностях некоторые языки могут практически не развиваться, сохраняя интенсивность своего использования на достаточно высоком уровне. Примерами тому могут служить язык музыкальной нотации и язык записи шахматных партий. Используемый в информатике термин «данные» служит обобщенным именем информационных продуктов, являющихся предметом труда в информационном производстве.
Принятое в информатике разделение формальных языков на языки описания данных и языки манипулирования данными имеет технологический характер, свидетельствующий о том, что конструкции языка манипулирования данными используются в некотором информационном производстве для указания каких-либо процедур с данными. Таким образом, язык манипулирования данными можно рассматривать как язык описания данных в средствах информационного производства. Основой любого языка являются символы: буквы, цифры, знаки препинания, нотные знаки и прочее. Из символов складываются слова, из слов складываются словосочетания, из словосочетаний формируются предложения, составляющие текст. Под текстом следует понимать не только отдельные единицы информации, но и произвольное их объединение. Составитель (производитель) текста вкладывает в него определенный смысл в расчете на то, что именно он будет воспринят потребителем текста. Однозначность восприятия смысла любого текста несколькими людьми или несколькими информационными производствами можно обеспечить только по мере договоренности, поддерживаемой строгой технологической дисциплиной в общем информационном производстве. Попытки создать языки, обеспечивающие однозначность восприятия записанных на нем текстов людьми, не связанными с производителем текста строгой технологической дисциплиной, обречены на неудачу. Примером тому могут служить различные толкования Библии, различная интерпретация музыкальных произведений разными исполнителями, различное восприятие произведений литературы разными людьми в разное время и пр. В итоге мы приходим к основному закону развития языков описания и манипулирования данными — закону относительной однозначности восприятия смысла текстов,который гласит: «Однозначность восприятия смысла текстов на каком-либо языке может быть обеспечена только строгой технологической дисциплиной в рамках единого информационного производства».
Примером информационного производства со строгой технологической дисциплиной восприятия текстов может служить набор текста на персональном компьютере, оснащенном текстовым редактором Word. Любое отступление от толкования инструкций этого редактора либо игнорируется компьютером, либо приводит к печальным последствиям. То и другое заставляет однозначно уяснить смысл минимального числа инструкций редактора, обеспечивающих удобную процедуру набора текстов. Приведенный пример свидетельствует об одной важной особенности восприятия смысла текстов различными людьми и/или информационными производствами. Она заключается в том, что далеко не всегда человек и/или информационное производство стремятся к раскрытию всего смысла текста. Чаще всего они ограничиваются восприятием минимальной части смысла текста, достаточной, по их мнению, для принятия какого-либо решения. Указанная особенность повсеместно используется в информационных производствах сложных текстов. Они разбиваются на отдельные смысловые части. К ним составляются оглавления, аннотации, рефераты и прочие менее сложные тексты, частично отражающие смысл исходного сложного текста, что позволяет потребителю существенно сократить трудозатраты на восприятие необходимой ему части смысла сложного текста. Итак, закон неоднозначности восприятия следует дополнить законом минимального осмысления текста: «Потребитель сложного текста стремится предельно ограничить трудозатраты на выявление части его смысла, достаточной для принятия какого-либо решения». Это стремление является основным стимулом развития формализованных языков описания данных, языков, позволяющих потребителю сложных информационных продуктов с минимальными затратами труда и времени найти минимальные фрагменты текстов, содержащие интересующий его смысл с достаточной полнотой. Количественные оценки полноты поиска и избыточности найденного фрагмента текста зависят от принятого в информационном производстве языка описания данных. Основой всех языков описания данных служит дескриптор (описатель, определитель), представляющий собой набор символов и имеющий в рамках какого-либо информационного производства единственный смысл. Дескриптор может обозначать что угодно — предмет, действие, связь между предметами и действиями, количественный показатель чего-либо и т. п. Дескриптор может иметь форму слова или словосочетания. В некоторых случаях для обозначения дескриптора пользуются уникальным набором цифр или других символов.
Для повышения эффективности поиска фрагментов текста с нужным потребителю смыслом текст необходимо структурировать. Будем считать, что для упрощения поиска фрагмента текста с нужным смыслом текст разбивается на отдельные части (записи), которые дополняются некоторым набором дескрипторов — поисковым образом записи. Процесс составления набора дескрипторов принято называть индексированием записей. Предполагается, что набор дескрипторов достаточно полно отражает смысл записи с позиций потребителей текста. Для составления набора дескрипторов нужно выявить в записи ключевые (определяющие смысл) слова и/или словосочетания и привести их к какой-либо канонической форме. С использованием современных компьютеров эти процедуры стали автоматизированными. Слова и словосочетания, объявленные дескрипторами, включаются в словарь дескрипторов, с помощью которого легко автоматизировать процедуры приведения терминологии к принятой в информационном производстве канонической форме, включая устранение синонимии терминов.
Воспользуйтесь поиском по сайту: ©2015 - 2024 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...
|