И его мультилингвистическая модификация
Учет структуры распределенной СППР является важной функцией корпоративной информационно-управляющей системы, так как позволяет анализировать не только информационное обеспечение, и характер сетевой структурной организации, а также оборудования на узлах сети. При модификации синтеза структуры распределенных систем поддержки принятия решений на основе тезауруса необходимо производить учет мультилингвистичности документов, представленных в корпоративной ИУС. Не менее важно помнить, что в ходе поиска мультилингвистической информации появляется возможность формирования мультилингвистических запросов как в рамках одной поисковой процедуры, так и рамках нескольких одноязычных поисковых процедур, но выполненных с применением разных языковых подмножеств. Пусть – локальные информационные системы, предназначенные для обеспечения функционирования сложной СППР, состоящей из совокупности K = {1, …, φ} объектов. Коэффициент i отвечает за языковую принадлежность документа или запроса в рассматриваемой модели. При этом мультилингвистическая информация с каждой локальной информационной системы поступает в центр сбора информации для дальнейшей передачи ее управляющему органу – ЛПР. Одна локальная информационная система может обслуживать несколько объектов [60]. Распределенная информационная система S = (T, Di, Mi, μ) определяется через локальные составляющие: 1) 2) 3) 4) Распределенная информационная система выступает в роли центра сбора и обработки информации, т. е. обработки ответов на запросы ЛПР. Для формализации задачи введем обозначения: cjl – стоимость сбора информации об l -м объекте j -й локальной информационной системой; bjl – стоимость передачи единицы информации об l -м объекте в центр сбора и обработки информации из j -й информационной локальной системы; xjl – булева переменная, равная 1, если l -й объект обслуживается j -й локальной информационной системой, и равная 0 в противном случае.
Описание состояния каждого объекта представляется в виде информационной модели: где – тезаурус с дескрипторным множеством описывающий состояние l -го объекта; – коллекция возможных мультилингвистических документов, которые требуются ЛПР (органам управления) для принятия решения; – множество допустимых мультилингвистических запросов со стороны ЛПР (органов управления); – отображение, сопоставляющее каждому мультилингвисическому вопросу множество мультилингвистических документов. Индекс j указывает, что информационная модель l -го объекта сформирована в j -й локальной информационной системе. Информация об объектах представлена независимыми мультилинвистическими информационными моделями и вместе с тем она сосредоточена в одном месте, т. е. в одной точке. Таким образом, информационные модели объектов являются подсистемами локальной системы, обслуживающей эти объекты. Это позволяет формулировать ответы на запросы в виде
(5.1)
где Для запросов сложного типа, состоящих из нескольких дескрипторов, выражение (5.1) имеет вид
где p – число объектов, обслуживаемых локальной информационной системой. Объем передаваемой информации на запрос из j -й локальной информационной системы определяется по формуле где F – оператор преобразования информации к виду, предназначенному для передачи в каналы связи. Сформулируем задачу распределения объектов по локальным информационным подсистемам при множестве допустимых запросов в распределенной системе ответы на которые формируются последовательно без повторения запросов. Для удобства положим, что каждый запрос описывается одним дескриптором.
Необходимо найти
при ограничениях
Ограничения требуют обслуживания каждого объекта только одной информационной системой. При этом количество объектов, подлежащих обслуживанию локальными подсистемами, должно быть не меньше заданного числа [62]. Усложним требования к распределенной системе. Потребуем, чтобы органы управления получали ответы на запросы даже в случае, если любая локальная информационная система перестанет функционировать, т. е. если возникает потребность в дублировании информации об объектах. Постановка задачи в этом случае меняется только в части, касающейся изменения ограничения, которое принимает вид
Модифицируем постановку задачи еще раз. Будем считать, что после закрепления объектов за локальными информационными системами в задаче минимизации перераспределения объектов не происходит. Однако ЛПР (органам управления) необходимо иметь информацию о предыдущих состояниях объектов даже после прекращения функционирования любой из локальных подсистем. Для ясности изложения упростим ситуацию, полагая, что перераспределение информации осуществляется один раз. Хотя в реальной ситуации информация о состоянии объектов и передается по мере ее поступления на всем интервале времени функционирования локальных информационных систем, указанное ограничение не снижает общности рассуждений, так как полная постановка задачи потребует лишь дополнительного суммирования по дискретным моментам времени. Введем следующие обозначения: аjs – стоимость передачи единицы информации из j -й локальной информационной системы в s -ю; yjsl – булева переменная, равная 1, если информация об l -м объекте перераспределяется из j -й локальной информационной системы в s -ю. Окончательно задача синтеза структуры распределенной информационной системы формулируется так: необходимо найти
при ограничениях
Последнее ограничение требует перераспределения информации об l -м объекте из j -й локальной информационной системы. На основе задачи минимизации можно сформулировать ряд задач, учитывающих те или иные требования относительно структуры распределенной системы. Для этого необходимо задать требования в виде ограничений и ввести их в описание задачи.
Рассмотрим, что нового в постановку задач синтеза распределенных систем привносит использование модели системы, использующей тезаурус с весами. Главное достоинство этой модели состоит в возможности учета распределения информации по дескрипторам, описывающим документ, и тем самым в возможности оценки неопределенности в описании ответов на запросы со стороны органов управления. Итак, пусть документы в локальных информационных системах представлены в виде
В реальных ситуациях при описании состояния объектов естественно ожидать, что разные локальные информационные системы, обеспеченные различными техническими средствами измерения и наблюдения за состоянием объектов, будут представлять не совпадающие между собой описания одних и тех же объектов. Тогда при запросе ЛПР (органов управления) о состоянии некоторого объекта l локальные информационные системы дадут ответы с точностью подобия ρ:
Очевидно, что показатели могут быть использованы для уточнения структуры распределенной системы, т. е. выбора такой структуры, которая бы обеспечивала получение ответов с максимальной мерой корреляции или с мерой корреляции не менее заданной. Последнее требование эквивалентно условию передачи информации с отвечающей запросу содержательной частью не менее заданной. Формализация этого условия применительно к постановке задачи минимизации состоит во введении дополнительных ограничений:
В практических приложениях, учитывающих мультилингвистичность представления информации в системе, возможны и другие требования к точности получаемых ответов, зависящие от выбранного языка (или множества языков). Здесь, как и ранее, необходимо иметь четкое представление о целесообразности использования тех или иных моделей в разных языковых множествах и о конечном эффекте от их мультилингвистической реализации.
В заключение отметим, что эффективность распределенной СППР, поддерживающей мультилингвистичность представления информации, зависит от того, насколько удачно при синтезе были выбраны структура (включая избыточность информационного обеспечения) и параметры системы, а также то, насколько рационально организована система контроля функционирования ее компонентов в процессе эксплуатации.
* * *
Таким образом, выше нами были представлены новые модели формирования информационного обеспечения для распределенных СППР, основанные на тезаурусах, в частности модели, обеспечивающие применение тезаурусов при контекстном поиске информации в распределенных СППР, что позволяет существенно повысить качество текстового поиска за счет исключения точного сравнения терминов поисковой строки, приводящего к расширенной выборке терминов, относящихся к заданной предметной области. На основе анализа существующих моделей синтеза информационных структур распределенных СППР предложена модель, использующая элементы теории множеств и обеспечивающая синтез структуры распределенной системы поддержки принятия решений на основе тезауруса. Одним из преимуществ данной модели является возможность ее применения в двух режимах: частотном и без использования частотных характеристик терминов. Также представлена модификация модели синтеза структуры информационного обеспечения в распределенной СППР на основе тезауруса, учитывающая мультилингвистичность представления информации. Это существенно повышает ее значимость для современных СППР, так как большинство крупных российских и зарубежных компаний работают на международном рынке и поэтому принимать решение, основываясь только на одноязычных данных, сегодня уже неактуально. Для СППР, информационное обеспечение которых основано на тезаурусах, показана целесообразность разработки поисковой подсистемы на базе тезаурусов с применением нескольких режимов работы, в частности поиск как с частотными характеристиками, так и без них, и реализация метапоиска с использованием тезаурусов для проверки релевантности и ранжирования. Кроме того, обоснована необходимость реализации поисковой процедуры без использования тезаурусов, что существенно увеличивает возможности предлагаемого решения по сравнению с аналогами.
Воспользуйтесь поиском по сайту: ©2015 - 2024 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...
|