Автоматизированные информационные
⇐ ПредыдущаяСтр 3 из 3 СИСТЕМЫ 10.1. Общие сведения Мы уже отмечали, что любой разумный вид человеческой деятельности основывается на информации о свойствах состояния и поведения той части реального мира, с которой связана эта деятельность. По мере усложнения человеческого общества возрастал и объем соответствующей информации, что сделало необходимым создание систем ее сбора, хранения и обработки. ИТ существуют уже многие десятки и даже сотни лет и долгое время представляли собой различного рода картотеки или архивы бумажных документов. Появление компьютеров позволило в значительной мере автоматизировать информационную деятельность, что привело к созданию автоматизированных информационных систем (АИС). Можно определить автоматизированную информационную систему как базирующийся на компьютерных технологиях комплекс аппаратных, программных, информационных, организационных и человеческих ресурсов, предназначенный для создания и поддержки информационной модели какой-либо части реального мира (называемой предметной областью АИС) с целью удовлетворения информационных потребностей пользователей. Не следует думать, что любая автоматизированная информационная система носит всеохватывающий характер. Напротив, она может входить в качестве составной части в более сложную систему, такую, как система автоматизации проектирования (САПР) или система управления производством. Размер и функции АИС определяются предметной областью, для которой она спроектирована, и если, например, предметная область охватывает лишь документооборот предприятия, то незачем искать в информационной системе сведения о зарплате. Структура АИС
В состав любой автоматизированной системы входят следующие подсистемы: техническая, программная, информационная, организационная, а также персонал. Рассмотрим их более подробно. Техническое и программное обеспечение. Техническое обеспечение включает в себя компьютеры, внешние устройства и средства телекоммуникации и в этом отношении не отличается от любой компьютерной системы. Программное обеспечение включает системное программное обеспечение, типовое прикладное программное обеспечение и специализированное прикладное программное обеспечение. В свою очередь, в состав системного программного обеспечения входят операционная система, различные операционные оболочки пользователя, служебные программы системного администратора, сетевое программное обеспечение и т.д. Используемая операционная система в значительной мере определяет требования к остальным программным составляющим, и очень часто совокупность аппаратных средств вместе с используемой операционной системой называется аппаратно-программной платформой АИС (или просто платформой). Типовое прикладное программное обеспечение представляет собой определяемые спецификой предметной области программы, которые не разрабатываются специально для конкретной информационной системы, а предназначены для решения широкого класса задач того же типа, хотя они могут настраиваться на конкретный случай использования именно в данной системе. В качестве примера могут быть названы такие программные продукты, как офисные программы, системы управления базами данных общего назначения, Web-серверы, программы распознавания текста, типовые системы текстового поиска и т.д. Эти программы могут быть как коммерческими, так и некоммерческими. Часто наиболее важные прикладные программы общего назначения (например, системы управления базами данных) также включают в состав платформы АИС.
К категории типового прикладного программного обеспечения следует отнести также инструментальные средства, применяемые для проектирования АИС, хотя в процессе ее эксплуатации они, как правило, не используются. Специализированное прикладное программное обеспечение создается для конкретной информационной системы и учитывает ее особенности. Оно может быть либо комплексом программ, разработанных в какой-нибудь инструментальной среде, либо представлять собой совокупность настроек типовых программных пакетов. Информационное обеспечение. Обрабатываемые данные играют центральную роль в информационной системе. Вместе с тем наряду с информацией, непосредственно подлежащей сбору, хранению, обработке и т.д., важную роль играют сведения, описывающие эту информацию, называемые обычно метаданными, т.е. данными о данных, а также языковые средства, используемые для описания данных и метаданных (лингвистическое обеспечение). Наличие развитой системы метаданных является главным признаком, отличающим информационную систему от простых информационных технологий. Разумеется, сведения, описывающие обрабатываемые данные, присутствуют в любой информационной технологии, однако особенностью метаданных АИС является то, что они хранятся в самой системе, являясь ее неотъемлемой частью. Подлежащая хранению и обработке информация обычно группируется в соответствии с типовыми структурами, которые называются моделями данных. Сформированная таким образом информация называется базой данных. Еще раз подчеркнем, что база данных содержит полное описание содержащейся в ней информации, включая описание собственной структуры. Программные средства общего назначения, предназначенные для работы с базой данных, называются системой управления базой данных (СУБД). Из числа систем, предназначенных для создания АИС предприятий (корпоративных АИС) назовем Oracle, DB2, MS SQL Server. Организационное обеспечение. Организационная составляющая является важным элементом информационной системы, хотя очень часто ей уделяется недостаточное внимание. Она включает в себя в первую очередь проектную и эксплуатационную документацию, а также типовые процедуры работы с АИС. Сюда же следует отнести систему подготовки обслуживающего персонала и конечных пользователей к эксплуатации АИС. Можно сказать, что организационная подсистема является связующим звеном между информационной системой и ее пользователями.
Обслуживающий персонал. Последним по счету (но не по важности) компонентом информационной системы являются люди, которые обеспечивают ее функционирование. Обычно их делят на разработчиков, администраторов и операторов. Не всегда между ними можно провести четкую грань, однако, не вдаваясь в подробности, можно сказать, что разработчики создают и модифицируют систему, администраторы устанавливают режим функционирования системы и организуют устранение аварийных ситуаций, операторы же осуществляют неспецифическое взаимодействие с системой (выполняют резервное копирование данных, устанавливают бумагу в принтер и т.д.). 10.3. Классификация АИС Информационные системы классифицируются по разным признакам. Рассмотрим наиболее часто используемые способы классификации. Классификация по масштабу. По масштабу информационные системы подразделяются на следующие типы: одиночные, групповые и корпоративные. Одиночные информационные системы, или автоматизированные рабочие места (АРМ), реализуются, как правило, на отдельном персональном компьютере. Такая система может содержать несколько простых приложений, связанных общей тематикой и информацией, и рассчитана на работу одного пользователя или нескольких пользователей, разделяющих по времени одно рабочее место. Групповые информационные системы (системы масштаба подразделения) ориентированы на коллективное использование информации членами одного или нескольких родственных отделов предприятия и чаще всего строятся на базе локальной вычислительной сети. При разработке таких систем используются серверы баз данных (SQL-серверы), позволяющие эффективно использовать совместные данные. Корпоративные информационные системы (системы масштаба предприятия) являются развитием групповых систем и могут поддерживать территориально разнесенные узлы или сети. Для таких систем характерна сложная архитектура с несколькими серверами.
Для групповых и корпоративных систем существенно повышаются требования к надежности функционирования и сохранности данных, что, в частности, требует обязательного наличия одного или нескольких администраторов среди обслуживающего персонала. Классификация по сфере применения. По сфере применения информационные системы обычно подразделяются на четыре группы: • системы обработки транзакций; • системы поддержки принятия решений; • информационные-справочные системы; • офисные информационные системы. Системы обработки транзакций (Online Transaction Processing — OLTP) предназначены для поддержания адекватного отображения предметной области в информационной системе в любой момент времени. Для них характерен регулярный поток довольно простых подлежащих обработке работ, например заказов, платежей, запросов от большого числа пользователей. Основными требованиями к ним являются: • высокая производительность обработки; • непротиворечивость и согласованность хранимой информации в любой момент времени; • защита от несанкционированного доступа, программных и аппаратных сбоев. Системы поддержки принятия решений (аналитические системы) представляют собой другой тип информационных систем, которые ориентированы на выполнение более сложных запросов, требующих статистической обработки исторических (накопленных за некоторый промежуток времени) данных в различных разрезах: временных, географических и т.п., моделирования процессов предметной области, прогнозирования развития тех или иных явлений. Аналитические системы также часто включают средства обработки информации на основе методов искусственного интеллекта, средства графического представления данных. Эти системы оперируют большими объемами исторических данных, позволяя выделить из них содержательную информацию: получить знания из данных. Обширный класс информационных-справочных систем основан на текстовых и гипертекстовых документах и мультимедиа. Наибольшее развитие такие информационные системы получили в сети Интернет. Класс офисных информационных систем нацелен на перевод бумажных документов в электронный вид, автоматизацию делопроизводства и управление документооборотом. Приведенная классификация по сфере применения в достаточной степени условна. Крупные информационные системы очень часто обладают признаками всех перечисленных выше классов. Кроме того, корпоративные информационные системы масштаба предприятия обычно состоят из ряда подсистем, относящихся к различным сферам применения.
Классификация по функциональному назначению. Еще одним способом классификации информационных систем является их классификация в зависимости от предметной области. Этот способ, конечно, не может быть исчерпывающим, поскольку количество предметных областей не ограничено. Тем не менее, он позволяет достаточно точно охарактеризовать ту или иную систему. Например, в сфере управления предприятием можно выделить следующие информационные системы: • бухгалтерского учета; • управления складскими ресурсами, поставками и закупками; • управления маркетингом; • документооборота; • оперативного управления; • предоставления оперативной и сводной информации и др. Классификация по виду поддерживаемых информационных ресурсов. Здесь обычно выделяются два больших класса: документо-графические и фактографические системы. В документографических системах основной информацией являются документы на естественных языках либо другие целостные информационные объекты (аудиозаписи, видеофильмы и т.п.). Основной функцией таких систем является поиск объекта или объектов, удовлетворяющих заданным условиям, в связи с чем класс документографических систем фактически совпадает с информационными-поисковыми. В фактографических же системах информация хранится в структурированном виде на основе той или иной модели данных, вследствие чего такие системы называют системами с базами данных. Другие виды классификации. Конечно же, приведенные способы классификации не исчерпывают всех возможностей классификации. Приведем еще несколько свойств информационных систем, которые могут быть положены в основу той или иной классификации: • объем информационных ресурсов и состав системного персонала, а также возможное количество пользователей; • среда хранения и динамика информационных ресурсов; • архитектура и способы доступа к системе; • ограничения доступа к системе; • программно-аппаратная платформа. Список характеристик АИС можно было бы продолжить, однако уже приведенного достаточно, чтобы продемонстрировать большое многообразие информационных систем. Контрольные вопросы 1. Может ли на одном компьютере размещаться несколько АИС? А одна АИС на нескольких компьютерах? 2. В каких случаях необходимо создание АИС? 3. Как называется часть реального мира, моделируемая информационной системой? 4. Опишите составные части АИС. 5. Что такое метаданные? 6. Что означает понятие модели данных? 7. Опишите функции обслуживающего персонала АИС. 8. Назовите причины многообразия информационных систем. ГЛАВА 11 СИСТЕМЫ, ОСНОВАННЫЕ НА ЗНАНИЯХ 11.1. Знания Со времен изобретения компьютера человек стремился использовать его для решения все более сложных задач. Поэтому с тех самых времен возникла необходимость изложения знаний, которые он использует для решения этих задач, в форме, пригодной для обработки с помощью компьютера. Но прежде, чем говорить о способах представления знаний в памяти компьютера, необходимо пояснить, что такое знания и чем они отличаются от данных. Данные — это отдельные факты, характеризующие конкретные объекты, процессы и явления предметной области, а также их свойства. Знания — это закономерности предметной области (принципы, связи, законы), полученные в результате практической деятельности и профессионального опыта и позволяющие специалистам решать задачи в этой области. Поясним на примерах эти определения. Следующая запись взята из журнала, который ведется в мастерской автосервиса. «Марка автомобиля — ВАЗ 21053; номер — А6780Р 77; контактный телефон владельца — 345-67-34; неисправность — двигатель останавливается на холостом ходу». Эта запись содержит в лаконичной форме фрагмент описания предметной области: на ремонте в мастерской находится машина определенной марки, имеющая определенный номер, с владельцем которой можно связаться по указанному телефону и в которой имеется конкретная неисправность, требующая устранения. Таким образом, приведенная запись отражает вполне определенные фактические данные. Следующий пример относится к той же предметной области. «ЕСЛИ двигатель останавливается на холостом ходу и зажигание в цилиндрах двигателя выставлено правильно, ТО возможная причина неисправности — засорены жиклеры холостого хода». Приведенная фраза описывает определенную закономерность предметной области (т.е. относящуюся ко всем автомобилям с карбюраторным двигателем) и содержит в себе знание специалиста по ремонту двигателей, приобретенное им опытным путем за время работы в автосервисе либо полученное в результате обучения, т. е. от другого специалиста. Опытный мастер обладает большим набором утверждений подобного рода (не только по диагностике неисправностей, но и по их устранению), многие из которых имеют вид «ЕСЛИ - ТО», как приведенное ранее. Следует отметить, что деление информации на классы «данные» и «знания» довольно условно, часто фактические данные (или просто факты) относят к знаниям специального вида, которые представляются в виде: ААВ, где А — символьная строка, указывающие на имя конкретного объекта или ситуации, В — символьная строка или число, а знак А обозначает один из математических знаков =, >, <, <, > или?. Например, «марка = ВА321053», «неисправность = двигатель останавливается на холостом ходу», «температура <37», «цвет изделия е {черный, синий, красный}». Первым подходом к строгому (формализованному) представлению знаний стал алгоритмический, или процедурный, подход. Развитие этого подхода было связано со значительными успехами в развитии языков программирования — от языка машинных кодов до языков высокого уровня (Фортран, Паскаль, Си, Модула и др.). Основная суть этого подхода заключается в том, что знания и процедуры их обработки выражаются в виде жесткой последовательности действий (алгоритма), предписываемых к исполнению компьютером. При таком подходе разработанная прикладная программа составляет единое целое со знаниями. Относительно быстро выяснилось, что такой подход влечет за собой следующие недостатки: • увеличение сложности решаемых задач приводит к тому, что программы становятся все сложнее для понимания, и поэтому затрудняется их разработка; • изменения, происходящие в предметной области, как правило, требуют корректировки алгоритма решения задачи, а это, в свою очередь, влечет повторное написание отдельных фрагментов программы, а иногда и всей программы целиком. Необходимым условием возможности решения задачи, используя процедурный подход, является наличие четкого алгоритма. Поэтому автоматизация коснулась прежде всего так называемых формализованных задач, алгоритм решения которых хорошо известен (например, задача расчета заработной платы). Однако в практической деятельности человек чаще сталкивается с задачами совсем другого типа, для которых характерны следующие особенности: • алгоритм решения задачи неизвестен или не может быть использован из-за ограниченности памяти и быстродействия компьютера; • задача не может быть записана в числовой форме (например, задача медицинской или технической диагностики). Такие задачи принято называть плохо формализуемыми. Попытка устранить перечисленные выше недостатки процедурного подхода, а также попытка решения плохо формализуемых задач привели к формированию нового направления — инженерии знаний. В основе этого направления лежит идея выделения знаний из программного обеспечения компьютера и превращения их в отдельную компоненту — базу знаний. Знания, хранящиеся в базе знаний, представляются в конкретной единообразной форме, что дает возможность их легкого определения, модификации и пополнения. Решение же задач реализуется с помощью логических выводов, делаемых на основании знаний. Для этого предусмотрен отдельный модуль логического вывода, который, собственно, и составляет основную часть программного обеспечения. Системы, построенные по такому принципу, называются системами, основанными на знаниях, или интеллектуальными системами. Наиболее значительное практическое достижение в области инженерии знаний представляет специальный класс интеллектуальных систем — экспертные системы, которые предназначены для решения разнообразных задач в конкретных областях человеческой деятельности без участия квалифицированных специалистов. Знания, относящиеся к любой предметной области, обычно существуют в двух видах: общедоступные и индивидуальные. Общедоступные знания — это факты, определения, теории, которые обычно изложены в учебниках и справочниках по данной области. Но, как правило, специалисты в данной предметной области — эксперты — обладают еще и индивидуальными знаниями, которые отсутствуют в литературе. Эти личные знания основываются на собственном опыте эксперта, накопленном в результате многолетней практики, и в значительной мере состоят из эмпирических, т.е. основанных на опыте, правил, которые принято называть эвристиками. Эвристики позволяют экспертам выдвигать разумные предположения и находить перспективные подходы к решению плохо формализуемых задач. 11.2. Модели представления знаний Знания в базе знаний должны быть представлены в определенной форме. Форма представления знаний зависит от решаемой задачи и оказывает существенное влияние на характеристики и свойства разрабатываемой системы. Поэтому представление знаний является одной из наиболее важных проблем при разработке программных интеллектуальных систем. Поскольку логический вывод и действия над знаниями выполняют специальные программы, знания нельзя представлять непосредственно в том виде, в котором они используются челове- ком (например, в виде простого текста). Поэтому для представления знаний разрабатываются математически строгие модели представления знаний. В настоящее время существуют десятки моделей представления знаний для различных предметных областей. Большинство из них сводится к следующим классам: • продукционная модель; • модель семантической сети; • модель, основанная на фреймах; • логическая модель. Рассмотрим основные концепции, лежащие в основе этих моделей. 11.2.1. Продукционная модель Еще в 60-е годы прошлого столетия американские исследователи в области искусственного интеллекта А. Ныоэлл и Г. Саймон показали, что во многих случаях человеческие рассуждения могут быть представлены в виде последовательности, состоящей из предложений, каждое из которых записывается: ЕСЛИ (условие) ТО (действие), где под «условием» понимается один или несколько фактов, соединенных логическими операторами AND (И), OR (ИЛИ), NOT (НЕ), а под «действием» — одна или несколько операций по обработке данных, выполняемых, если в рассматриваемой ситуации «условие» истинно. Предложения такого вида называются правилами продукции, а интеллектуальные системы с базами знаний, состоящими из правил, называются продукционными системами. Отметим, что при описании знаний в виде правил продукции часто используются следующие форматы записи правил: IF (условие) THEN (действие) или (условие) -> (действие) Логический вывод в продукционных системах может выполняться в соответствии с двумя разными стратегиями, которые называются прямой и обратной цепочками рассуждений. Поясним эти стратегии вывода на следующем примере. Пусть база знаний состоит из четырех правил: Отметим, что в этих правилах действия, т. е. THEN-части правил, являются просто операторами присваивания определенных значений переменным Z, В и т.д. Каждое такое действие можно интерпретировать как появление нового факта. Так, например, правило П4 утверждает, что, если имеет место факт то объекту с именем D надо присвоить значение и, тем самым, мы получим факт Важным понятием в продукци- онных системах является доска объявлений, которая представляет собой область оперативной или внешней памяти системы, куда записываются: • факты, известные до начала вывода; • факты, ставшие результатом исполнения правил в ходе вывода. Условие правила выполняется, если соответствующие ему факты содержатся на доске объявлений. Пусть вначале доска объявлений содержит факты Мы хотим выяснить: что следует из этих фактов, т. е. какие новые факты можно получить, используя правила базы знаний. Логический вывод в соответствии с прямой цепочкой рассуждений происходит по следующей схеме. На первом шаге система просматривает все правила в базе знаний и находит первое правило, для которого условие, т.е. IF-часть является истинной при наличии фактов, выставленных на доске объявлений. В нашем случае это правило П4 — для него IF-часть истинна, т.к. на доске объявлений есть факт Этот шаг называется согласованием. На втором шаге выполняется действие, записанное в THEN-части согласованного правила П4, и факт помещается на доску объявлений. Этот шаг называется исполнением правила. Далее система просматривает снова все правила, кроме исполненного П4, и находит первое правило, для которого IF-часть истинна при наличии всех фактов на уже обновленной доске объявлений. Видно, что наличие факта и появление факта дает в результате согласование с правилом П2. Исполнение правила П2 приводит к обновлению доски объявлений: на ней появляется новый факт Далее процедура согласования и исполнения правил повторяется аналогично до тех пор, пока еще существуют правила, которые можно согласовать с фактами, помещенными на доску объявлений. Результатом логического вывода будет состояние доски объявлений в момент остановки алгоритма. Для рассматриваемого примера: это новые факты и факты известные до начала вывода. Понятно, почему такой вывод называется прямой цепочкой вывода — поиск новой информации происходит в направлении стрелок, разделяющих левые и правые части правил. На рис. 11.1 детально показано, как работает цепочка прямого вывода, при этом в базе знаний выделено то единственное правило, которое исполняется на данном шаге. Необходимость в обратной цепочке рассуждений возникает в следующей ситуации. Предположим, мы хотим использовать базу Рис. 11.1. Прямая цепочка рассуждений знаний для того, чтобы установить конкретный факт, например имея ту же исходную информацию, что и в предыдущем случае. Иными словами, система должна нам ответить на вопрос: верно ли что из фактов следует факт ? Искомый факт называется целью, а переменная Z — переменной цели. В принципе, цель можно достигнуть, если использовать прямую цепочку рассуждений. В конце работы алгоритма надо будет только просмотреть доску объявлений, чтобы выяснить: находится среди полученного множества различных фактов интересующий нас или нет. Если правил немного, такой подход вполне допустим, но, если база знаний содержит несколько сотен правил, то будет исполнено много правил, которые не имеют ничего общего с интересующим нас фактом. Более эффективной будет стратегия вывода по обратной цепочке рассуждений. При этой стратегии система всегда начинает поиск нужного факта с просмотра доски объявлений. В нашем случае на доске объявлений выставлены только факты а интересующего нас факта нет. Тогда система просматривает все правила, начиная с первого, чтобы найти то из них, в котором в THEN-части стоит оператор присваивания В данном слу- чае это правило Ш. Найдя это правило, система решает, что ей необходимо установить факты стоящие в IF-части правила. Система пытается установить первый факт, сначала проверяя доску объявлений. В данном случае это сразу приводит к успеху, так как факт находится на доске объявлений. Тогда система ставит перед собой промежуточную цель: установить, имеет ли место второй факт Поскольку этот факт отсутствует на доске объявлений, система пытается найти правило, в THEN-части которого выполняется действие Правило П2 удовлетворяет этому требованию. На следующем шаге система пытается установить факты и содержащиеся в IF-части П2. Первый факт выставлен на доску объявлений. Второй факт становится очередной про- межуточной целью системы. Поскольку его нет на доске объявлений, система находит правило, у которого в правой части стоит оператор присваивания Таким правилом является П4. IF- часть правила П4 выполнена, так как факт выставлен на доске объявлений. В результате проделанных шагов сформировалась цепочка связанных между собой правил Ш — П2 — П4. Теперь система начинает проход по этой цепочке в обратном направлении: 1) из факта (он выставлен на доску объявлений) следует факт (исполняется правило П4); 2) из фактов следует факт (исполняется правило П2); 3) из фактов следует интересующий нас факт На этом процесс обработки правил базы знаний заканчивается. При выводе по обратной цепочке рассуждений может возникнуть ситуация, когда для достижения некоторой цели (основной или промежуточной) необходимый факт не удается установить ни из правил базы знаний, ни из содержимого доски объявлений. В этом случае интеллектуальная система, работающая в диалоговом режиме, задает соответствующий вопрос человеку, работающему с этой системой, например: «Верно, что ?» или «Введите значение переменной В», и в зависимости от его ответа продолжает процесс вывода. Мы рассмотрели задачу, когда требуется с помощью логического вывода установить истинность определенного факта. Однако во многих случаях требуется определить, какое именно значение примет переменная цели при условии, что известны некоторые факты, относящиеся к предметной области. Поясним сказанное на простом примере медицинской базы знаний*. Предварительно введем следующие обозначения для переменных, используемых при записи правил: * База знаний носит условный характер. G — уровень гемоглобина в крови, Т — температура, L — уровень лейкоцитов в крови, D — диагноз пациента. База знаний: Ш: IF G = «в норме» AND T<37 AND T 36.4 THEN D;= «здоров»; П2: IF G = «низкий» AND T>37 THEN D:= «болен»; ПЗ: IF L< 15 THEN G «в норме»; П4: IF L>15 THEN G «низкий». Предположим мы хотим установить диагноз пациента (болен он или здоров), т. е. определить значение переменной цели D. Пусть перед началом логического вывода для диагностируемого пациента известны следующие факты: Т = 38,1, L = 18. Поместим эти факты на доску объявлений. Схема работы системы по обратной цепочке рассуждений такова. Сначала будет найдено первое правило, в THEN-части которого переменной цели D присваивается какое-либо значение. В данном случае это правило Ш. Для того, чтобы Ш исполнилось, необходимо выполнение условия в IF-части. Для этого система пытается определить переменные G и Т. Переменная G становится временной целевой переменной, и система пытается определить ее значение из правил. Первое правило, в THEN-части которого переменной G присваивается значение, — правило ПЗ. Однако это правило не исполняется, так как его условие (L<15) не выполнено. Тогда ищется следующее правило для определения G. Правило П4 позволяет определить значение временной целевой переменной G = «низкий». Этот факт выставляется на доску объявлений. Значение второй переменной Т находится непосредственно из доски объявлений. Возвращаясь к правилу Ш, система обнаруживает, что оно не исполняется, так как условие в его IF-части ложно. Система ищет другое правило, в котором целевая переменная D принимает какое-либо значение. Это правило П2. Условие этого правила выполняется, так как из доски объявлений система получает все необходимые факты. Процесс вывода закончен, и диагноз пациента определен. Отметим, что в реальных продукционных системах цепочка исполняемых правил, получающаяся при логическом выводе, может содержать значительное число правил (до нескольких десятков). Представление знаний в виде правил продукции чаще всего используют в предметных областях, где знания формируются в результате опыта, накопленного за годы работы в данной области (т.е. как эвристики), и используются для получения рекомендаций, указаний или советов. Сильными сторонами продукционной модели являются: • простота создания и понимания отдельных правил; • простота пополнения и модификации; • простота механизма логического вывода. Однако у продукционной модели есть и слабые стороны: • неясность взаимных отношений правил; • сложность оценки целостного образа знаний, представленных правилами; • отсутствие гибкости в логическом выводе. Несмотря на указанные недостатки, большинство реальных экспертных систем построено на базах знаний, использующих правила продукции. Именно поэтому мы уделили продукционной модели большее внимание по сравнению с другими моделями представления знаний. 11.2.2. Семантические сети Основная идея подхода к представлению знаний с помощью семантических сетей состоит в том, чтобы рассматривать предметную область как совокупность понятий и отношений между ними. В качестве понятий обычно выступают абстрактные или конкретные объекты, а отношения — это связи типа: «это», «имеет частью», «принадлежит» и др. Семантическая сеть является наглядным способом представления такого рода знаний о предметной области в виде схемы, которая называется ориентированным графом с размеченными узлами и дугами. Поясним сказанное на примере. Если объект А находится в определенной связи S с объектом В, то это знание можно изобразить в виде такого элементарного графа (рис. 11.2). Узлы, изображенные прямоугольниками, соответствуют объектам, а дуга в направлении от узла А к узлу В соответствует связи S. Например, фраза «Иванов работает в отделе сбыта» представляется в виде, показанном на рис. 11.3. Такие элементарные подграфы являются базовыми функциональными элементами. Соединяясь между собой с помощью связей-дуг, они формируют семантическую сеть. На рис. 11.4 приведен фрагмент семантической сети, в котором представлены знания, относящиеся к сотрудникам и отделам фирмы. Видно, что в сети представлены как фактические данные (Петров работает начальником отдела сбыта, отдел сбыта находится в комнате № 7), так и знания более общего вида (любой сотрудник имеет право на парковку автомобиля).
Рис. 11.2 Рис. 11.3 Рис. 11.4. Пример семантической сети Наиболее часто в семантических сетях используются следующие отношения: • связи типа «часть — целое»; • функциональные связи (определяемые обычно глаголами «производит», «влияет», «влечет»....); • количественные (больше, меньше, равно...); • пространственные (далеко от, близко от, за, под, над...); • временные (раньше, позже, в течение...); • атрибутивные связи (иметь свойство, иметь значение...) и др. отношении «А это В», то понятие А обладает всеми характеристиками более общего понятия В. Если при этом В находится в отношении «это» с еще более общим понятием С, то А наследует и характеристики С. Так, для семантической сети на рис. 11.4 менеджер обладает всеми свойствами и возможностями сотрудника. Поэтому для каждого менеджера
Воспользуйтесь поиском по сайту: ©2015 - 2024 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...
|