Главная | Обратная связь
МегаЛекции

Формализм представления и машина вывода




Как уже отмечалось выше, онтология определяется через концепты (классы), связанные отношениями, атрибуты и аксиомы. И адекватный язык представления должен обеспечить удобные средства для описания всех перечисленных компонентов. В Ontobroker базисом представления являются так называемые логики фреймов (Frame-Logic) [Kifer et al., 1995].

Базисными конструкциями в данном подходе являются:

• Подклассы (Subclassing) — запись С1 :: С2 означает, что класс С1является подклассом С2.

• Экземпляры (Instance of) — запись О : С означает, что О является экземпляром класса С.

• Декларации атрибутов (Attribute Declaration) — запись С1[А=>>С2]означает, что для экземпляра класса С1определен атрибут А, значением которого должен быть экземпляр С2.

• Значения атрибутов (Attribute Value) — запись O[A->>V]означает, что экземпляр О имеет атрибут А со значением V.

• Часть-целое (Part-of) — запись О1 <: О2 означает, что О1является частью О2.

• Отношения (Relations) — предикаты вида p(al,...,a2)могут использоваться, как и в обычных логических формализмах, но с тем расширением, что в качестве аргументов здесь могут выступать не только термы, но и выражения.

Из базисных конструкций строятся более сложные — факты (facts), правила (rules), «двойные» правила (double rules) и запросы (queries). Запросы уже обсуждались выше. Факты, по сути, являются элементарными выражениями. Правила, как и обычно, имеют левую и правую части, причем левая часть (здесь она называется «головой») является конъюнкцией элементарных выражений, а правая («тело») — сложная формула, термами которой являются элементарные выражения, связанные обычными предикатными символами типа implies: —> , implied by: <—, equivalent: <—>, AND, OR и NOT. Отличие между обычными и «двойными» правилами в симметричности последних. Важное достоинство формализма — возможность использования переменных в «голове» правил (с квантором FORALL) или в его «теле» (с кванторами FORALL и EXISTS). Пример фрагмента онтологии в формализме Ontobroker, адаптированный из работы [Fensel et al., 1998], приводится ниже.

Определения атрибутов

 

Person [firstName =» STRING;

lastName =» STRING;

eMail =» STRING;

……………………………….

publication =>>Publication],

Employee [affiliation =» 0rganization; ...].

Researcher [researchlnterest =» ResearchTopic;

Member0f =>> ResearchGroup;

cooperatesWith =» Researcher].

Publication [ author =» Person;

title =» STRING;

year =» NUMBER;

abstract =» STRING].

 

Правила

FORALLPerson"!, Person2

Personl:Researcher [cooperatesWith-» Person2] <-

Person2:Researcher [cooperatesWith-» Personl].

 

FORALL Personl, Publieationl

Publicationl:Publication [author-» Personl] <->

Personl:Person [publication-» Publicationl].

 

По-видимому, в пояснениях здесь нуждаются только правила. Первое из них фиксирует симметричность отношения cooperatesWith. Второе утверждает, что если конкретная личность (экземпляр класса Person) имеет публикацию, то последняя имеет автора, который тоже является экземпляром класса Person, и обратно.

Машина вывода Ontobroker состоит из двух основных компонентов: транслятора с расширенного языка представления в ограниченный и собственно вычислителя выражений ограниченного языка, который является обычным языком логического программирования.

Аннотация Web-страниц онтологической информацией

Поскольку, как уже отмечалось выше, Web-информация чаще всего представлена на языке HTML, в рамках проекта Ontobroker разработано простое его расширение для аннотации Web-страниц. Основная идея этого расширения состоит в следующем: в язык HTML добавлено несколько релевантных для решения поставленных задач тегов, использование которых позволяет Ontobroker интерпретировать аннотированные фрагменты HTML-текста как факты языка представления онтологических знаний. При этом Web-страницы остаются приемлемыми для стандартных броузеров типа Netscape Navigator или MS Explorer.

В язык введены три эпистемологически различных примитива:

• Идентификация объекта, который может быть определен как экземпляр определенного класса, с помощью URL

• Установка значения атрибута объекта.

• Определение отношений между объектами.

Все примитивы синтаксически расширяют тег <а ...> языка HTML. Так, например, если специалист Иванов захочет определить себя как объект обсуждавшейся выше онтологии, он может на своей домашней странице ввести конструкцию вида:

 

<а onto=" "http://www.anywhere.ru/~ivanov/" : Researcher"> </a>

 

Теперь для объекта Иванов класса Researcher можно ввести атрибут email и его значение с помощью следующей конструкции:

 

<а onto=" "http://www. anywhere.ru/~ivanov/"

[email="mailto:ivanov@anvwhere. ru"1 "> </a>

 

Аналогичным образом вводятся и отношения:

 

<а onto= "REL(Obj1, Obj2, Obj3, ___ Objn)" > ... </a>

 

Имеются в языке и средства, которые обеспечивают уменьшение сложности аннотирования: например, возможности именования «длинных» конструкций и последующего использования этих имен.

При таком подходе Ontocrawler — компонент системы Ontobroker — простой CGI-скрипт, который периодически проверяет аннотированные страницы на Web. Для поиска таких страниц он обращается к индексным страницам провайдеров, которые зарегистрированы в рамках инициативы (КА)2.

 

Проект SHOE — спецификация

Онтологии и инструментарий

Общая характеристика проекта

Проект SHOE (Simple HTML Ontology Extensions) ориентирован на решение проблемы добавления к Web-страницам семантической информации и соотнесения ее с онтологиями соответствующих предметных областей. Предполагается, что, используя эту информацию, поисковые системы смогут обеспечивать более релевантные ответы на запросы, чем это возможно сейчас на базе использования машин поиска, функционирующих в Интернете.

Для поддержки процессов аннотирования в рамках проекта SHOE разрабатывается специальный набор инструментальных средств (suite of tools), а основой кх является язык Интернет-совместимого представления знаний, который, собственно, и дал название всему проекту.

В настоящее время в проекте SHOE выделены следующие главные направления исследований:

• Разработка множества повторно используемых онтологии (reusable ontologies) для концептов, которые наиболее частотны для Web-ресурсов.

• Создание средств проектирования онтологии — аннотаторов знаний (Knowledge Annotator), которые бы упростили этот процесс.

Предполагается также, что в SHOE-инструментарий будет включена «несложная» обработка естественного языка (lightweight natural language processing techniques), которая обеспечит представление пользователям аннотаций документов.

 





©2015- 2017 megalektsii.ru Права всех материалов защищены законодательством РФ.