Главная | Обратная связь | Поможем написать вашу работу!
МегаЛекции

Аннотация Web-документов на базе онтологии




Аннотация HTML-документов в SHOE осуществляется также с использованием тегов. В частности, для этого служат теги USE-ONTOLOGY, INSTANCE, CATEGORY, RELATION. Последние три тега имеют следующие форматы:

 

<INSTANCE KEY=" значение-ключа"

[DELEGATE-TO=" список-примеров" ]>... </INSTANCE>

<CATEGORY NAME ="префикс, категория" [FОR-"ключ"]>

<RELATION NAME ="префикс. отношение ">список-аргументов </RELATION>

 

Для поиска и обработки домашних страниц с помощью специфицированной выше онтологии необходимо, чтобы авторы Web-публикаций сами (или на основе инструментария SHOE) проаннотировали свои документы.

Так, например, фрагмент аннотации персональной страницы исследователя Иванова в формализме SHOE выглядит следующим образом:

 

<BODY>

<МЕТА HTTP-EQUIV= "-Instance"

CONTENT ="http://www. anywhere. ru/~ivanov">

<USE-ONTOLOGY "HomePageOntology"

VERSION="1.0" PREFIX="our"

URL="nttp;//Mw. ont. org/HomePageOntology. html">

<CATEGORY "our.Person">

<RELATION "our. first Name" TO="Ivan">

<RELATION "our.lastName" TO="Ivanoy">

<RELATION "our.tnarriedTo"

TO ="http://www. somewhere. ru/~Mariya">

<RELATION "our. employee" FROM ="http://www. ccas. ru">

……………………………………………………………………

</BODY>

 

Анализ приведенного HTML-текста показывает, что даже в таком, казалось бы, простом случае задача аннотации Web-документа достаточно сложна. Ситуация становится еще более сложной при аннотировании реальных HTML-документов. Во-первых, уже выбор объектов текста, подлежащих аннотированию, не тривиален, особенно, если Web-документ представляет объекты реального мира. Во-вторых, гиперссылки часто фиксируют лишь наличие определенных отношений между объектами, но не их семантику. И, наконец, можно, конечно, аннотировать каждую именную группу в естественно-языковом представлении HTML-страницы, но для реальных документов это слишком трудоемкая задача, которая, к тому же, чревата большим количеством ошибок.

Поэтому в рамках проекта SHOE для автоматизации процессов аннотирования Web-документов разработана специальная система Knowledge Annotator [KA, 1999], одна из экранных форм которой представлена на рис. 8.12.

 

Основными информационными блоками в приведенной выше экранной форме являются экземпляры (instances), онтологии (ontologies) и утверждения (claims). Пользователь может добавлять, редактировать и/или удалять любой из элементов этих блоков. При создании новых объектов пользователю выдаются соответствующие подсказки в виде, например, списка доступных онтологии, описанных в них категорий, отношений и т.п.

Для визуализации знаний, содержащихся в обрабатываемом документе, Knowledge Annotator использует различные методы, начиная с аннотированного HTML-текста и заканчивая описаниями утверждений на естественном (английском) языке. Кроме того, система осуществляет проверку корректности действий пользователя и транслирует его выборы в синтаксически правильные конструкции SHOE.

 

Формализм запросов

В настоящее время существуют различные примеры языков запросов к документам, проаннотированным на основе формализмов SHOE, рассмотренных выше. Так, в университете Мэрилэнд (University of Maryland at College Park) разработан робот Expos, который обрабатывает SHOE-документы и добавляет их в свою базу знаний, используя систему представления знаний PARKA [Stoffcl et al., 1997].

Пример PARKA-запроса для поиска домашних страниц может быть специфицирован следующим образом:

 

(query! "(:and

(ft! instanceOf?X #! Person) (ft! instanceOf?Y #!Person)

(tt!instanceOf?Z #!Organization)

(tfllastName?X "Ivanov") (#!lastName?Y "Ivanova")

(ft! employee?Z?X) (#! employee?Z?Y)

(tflmarriedTo?X?Y)

(#! involvedln?Z "РФФИ-проекты")))

 

По существу, это достаточно простой SQL-запрос, расширенный за счет использования понятий онтологии, переменных и ограниченных по мощности образцов. Оценивая формализм представления онтологических знаний SHOE и поддержку процессов аннотирования Web-ресурсов в этом проекте в целом, можно констатировать, что это достаточно мощная система методов и средств, которая вместе с тем сложнее для пользователя, чем Ontobroker.

Поделиться:





Воспользуйтесь поиском по сайту:



©2015 - 2024 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...