Стратегии получения знаний. Приобретение, формирование и извлечение знаний
⇐ ПредыдущаяСтр 4 из 4 Существует несколько стратегий получения знаний. Наиболее распространенные: · приобретение · извлечение · формирование
Под приобретением знаний понимается способ автоматизированного построения базы знаний посредством диалога эксперта и специальной программы (при этом структура знаний заранее закладывается в программу). Эта стратегия требует существенной предварительной проработки предметной области.
Термин извлечение знаний касается непосредственного живого контакта инженера по знаниям и источника знаний. Авторы склонны использовать этот термин как более емкий и более точно выражающий смысл процедуры переноса компетентности эксперта через инженера по знаниям в базу знаний экспертной системы.
Термин формирование знаний традиционно закрепился за чрезвычайно перспективной и активно развивающейся областью инженерии знаний, которая занимается разработкой моделей, методов и алгоритмов анализа данных для получения знаний и обучения. Эта область включает индуктивные модели формирования гипотез на основе обучающих выборок, обучение по аналогии и другие методы.
Извлечение знаний - это процедура взаимодействия эксперта с источником знаний, в результате которой становятся явными процесс рассуждений специалистов при принятии решения и структура их представлений о предметной области.
В настоящее время большинство разработчиков экспертных систем отмечают, что процесс извлечения знаний остается самым "узким" местом при построении промышленных систем.
Процесс извлечения знаний - это длительная и трудоемкая процедура, в которой инженеру по знаниям, вооруженному специальными знаниями по когнитивной психологии, системному анализу, математической логике и пр., необходимо воссоздать модель предметной области, которой пользуются эксперты для принятия решения.
Помимо перечисленных существуют также и другие стратегии получения знаний, например, в случае обучения на примерах (case-based reasoning), когда источник знаний — это множество примеров предметной области. Обучение на основе примеров (прецедентов) включает настройку алгоритма распознавания на задачу посредством предъявления примеров, классификация которых известна.
Обучение на примерах тесно связано с машинным обучением. Различие заключается в том, что результат обучения в рассматриваемом здесь случае должен быть интерпретирован в некоторой модели, в которой, возможно, уже содержатся факты и закономерности предметной области, и преобразован в способ представления, который допускает использование результата обучения в базе знаний, для моделирования рассуждений, для работы механизма объяснения и т. д., то есть делает результат обучения элементом соответствующей технологии.
Таким образом, можно выделить три основные стратегии проведения стадии получения знаний при разработке ЭС:
Классификация методов извлечения знаний Методы извлечения знаний 1. Текстологические (Анализ учебников, Анализ литературы, Анализ методик)
2. Коммуникативные · Активные · Индивидуальные (Анкетирование, Интервью, Экспертные игры) · Групповые (мозговой штурм, круглый стол) · Пассивные (Наблюдение, Протокол "мыслей вслух", Лекции)
Коммуникативные методы - набор приемов и процедур, предполагающих контакт инженера по знаниям и непосредственным источником знаний. Текстологические - методы извлечения знаний из документов Пассивные методы подразумевают что ведущая роль в процессе извлечения знаний отводиться эксперту, и инженер только протоколирует рассуждение эксперта во время его реальной работы по принятию решений или записывает то что эксперт считает нужным рассказать в форме лекций. В активных методах вся инициатива находиться у инженера. Выбор метода зависит от трех факторов: · личностные особенности инженера, · личностные особенности эксперта и · характеристика предметной области.
Один из возможных вариантов работы с текстовой информацией: 1 Составление "базового" списка для ознакомления с с ПО 2 Первое прочтение с выписыванием неизвестных терминов 3 Консультации с специалистами 4 второе прочтение текста с составление набора ключевых слов 5 определение связей между наборами ключевых слов, разработка семантической структуры текста в виде графа или реферата. составление поля знаний 6 третье прочтение текста коррекция поля знания
Структурирование знаний Выявляется понятийная структура, которой пользуется организация. Разрабатывается структура информации в СУЗ и ее архитектура.
На этом этапе должны быть выделены основные понятия, выявлена структура полученных знаний о предметной области, обладающая максимальной наглядностью, простотой изменения и дополнения.
Иными словами на этапе структурирования знаний определяются: · терминология; · список основных понятий и их атрибутов; · отношения между понятиями; · структура входной и выходной информации; · стратегия принятия решений.
Структурирование знаний — разработка неформального описания знаний о предметной области в виде графа, таблицы, диаграммы или текста, которое отражает основные концепции и взаимосвязи между понятиями предметной области. Формируется так называемая карта знаний, наглядно демонстрирующая, где находятся источники знаний и данных и кто ими владеет.
На этом этапе должна быть выработана структура представления информации. Она должна быть максимально наглядной, легко изменяемой и дополняемой. Именно на этом этапе создаются описания и модели бизнес-процессов и структуры потоков информации.
Семантический веб Семантический Web призван сделать размещённую в ней информацию более понятной для компьютеров, доступной во Всемирной паутине. Основной акцент концепции делается на работе с метаданными, однозначно характеризующими свойства и содержание ресурсов Всемирной паутины, вместо используемого в настоящее время текстового анализа документов. Центральным компонентом концепции является применение онтологий. Онтологии являются ключевым компонентом Семантического Web и представляют собой формальные концептуальные модели предметных областей, понимаемые всеми участниками сообщества. Они содержат словари предметных областей вместе с семантическими связями между понятиями и логическими правилами вывода. Машинная обработка возможна в семантической паутине благодаря двум её важнейшим характеристикам:
1) Повсеместное использование унифицированных идентификаторов ресурсов
(Традиционная схема использования таких идентификаторов в современном Интернете сводится к установке ссылок, ведущих на объект, им адресуемый. Очевидным свойством такой ссылки является возможность «загрузки» объекта, на который она указывает. Таким объектом может быть веб-страница, файл произвольного содержания, фрагмент веб-страницы, а также неявное указание на обращение к реально существующему физическому ресурсу по протоколу, отличному от HTTP (например, ссылки mailto:). Концепция семантической паутины расширяет это понятие, включая в него ресурсы, недоступные для скачивания. Адресуемыми с помощью URI ресурсами могут быть, например, отдельные люди, города и другие географические сущности, художественные артефакты и т. д. К идентификатору предъявляются несколько простых требований: он должен быть строкой определённого формата, уникальной, а также адресующей реально существующий объект.)
2) Повсеместное использование онтологий и языков описания метаданных.
(Современные методы автоматической обработки данных, доступных в Интернете, как правило, основаны на частотном и лексическом анализе текстового содержимого (хотя есть и исключения: например, Swoogle или Intellidimension Semantic Web Search Engine), которое прежде всего предназначено для восприятия человеком. В семантической паутине предлагается использовать форматы описания, доступные для машинной обработки (например, семейство форматов, часто упоминаемое в литературе как «Semantic Web family»: RDF, RDF Schema или RDF-S, и OWL), в свою очередь, использующие URI для адресации описываемых и описывающих объектов, а также онтологии и дескрипционные логики в качестве базовых математических формализмов.)
С расширением Всемирной паутины работа поисковых систем все более усложнялась: чтобы обеспечить достаточный охват, им приходилось индексировать и обрабатывать все больший объем информации. Но главная сложность заключалась даже не в увеличении количества индексируемых сайтов, а в том, чтобы обеспечить релевантные ответы на поисковые запросы пользователей, то есть выдавать пользователям ссылки на те ресурсы, которые, по их мнению, соответствуют тому, что они искали, семантический Web же позволяет значительно облегчить эту задачу.
Воспользуйтесь поиском по сайту: ©2015 - 2024 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...
|