Главная | Обратная связь | Поможем написать вашу работу!
МегаЛекции

Семиотическая модель поля знаний

Поле знаний является некоторой семиотической моделью, которая может быть представлена как граф, рисунок, таблица, диаграмма, формула или текст.

Синтаксис. Обобщенно синтаксическую структуру можно представить как

П = (І, О, М),

где І – структура исходных данных,

   О – структура выходных данных,

  М – модель ПО, на основании которой происходит модификация І в О.

Модель предметной области представляет совокупность концептуальной и функциональной структуры. Концептуальная структура выступает как статическая, неизменная составляющая поля знаний, а функциональная представляет динамическую составляющую.

Формирование концептуальной структуры основано на выявлении понятий ПО и построении иерархии понятий, так называемой «пирамиды знаний». Функциональная структура моделирует связи и отношения между понятиями. Эти связи отражают модель или стратегию принятия решения. Таким образом функциональная структура образует стратегическую составляющую модели.

Семантика – фактически это набор правил интерпретации предложений и формул любого языка. Семантика должна быть композиционной, то есть значение предложения определяется как функция значений его составляющих. Семантика языка зависит от особенностей ПО, она обладает свойством полиморфизма, одни операторы в разных задачах могут иметь свои особенности.

Семантика поля знаний имеет два уровня: на первом есть семантическая модель знаний эксперта, на втором уровне любое поле знаний является моделью некоторых знаний.

Знания – вещь сугубо авторизованная и ЭС является «базой знаний эксперта Х в понимании инженера по знаниям У». Стоит заменить инженера по знаниям, и получится совсем другая картина.

Стратегии получения знаний

Процесс получения знаний является ключевым при формировании поля знаний. Можно выделить три основные стратегии проведения стадии получения знаний при разработке ЭС:

Извлечение знаний (knowledge elicitation) – это процедура взаимодействия эксперта с источником знаний, в результате которой становятся явными процесс рассуждений специалистов при принятии решения и структура их представлений о предметной области.

Трудности:

· организационные неувязки, неудачный метод извлечения, не совпадающий со структурой знаний в данной области,

· неадекватная модель для представления знаний,

· неумение наладить контакт с экспертом,

· терминологический разнобой,

· отсутствие целостной системы знаний в результате извлечения только фрагментов,

· упрощение «картины мира» эксперта.

Процесс извлечения знаний – это длительная и трудоемкая процедура, в которой инженеру по знаниям необходимо воссоздать модель ПО, которой пользуются эксперты для принятия решения. Объекты реального мира связаны более чем 200 типами отношений (временные, пространственные, причинно- следственные и т. п.). Эти отношения и связи ПО образуют сложную систему, из которой необходимо выделить скелет или главную структуру.

Приобретение знаний (knowledge acquisition) – процесс наполнения базы знаний экспертом с использованием специализированных программных средств.

Формирование знаний (machine learning) – процесс анализа данных и выявления скрытых закономерностей с использованием специального математического аппарата и программных средств. Этот термин закрепился за перспективной и активно развивающейся областью инженерии знаний, которая занимается разработкой моделей, методов и алгоритмов обучения. Наиболее продвинутыми методами машинного обучения являются методы распознавания образов, в частности алгебраический подход.

Теоретические аспекты извлечения знаний

 Чтобы разобраться в природе извлечения знаний, выделим три основных аспекта этой процедуры:

А = {А1, А2, А3} = {психологический, лингвистический, гносеологический}

Психологический аспект является ведущим, поскольку он определяет успешность и эффективность взаимодействия аналитика с основным источником знаний – экспертом-профессионалом. Извлечение знаний происходит в процессе непосредственного общения, а в общении психология является доминантной. Общение – это междисциплинарное понятие, обозначающее все формы контактов между людьми – от дружеских до деловых.

Таб.6. Потери информации при разговорном общении

Задумано Приобрело словесную форму Высказано Выслушано Понято Осталось в памяти
100% 90% 80% 70% 60% 24%

Лингвистический аспект касается исследования языковых проблем, т.к. язык – основное средство общения в процессе извлечения знаний. Можно выделить три слоя лингвистических проблем: «общий код», понятийная структура, словарь пользователя. «Общий код» решает проблему языковых ножниц между профессиональной терминологией эксперта и обыденной речью инженера по знаниям. «Общий код» включает общенаучную терминологию, специальные понятия из профессиональной литературы, элементы бытового языка, неологизмы, профессиональный жаргон и др. Выработка общего кода – это составление словаря предметной области.

Понятийная структура подразумевает построение иерархии абстракций – глобальной схемы, которая может быть положена в основу концептуального анализа структуры знаний любой предметной области. Лингвистический эквивалент иерархии – иерархия понятий, которую необходимо построить в понятийной структуре, формируемой инженером по знаниям.

Составление словаря пользователя – это формирование отдельного словаря для создания дружественного интерфейса с пользователем ЭС. Для разработки пользовательского интерфейса требуется дополнительная доработка словаря общего кода с поправкой на доступность системы.

Гносеологический аспект извлечения знаний объединяет методологические проблемы получения нового научного знания.

Гносеология – это раздел философии, связанный с теорией познания, или теорией отражения действительности в сознании человека.

Сначала действительность отражается в сознании эксперта, затем деятельность и опыт эксперта интерпретируются сознанием инженера по знаниям, что служит основой для построения третьей интерпретации – поля знаний ЭС.

Само знание имеет два уровня:

1. Эмпирический (наблюдения, явления),

2. Теоретический (законы, абстракции, обобщения).

Гносеологическая цепочка: факт → обобщенный факт → эмпирический закон → теоретический закон.

Основными методологическими критериями научности нового знания и способа его получения являются: внутренняя согласованность, системность, объективность, историзм.

Эмпирическому знанию свойственны модальность, противоречивость, неполнота. Задача аналитика – сглаживать эти «шероховатости» эмпирики.

Системно-структурный подход к познанию ориентирует аналитика на рассмотрение ПО с позиций закономерностей системного целого и взаимодействия составляющих его частей. Например, системный взгляд на проблематику структурирования знаний позволяет увидеть его иерархическую организацию.

Процесс познания субъективен. Следовательно, более корректно говорить о глубине понимания, чем об объективности знания.

Критерий «историзм» связан с развитием. Познание настоящего – есть познание породившего его прошлого.

Методологическая структура познания может быть представлена как некоторая последовательность этапов:

1. Описание и обобщение фактов;

2. Установление логических и математических связей, дедукция и индукция законов;

3. Построение идеализированной модели;

4. Объяснение и предсказание явлений.

 

Теоретические аспекты структурирования знаний

Разделение стадий извлечения и структурирования знаний является условным. В настоящее время прослеживается тенденция опережения технологических средств разработки интеллектуальных систем по отношению к их теоретическому обоснованию. Практически сейчас существует пропасть между математическими основами кибернетики (Виннер, Шеннон, Джордж, Йордан, Ляпунов) и современным поколением интеллектуальных систем, которые основаны на парадигме обработки знаний (ЭС, лингвистические процессоры, обучающие системы).

Иерархический подход традиционно используется при проектировании сложных систем как прием расчленения формально описанной системы на уровни (блоки, модули). На каждом уровне вводятся свои представления о системе и элементах, продвижение от уровня к уровню имеет строгую направленность (сверху вниз или снизу вверх).

Традиционные методологии структурирования:

· Структурный (системный) подход или анализ, основанный на идее алгоритмической декомпозиции, где каждый модуль выполняет этап общего процесса,

· Объектный подход, связанный с декомпозицией и выделением не процессов, а объектов, при этом каждый объект рассматривается как экземпляр определенного класса.

В структурном анализе разработано большое число средств проектирования: диаграммы потоков данных, структурированные словари (тезаурусы), таблицы решений, стрелочные диаграммы, деревья целей, блок-схемы алгоритмов, модели окружения.

Объектно-ориентированный подход основан на следующих элементарных понятиях: объекты, классы как объекты, классификации как средства упорядочения знаний, иерархии с наследованием свойств, средства ограничения доступа, методы для определения функций и отношений.

Объектно-структурный подход (ОСП) – обобщенный метод структурного анализа и формирования поля знаний.

Основные постулаты заимствованы из ООП и расширены:

1. Системность – взаимосвязь между понятиями,

2. Абстрагирование – выявление характеристик понятия, отличающих его от других,

3. Иерархия – упорядочивание системы абстракций,

4. Типизация – выделение классов понятий с частичным наследованием свойств,

5. Модульность – разбиение задачи на подзадачи,

6. Наглядность и простота нотации.


Сертификация знаний

Объектно-структурный анализ (ОСА) ПО подразумевает восемь страт или слоев:

Слой Знания Стратификация знаний (анализ)
S_1 Зачем Стратегический анализ: назначение и функции системы
S_2 Кто Организационный: коллектив разработчиков системы
S_3 Что Концептуальный: понятийная структура
S_4 Как Функциональный: гипотезы и модели принятия решений
S_5 Где Пространственный: окружение, оборудование, коммуникации
S_6 Когда Временной: временные параметры и ограничения
S_7 Почему Причинно-следственный: подсистема объяснений
S_8 Сколько   Экономический: ресурсы, затраты, прибыль, окупаемость

Алгоритм ОСА

Алгоритм ОСА предназначен для детального структурирования знаний ПО. Алгоритм содержит последовательность аналитических процедур и разделяется на две составляющие:

- Глобальный (вертикальный) анализ – разбиение ПО на страты,

- Анализ страт (горизонтальный) – построение многоуровневых структур по отдельным стратам.

Классификация методов практического извлечения знаний

Основной принцип деления связан с источником знаний.

Коммуникативные методы извлечения знаний охватывают методы и процедуры контактов инженера по знаниям с непосредственным источником знаний – экспертом, а текстологические включают методы извлечения знаний из документов (методик, пособий, руководств) и специальной литературы (учебников, статей, монографий).

В пассивных методах ведущая роль принадлежит эксперту, в активных методах инициатива полностью в руках инженера по знаниям.

Современное состояние автоматизированных систем приобретения знаний характеризуется наличием двух групп проблем: методологических и технологических.

Данные и знания

  Данные – это отдельные факты, характеризующие объекты, процессы и явления предметной области, а также их свойства. При обработке на ЭВМ данные трансформируются, условно проходя следующие этапы:

D1 – данные как результат измерений и наблюдений;

D2 – данные на материальных носителях информации (таблицы, протоколы, справочники);

D3 – модели (структуры) данных в виде диаграмм, графиков, функций;

D4 – данные в компьютере на языке описания данных;

D5 – базы данных на машинных носителях информации.

Знания основаны на данных, полученных эмпирическим путем. Они представляют собой результат мыслительной деятельности человека, направленной на обобщение его опыта, полученного в результате практической деятельности.

Знания – это закономерности предметной области (принципы, связи, законы), полученные в результате практической деятельности и профессионального опыта, позволяющие специалистам ставить и решать задачи в этой области.

При обработке на ЭВМ знания трансформируются аналогично данным:

Z1 – знания в памяти человека как результат мышления;

Z2 – материальные носители знаний (учебники);

Z3 – поле знаний – условное описание основных объектов предметной области, их атрибутов и закономерностей, их связывающих;

Z4 – знания, описанные на языках представления знаний (продукционные языки, семантические сети, фреймы);

Z5 – база знаний на машинных носителях информации.

Часто знания определяют как хорошо структурированные данные, или данные о данных, или метаданные. Существует множество способов определять понятия. Один из широко применяемых способов основан на идее интенсионала. Интенсионал понятия – это определение его через соотнесение с понятием более высокого уровня абстракции с указанием специфических свойств. Интенсионалы формулируют знания об объектах. Другой способ определяет понятие через соотнесение с понятиями более низкого уровня абстракции или перечисление фактов, относящихся к определяемому объекту. Это есть определение через данные, или экстенсионал понятия.

Для хранения данных используются базы данных (для них характерны большой объем и относительно небольшая удельная стоимость информации), для хранения знаний – базы знаний (небольшого объема, но исключительно дорогие информационные массивы). База знаний – основа любой интеллектуальной системы.

Знания могут быть классифицированы по следующим категориям:

Поверхностные – знания о видимых взаимосвязях между отдельными событиями и фактами в предметной области.

Глубинные – абстракции, аналогии, схемы, отображающие структуру и природу процессов, протекающих в предметной области. Эти знания объясняют явления и могут использоваться для прогнозирования поведения объектов.

Современные экспертные системы работают в основном с поверхностными знаниями.

Кроме того, знания традиционно делят на процедурные и декларативные. Первичными были процедурные знания, т.е. знания, растворенные в алгоритмах. Они управляли данными. Для их изменения требовалось изменять программы. С развитием искусственного интеллекта приоритет данных постепенно изменялся, и все большая часть знания сосредотачивалась в структурах данных (таблицы, списки, абстрактные типы данных), то есть увеличивалась роль декларативных знаний. Сегодня знания приобрели чисто декларативную форму, то есть знаниями считаются предложения, записанные на языках представления знаний, приближенных к естественному и понятных неспециалистам.

Поделиться:





Воспользуйтесь поиском по сайту:



©2015 - 2024 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...