Главная | Обратная связь
МегаЛекции

Знания и модели их представления




 

Для специалистов в области искусственного интеллекта термин «знания» означает информацию, которая необходима программе, чтобы она вела себя «интеллектуально».

Функционирование средств интеллектуального интерфейса опи­рается на развитые методы работы со знаниями: их представление, хранение, преобразование и т.п.

Под термином «знания» при этом понимается вся совокупность информации, необходимой для решения задачи, включающая в себя в том числе информацию о:

системе понятий предметной области, в которой решаются за­дачи;

системе понятий формальных моделей, на основе которых ре­шаются задачи;

соответствии систем понятий, упомянутых выше;

текущем состоянии предметной области;

методах решения задач.

При этом система знаний должна быть организована таким об­разом, чтобы обеспечить взаимодействие вычислительной системы с пользователем в системе понятий и терминов предметной области.

Что же такое знания и чем они отличаются отданных в системах машинной обработки?

Знания — это целостная и систематизированная совокупность понятий о закономерностях природы, общества и мышления, накопленных человечеством в процессе активной преобразующей произ­водственной деятельности и направленная на дальнейшее познание и изменение объективного мира.

Следовательно, интеллектуальная деятельность человека связа­на с поиском решений в новых, нестандартных ситуациях. Отсюда, задача называется интеллектуальной, если алгоритм ее решения ап­риори неизвестен. При этом задача и ее решение понимаются в са­мом широком смысле. Решение задачи — это любая деятельность (человека или машины), связанная с выработкой планов и действий, необходимых для достижения определенной цели; выводом новых закономерностей и т.п. Любая интеллектуальная деятельность опи­рается на знания о предметной области, в которой ставятся и реша­ются задачи. Предметной областью обычно называют совокупность взаимосвязанных сведений, необходимых и достаточных для решения данной задачи или определенной совокупности задач.

Знания о предметной области включают описания объектов, явлений, фактов, а также отношений между ними.

В общем виде знания в ЭВМ представляются некоторой семи­отической (знаковой) системой, в которой выделяются по аналогии сданными три аспекта: синтаксический, семантический и прагмати­ческий.

Синтаксис описывает внутреннее устройство знаковой системы, т.е. правила построения и преобразования сложных знаковых выра­жений. Для естественного языка синтаксис определяет правильное построение предложений и связанного текста.

Семантика определяет отношения между знаками и их свойствами (концептами), т.е. задает смысл или значения конкретных знаков.

Прагматика определяет знак с точки зрения конкретной сферы его применения либо субъекта, использующего данную знаковую систему.

В соответствии с перечисленными аспектами семиотических систем можно выделить три типа знаний: синтаксические, семанти­ческие и прагматические.

Синтаксические знания характеризуют синтаксическую структу­ру описываемого объекта или явления, которая не зависит от смысла и содержания используемых при этом понятий.

Семантические знания содержат информацию, непосредственно связанную со значениями и смыслом описываемых объектов и явле­ний.

Прагматические знания описывают объекты и явления с точки зрения решаемой задачи, например с учетом действующих в данной задаче специфических критериев.

Трем типам знаний соответствуют и три типа моделей для их представления: синтаксические, семантические и прагматические. Наличие двух последних является наиболее существенным призна­ком, отличающим интеллектуальные системы от всех других.

Прежде чем перейти к описанию моделей представления зна­ний, проанализируем особенности знаний, которые собственно и отличают их от данных.

1. Интерпретируемость. Данные, помещенные в ЭВМ, могут содержательно интерпретироваться лишь соответствующей програм­мой. В отрыве от нее данные не несут никакой содержательной ин­формации. Знания отличаются тем, что возможность содержатель­ной интерпретации всегда присутствует.

2. Структурированность или наличие классифицирующих отноше­ний. Несмотря на разнообразие форм хранения данных, ни одна из них не обеспечивает возможности компактного описания всех свя­зей между различными типами данных. Информационные единицы знаний должны обладать гибкой структурой, т.е. для них должен выполняться «принцип матрешки», т.е. такой вложимости, когда можно любую информационную единицу включить в состав другой и из каждой информационной единицы можно выделить некоторые ее составляющие. Это позволяет записывать и хранить отдельно информацию, одинаковую для всех элементов множества. При необ­ходимости эту информацию можно автоматически передать опи­санию любого элемента множества. Такой процесс называется «на­следованием» информации.

3. Наличие ситуативных связей или связность. Они определяют ситуативную совместимость отдельных событий или фактов, храни­мых или вводимых в память, а также такие отношения, как одновре­менность, расположение в одной области пространства, нахождение в состоянии механического или иного взаимодействия и т.п. Ситуа­тивные связи помогают строить процедуры анализа знаний на сов­местимость, противоречивость и другие, которые трудно реализовать при хранении традиционных массивов данных.

4. Семантическая метрика. На множестве информационных еди­ниц в некоторых случаях полезно задавать отношение, характеризу­ющее ситуационную близость информационных единиц, т.е. силу ассоциативной связи между ними. Это отношение можно назвать отношением релевантности для информационных единиц.

Такое отношение дает возможность выделять в информацион­ной базе некоторые типовые ситуации. Отношение релевантности при работе с информационными единицами дает возможность нахо­дить знания, близкие к уже найденным.

5. Активность. Все процессы, протекающие в ЭВМ, иницииру­ются командами, которые являются активной компонентой, а данные используются этими командами лишь при необходимости, т.е. последние - пассивная компонента. Такая ситуация, характерная для классических систем обработки информации, для интеллектуальных систем (ИС) неприемлема. По аналогии с человеком в ИС актуали­зации тех или иных действий способствуют знания, имеющиеся в системе. Таким образом, выполнение программ в ИС должно ини­циироваться текущим состоянием информационной базы. Появле­ние в базе фактов (объектов выбора) или описаний событий (квалификаторов и их значений), установление связей (правил в продукци­онных системах) может стать источником активности системы.

Особенности знаний, их назначение и структура, способы хра­нения и интерпретации вызывают определенные аналогии со спосо­бами организации человеческой памяти. Однако человеческая па­мять хранит не только числовые данные, но и образы или символы. Символьные образы в памяти человека объединены в так называе­мые чанки - наборы фактов и связей между ними, запоминаемые и извлекаемые как единое целое. В каждый момент времени человек может обрабатывать и интерпретировать не более 4 — 7 чанков. Спо­собность формировать чанки отличает эксперта в конкретной пред­метной области от неэксперта. Эксперт, в силу профессиональной необходимости, упорно развивает свою способность объединять в чанки большие объемы данных и устанавливать иерархические связи между ними (т.е. преобразовывать данные в знания) для того, чтобы быстро извлекать эти данные из памяти и с их помощью распозна­вать новые ситуации по мере поступления информации об этих си­туациях. Средний специалист в конкретной предметной области помнит от 50 000 до 100 000 чанков, которые могут быть использо­ваны для решения той или иной проблемы. Накопление в памяти .человека и построение указателей для такого объема данных требует от 10 до 20 лет.

Перечисленные особенности информационных единиц опре­деляют ту грань, за которой данные превращаются в знания, а базы данных перерастают в базы знаний. Однако в настоящее время не существует баз знаний, в которых комплексно, в полной мере были бы реализованы внутренняя интерпретируемость, струк­туризация, связность, введена семантическая мера и обеспечена активность знаний. Все это предопределяет многообразие моде­лей представления данных, используемых в интеллектуальных си­стемах, хотя некоторые из них являются производными из суще­ствующих.

 





©2015- 2017 megalektsii.ru Права всех материалов защищены законодательством РФ.