Главная | Обратная связь | Поможем написать вашу работу!
МегаЛекции

Лингвистический аспект




 

Лингвистический (А2) аспект касается исследований языковых проблем, так как язык — это основное средство общения в процессе извлечения знаний. Сразу же следует оговорить, что поскольку тема данной книги ограничена изложением теории и технологии инженерии знаний, то область разработки естественно-языковых интерфейсов и весь спектр проблем, связанных с ней — лексических, синтаксических, семантических, прагматических и т. д. [Виноград, 1976; Мальковский, 1985; Попов, 1982], — не рассматривается.

В инженерии знаний можно выделить три слоя лингвистических проблем (рис. 3.11):

А2 = {S21, S22, S23} = («общий код», понятийная структура, словарь пользователя}.

Рис. 3.11. Лингвистический аспект извлечения знаний

«Общий код» (S21)

«Общий код» решает проблему языковых ножниц между профессиональной терминологией эксперта и обыденной литературной речью инженера по знаниям и включает следующие компоненты:

S21 = {s21_i} = {общенаучная терминология; специальные понятия из профессиональной литературы; элементы бытового языка; неологизмы, сформированные за время совместной работы; профессиональный жаргон и др.}.

Детализация схемы общения (см. рис. 3.8) на рис. 3.11 позволяет представить средства общения как два потока [Горелов, 1987], в которых нас интересуют компоненты V1 и V2 — языки, на которых говорят аналитик и эксперт (V1', V2' — невербальные компоненты). Различие языков V1 и V2 и обусловливает «языковый барьер» или «языковые ножницы» в общении инженера по знаниям и эксперта.

Эти два языка являются отражением «внутренней речи» эксперта и аналитика, поскольку большинство психологов и лингвистов считают, что язык — это основное средство мышления наряду с другими знаковыми системами «внутреннего пользования» (универсальный семантический код — УСК [Мартынов, 1977], языки «смысла» [Мельчук, 1974], концептуальные языки [Шенк, 1980] и др.).

Язык аналитика V1 состоит из трех компонентов:

• s21_l — общенаучной терминологии из его «теоретического багажа»;

• s21_2 — терминов предметной области, которые он почерпнул из специальной литературы в период подготовки;

• s21_3 — бытового разговорного языка, которым пользуется аналитик. Язык эксперта V2 включает:

• s21_l — общенаучную терминологию;

• s21_2 — специальную терминологию, принятую в предметной области;

• s21_3 — бытовой язык;

• s21_4 — неологизмы, созданные экспертом за время работы, то есть его профессиональный жаргон.

Если считать, что бытовой и общенаучный языки у двух участников общения примерно совпадают (хотя реально объем второго компонента у эксперта существенно больше), то некоторый общий язык или код, который необходимо выработать партнерам для успешного взаимодействия, будет складываться из потоков, представленных на рис. 3.12.

 

 

Рис. 3.12.Структура общего кода

 

В дальнейшем этот общий код преобразуется в некоторую понятийную (семантическую) сеть, которая является прообразом поля знаний предметной области.

Выработка общего кода начинается с выписыванием аналитиком всех терминов, употребляемых экспертом, и уточнения их смысла. Фактически это составление словаря предметной области. Затем следует группирование терминов и выбор синонимов (слов, означающих одно и то же). Разработка общего кода заканчивается составлением словаря терминов предметной области с предварительной группировкой их по смыслу, то есть по понятийной близости (это уже первый шаг структурирования знаний).

На этом этапе аналитик должен с большим вниманием отнестись ко всем специальным терминам, пытаясь максимально вникнуть в суть решаемых проблем и терминологию. Освоение аналитиком языка предметной области — первый рубеж на подступах к созданию адекватной базы знаний.

Рисунок 3.12 дает представление о процессе неоднозначности интерпретации терминов двумя специалистами. В семиотике, науке о знаковых системах, проблема интерпретации является одной из центральных. Интерпретация связывает «знак» и «означаемый предмет». Только в интерпретации знак получает смысл. Так, на рис. 3.13 слова «прибор X» для эксперта означает некоторую конкретную схему, которая соответствует схеме оригинала прибора, а в голове начинающего аналитика слова «прибор X» вызывают пустой образ или некоторый черный ящик с ручками.

 

 

Рис. 3.13.Неоднозначность интерпретации

 

Внимание к лингвистическому аспекту проблемы извлечения знаний способствует сближению образа 1 с образом 2 и интерпретации 11 с интерпретацией 12, а слова «прибор X» перейдут в действительно «общий» код.

Таким образом, слой S21 включает изучение и управление процессом разработки специального промежуточного языка, необходимого для взаимодействия инженера по знаниям и эксперта.

Поделиться:





Воспользуйтесь поиском по сайту:



©2015 - 2024 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...