Главная | Обратная связь | Поможем написать вашу работу!
МегаЛекции

Термин – лексическое средство описания предметной области.

Термин в качестве ЛС – как особая подсистема языка. Использование терминов позволяет:

конкретно выделить и очертить границы;

отслеживать развитие конкретного знания в конкретной области;

показывает динамику развития знания;

очертить структуру научного знания;

выделить связи и все интегрированные процессы в структуре научного знания.

Применение терминого анализа показывает вклад отдельных ученых / отдельных стран в развитии конкретной научной проблеме.  

Терминальный анализ используется при составлении словарей и обеспечении доступа к информационным ресурсам.

Методика Т.А. опирается на приемы прикладной лингвистики:

4. Конкретные термины отражают определенную предметную область - семантическое пространство (вся отрасль знания);

5. Семантические поля – отдельные разделы, подразделы;

6. Класс условной эквивалентности – анализ основных слов/сочетаний, встречающихся в тексте, а также в установлении родовидовых связей между отдельными терминами - т.е. устанавливаются и устраняются синонимы, определение классов слов, которые определяются как дескрипторы.

Самые сложные процедуры:

установление родовидовых отношений;

 - установление ключевых слов.

В зарубежной практике: сбор и анализ профессиональной лексики использованных систем. Чем тщательнее анализ профессиональной лексики, тем меньше «шума».

Информационно-поисковый тезаурус.

При разработке ИПТ применяется ГОСТ 7.25-80 «Тезаурус информационно-поисковый одноязычный», ГОСТ 7.14-80 «-/- многоязычный». ИПТ представляет собой обычный словарь слов/сочетаний – отраслевой словарь. Тезаурус от лат. – хранилище, клад.

13 в. – составление книг о сокровищах.

17-18 вв. – словари-справочники при составлении служебных дисциплин.

1950 гг. С развитием машинного перевода (совр. тезаурус).

Тезаурус имеет узко прикладное назначение – обработка информационных запросов.*, информатика – Шрейдер, Гольштейн, Брониславский.

Методика составления тезаурусов:

1. предметная выборка всех ключевых слов конкретной предметной области;

2. определение всех взаимосвязей между отдельными терминами.

Сама предметная область м.б. задана как аксиома (область естественных знаний: математика, химия, физика).

3. уточнение предметной области;

4. анализ всего массива документов (насколько точна предметная область);

5. разработка всех взаимосвязей;

6. весь набор терминов на экспертизу спецов-аналитиков для которых разрабатывается тезаурус.

Вся стадия разработки ИПТ выполняется совместными усилиями спецов различных профессий: спец. ПК, спец. конкретной области.

Требования при разработке тезауруса:

1. массив документов д.б. достаточно однородным;

2. ограниченное число авторов (устранение разнобоя профессиональной лексики);

3. весь массив документов д.б. в машиночитаемом формате.

Классификаторы. Языки формализованного описания данных.

Классификаторы – нормативные документы, которые содержат систематический перечень объектов и присвоенные им коды. Классификации и кодированию принадлежат все социальные и экономические объекты. Информация, содержащаяся в этих классификаторах технико-экономическая и социальная информация, служит для информационного обеспечения в следующих областях:

экономика;

статистика;

таможенное дело.

Разработано свыше 37 классификаторов, но еще применяются общесоюзные.

Основная цель разработки классификаторов связана с реализацией государственной программы перехода России на международные системы (учета, статистики). Данная программа была принята в 1992 г. Классификаторы оформляются в виде альбомов и есть машиночитаемый вариант. Свод всех классификаторов, а также нормативно-методические документы, составляют классификации и кодирования информации.

Основные задачи:

1) упорядочение и унификация технико-экономической и социальной информации;

2) обеспечение однозначности и сопоставимости данных;

3) создание условий для автоматизированной обработки данных;

4) создание банков данных классификаторов, применяемых на территории конкретной страны, а также международных делах.

Все классификаторы делятся на 3 группы:

1) классификаторы информации об управленческой документации, видах деятельности экономических и социальных показателей;

2) объединяет классификаторы информации об организационных словарях;

3) классификаторы информации о населении и кадрами.

Каждый классификатор имеет свое условное обозначение.

Функциональная стркутура ИПС.

Представляется в виде абстрактной кибернитической машиты. Котора состит из следующих узлов:

1) Устройство ввода.

 Ввод сообщения, ввод запроса, индекстное описание текста - ПОД(поисковый образ документа).

2) Запоминающее устройство.

Активное хранилище - представляет собой совокупность поисковых образов сообщения.

Пассивное хранилище - в нем находится сами сообщения.

3) Решаущее устроиство.

Определение аресов сообщения. Главный исполнитель органа ИПС.

4) Устройство вывода.

получает адрес сообщения из решающего устройства, обеспечивает поиск в пасивном хранилищи и выводит их потребителю.

5) Устройство управления- обеспечивает последовательность методов поиска.

Классификация ИПС.

При подходе к классификации ИПС исходит из требований пользователей к качеству функционирования системы, т.е. к ее способности выбирать из информационно-поискового массива требуемую информацию с достаточной полнотой, точностью и оперативностью.

Основными признаками, характеризующими ИПС с точки зрения удовлетворения требований пользователей, являются:

тематика комплектования информационно-поискового массива;

вид выполняемого информационного поиска (объект поиска и вид выдаваемой информации);

режим функционирования;

схемы размещения информацонно-поискового и документного массива:

вид выполняемого информационного поиска.

По тематике комплектования ИПС делится на отраслевые, многоотраслевые (политематические) и узкотематические.

Отраслевые ИПС создаются, как правило, центральными отраслевыми органами НТИ в соответствии с закрепленными за ними тематикой. На базе отраслевых ИПС осуществляется информационное обслуживание руководящих работников и ведущих специалистов отрасли.

Многоотраслевые ИПС создаются в региональных органах НТИ (республиканских институтах информации, институтах информации автономных республик, областей) и межотраслевых территориальных органах НТИ. Осуществляет информационное обслуживание специалистов соответствующего региона.

Узкотематические ИПС содержатся в местных (локальных) службах информации (на предприятии, в организациях) для обеспечения информацией ученых и специалистов данной организации. Тематика информационного массива соответствует тематике их работы.

По виду и объекту информационного поиска ИПС делятся на:

документальные;

фактографические.

Документальные ИПС предназначены для поиска документов, содержащих запрашиваемую информацию в ответ на информационный запрос в зависимости от цели поиска документальные ИПС выдают либо библиографические описания документов, либо только адрес искомого документа, определяющий его местонахождение в хранилище.

Характерной особенностью всех документальных ИПС является то, что извлечение нужной информации из документа, найденного ИПС, осуществляет см потребитель.

Фактографические ИПС предназначены для поиска конкретных фактов, сведений, данных в ответ на информационные (фактографические) запросы без обращения потребителя к документам, в которых они содержатся. В фактографических ИПС единицами информации являются реквизиты (признаки и их значения). Реквизиты отражают определенные научные, технические, экономические свойства объектов, процессов, явлений и представляют собой логически неделимые элементы любой сложности.

Для исчерпывающего описания объектов, процессов необходима некоторая совокупность признаков, описывающих их качественные и количественные свойства. Совокупность признаков называется сообщением об объекте. Каждое сообщение имеет свою определенную форму. Формы сообщений, объединяясь во множества, позволяют полностью описывать объект.

Промежуточное положение занимают документально-фактографические ИПС, результатом поиска в которых является запрашиваемые факты, сведения, данные со ссылкой на документ, в котором они зафиксированы. Различие между документальными и фактографическими ИПС – объект поиска.

По режиму функционирования ИПС делятся на системы, работающие в режиме избирательного распространения информации и в режиме ретроспективного поиска информации.

Избирательным распределением информации (ИРИ) называется такой режим работы ИПС, при котором информационный поиск проводится по постоянным запросам определенного контингента абонентов в массиве текущих поступлений документов через установленные промежутки времени (обычно 1 раз в неделю, 1 раз в 2 недели). Для оптимизации работы ИПС между абонентами и системой устанавливается и постоянно поддерживается обратная связь. При этом ПОД сравнивается с хранящимися в ЗУ системы, постоянными запросами абонентов (постоянным является массив запросов).

Ретроспективным поиском (РП) информации называется такой режим работы ИПС, при котором по разовым запросам специалистов осуществляется поиск сведений о документах (или копий документов). Фактов, сведений, данных в накопленном за определенный период в информационном массиве. Такой поиск - режим «запрос-ответ» (постоянный массив документов).

По схеме размещения информационно-поискового и документального массивов ИПС делятся на одноконтурные и 2-ухконтурные. В одноконтурных ИПС информационно-поисковые и документальные массивы объединены в один массив, в котором на одном и том же носителе информации совмещаются записи ПОД с записью текстов самих документов. В качестве носителей информации применяются различные типы перфокарт ручной сортировки, микрокарты, микроафиши и др., на которых имеются поисковые и текстовые поля.

В 2-хконтурных ИПС информационный массив и массив документов разделены и составляют первый и второй контуры системы. В первом контуре осуществляется информационный поиск по ПОДу с целью нахождения адреса документа, хранящегося во втором контуре ИПС. Двухконтурными проектируются АИПС.

В автоматизированных ИПС для поиска информации реализуется на ЭВМ. Запись и хранение информации осуществляется на машиночитаемых носителях: магнитных лентах, магнитных дисках, магнитных барабанах. АИПС получили широкое распространение в отраслевых, региональных информационных центрах. Применение ЭВМ позволяет автоматизировать не только процесс поиска, но и процессы ввода, пополнения, хранения и выдачи информации.

Виды обеспечения АИПС.

Поделиться:





Воспользуйтесь поиском по сайту:



©2015 - 2024 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...