Главная | Обратная связь | Поможем написать вашу работу!
МегаЛекции

Автоматический морфологический анализ




Понятие лингвистического алгоритма

Дескриптивная терминография

Массовая коммуникация — новый этап семиозиса

Массовая коммуникация —совокупное действие всех классов семиотических систем путём координации их смысла при построении текстов.

Массовая коммуникация делится на массовую информацию, информатику и новую рекламу. Массовая информация — совокупное действие массовой периодической прессы, кино, радио, телевидения. Действует как текст, работа которого построена на разделении труда. Финансирующие организации определяют направление информирования, а информационные агентства поставляют материал.

У массовой информации есть три характеристики: истинность (сообщения на основе проверенных фактов), оперативность (быстрота сообщения) и правдивость (выбор и компоновка фактов, которые определяются смысловой направленностью)

Массовая информация составляет постоянный семиотический фон, на котором развёртывается психическая жизнь людей. Новости подаются в виде коллажей: слова, музыка, видео. Населению подаются материалы для ориентирования на каждый день. Создаётся возможность массового управления. Массовая информация — недиалогический текст. От создателя к получателю.

Стратегию информирования невозможно описать логически: только специальными аналитическими средствами. Контент-анализ — анализ содержания с помощью статистических средств

Понимаемости текстов массовой коммуникации обеспечивается специальным обучением «символическому зонтику» — это набор слов, имеющий символическое оценочное значение. Символы не обсуждаются, а закореняются в сознании за счёт воспроизведения массовой информации. Стратегия информирования постоянно эволюционирует, т.к. происходит надоедание.

Массовая информация адресована только данному времени, но оказывает влияние на стиль и методы образования.

Массовая культура — система развлечений, которая основана на смене стилей и содержания стратегий массовой информации. Массовая культура использует неприкладные искусства: музыку, танцы, пантомиму, все вижу изобразительного искусства.

Информатика — научно-техническое информирование.

Новая реклама — появляется во время образования городов и ремёсел. С развитием печати появляется печатаная реклама. Появляется массовая информация — начинается распространение рекламы через СМИ.

Цель рекламы: внушить потребителю приобрести вещь или воспользоваться услугой. Влияние достигается анализом и использованием тех психических особенностей, которые составляют предсознание человека. Предсознание — такая психическая деятельность, которая приводит к поступкам независимо от их рационального осмысления.

Исследования по зоопсихологии выявили:

1) Рациональное поведение — обученность отдельного животного избегать неприятных ситуаций и стремиться к благоприятным.

2) Сознательное поведение — решение новой задачи в новой ситуации

3) Тропизм — стремление попасть в более подходящую среду обитания

4) Таксис — свойство к контакту друг с другом

5) Безусловный рефлекс — присутствует у тех, у кого есть нервная система

6) Условный рефлекс — поведение, полученное из индивидуального опыта

7) Инстинкт — врождённая сложная программа поведения

 

Прескриптивная терминография

Естественный язык и подъязыки

Характер генеральной совокупности

Необходимой частью математической статистики является составления репрезентативной выборки на основе принципа случайности, в которой всем единицам генеральной совокупности даётся возможность попасть в выборку. Характер генеральной совокупности определяет выполнение принципа случайности.

Генеральная совокупность бывает: статистически однородна (на разных участках действует один и тот же комплекс системных факторов) и неоднородна (комплекс факторов не постоянен).

По объёму генеральные совокупности бывают: конечные (практически обозримый отрезок речи) и бесконечные.

Если генеральная совокупность бесконечна, то применение статистических методов ограничено. Надо убедиться в однородности совокупности. Выборка в таком случае осуществляется на основе фрагмента бесконечной совокупности.

Роль статистических исследований в речи

Автоматический морфологический анализ

Автоматический морфологический анализ — анализ форм слов. Первый этап автоматической обработки текстов. В него входят операции, позволяющие из формы слова получить максимальную информацию о роли слова в предложении. Для этого анализа нет разницы между словоизменением и словообразованием. Анализ исходит из классификации форм слов по частям речи и определённому набору синтаксических функций.

Виды автоматического морфологического анализа:

1) Морфологический анализ со словарём основ — наиболее распространённый

2) Морфологический анализ со словарём словоформ. Словарь словоформ включает в себя все формы слов, которые имеют место в данном наборе текстов. Но! Возникает проблема определения части речи новых слов. Словари словоформ снабжают списком определяющих морфем, чтобы решить вопрос о частеречной принадлежности.

3) Морфологический анализ методом логического умножения

4) Морфологический анализ с помощью таблиц

Наибольшее значение автоматический морфологический анализ имеет для языков флективного типа. На этом этапе выделяются также фразеологические сочетания.

В основу метода морфологического анализа методом логического умножения положены положения формальной морфологии. Вводится понятие словарной функции – функции, определенной на словоформах, и сопоставляющей им некоторую информацию (последовательность нулей и единиц).
На предварительном этапе строится таблица в которой каждой возможной букве изменяемой части (с учетом позиции в этой самой изменяемой части) ставится в соответствие вектор нулей и единиц. Каждая из позиций такого вектора соответствует определенной комбинации грамматических признаков. Единица означает, что данная буква в данной позиции может соответствовать этой комбинации грамматических признаков, ноль – что не может.
На первом этапе этот метод также предполагает членение словоформы на основу и изменяемую часть. Далее по предварительно созданной таблице векторов каждой букве изменяемой части подбирается вектор. Далее над векторами производится операция логического умножения. Таким образом определяется возможная (возможные) комбинация (-ии) грамматических признаков.

Морфологический анализ без словарей также называется независимым анализом. Он проводится без использования словарей лишь с использованием таблицы аффиксов, списка слов-исключений и списка служебных неизменяемых слов (например, союзов, междометий, предлогов). Этот способ используется достаточно редко.

 

Поделиться:





Воспользуйтесь поиском по сайту:



©2015 - 2024 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...