Автоматический морфологический анализ
Стр 1 из 3Следующая ⇒ Понятие лингвистического алгоритма Дескриптивная терминография Массовая коммуникация — новый этап семиозиса Массовая коммуникация —совокупное действие всех классов семиотических систем путём координации их смысла при построении текстов. Массовая коммуникация делится на массовую информацию, информатику и новую рекламу. Массовая информация — совокупное действие массовой периодической прессы, кино, радио, телевидения. Действует как текст, работа которого построена на разделении труда. Финансирующие организации определяют направление информирования, а информационные агентства поставляют материал. У массовой информации есть три характеристики: истинность (сообщения на основе проверенных фактов), оперативность (быстрота сообщения) и правдивость (выбор и компоновка фактов, которые определяются смысловой направленностью) Массовая информация составляет постоянный семиотический фон, на котором развёртывается психическая жизнь людей. Новости подаются в виде коллажей: слова, музыка, видео. Населению подаются материалы для ориентирования на каждый день. Создаётся возможность массового управления. Массовая информация — недиалогический текст. От создателя к получателю. Стратегию информирования невозможно описать логически: только специальными аналитическими средствами. Контент-анализ — анализ содержания с помощью статистических средств Понимаемости текстов массовой коммуникации обеспечивается специальным обучением «символическому зонтику» — это набор слов, имеющий символическое оценочное значение. Символы не обсуждаются, а закореняются в сознании за счёт воспроизведения массовой информации. Стратегия информирования постоянно эволюционирует, т.к. происходит надоедание.
Массовая информация адресована только данному времени, но оказывает влияние на стиль и методы образования. Массовая культура — система развлечений, которая основана на смене стилей и содержания стратегий массовой информации. Массовая культура использует неприкладные искусства: музыку, танцы, пантомиму, все вижу изобразительного искусства. Информатика — научно-техническое информирование. Новая реклама — появляется во время образования городов и ремёсел. С развитием печати появляется печатаная реклама. Появляется массовая информация — начинается распространение рекламы через СМИ. Цель рекламы: внушить потребителю приобрести вещь или воспользоваться услугой. Влияние достигается анализом и использованием тех психических особенностей, которые составляют предсознание человека. Предсознание — такая психическая деятельность, которая приводит к поступкам независимо от их рационального осмысления. Исследования по зоопсихологии выявили: 1) Рациональное поведение — обученность отдельного животного избегать неприятных ситуаций и стремиться к благоприятным. 2) Сознательное поведение — решение новой задачи в новой ситуации 3) Тропизм — стремление попасть в более подходящую среду обитания 4) Таксис — свойство к контакту друг с другом 5) Безусловный рефлекс — присутствует у тех, у кого есть нервная система 6) Условный рефлекс — поведение, полученное из индивидуального опыта 7) Инстинкт — врождённая сложная программа поведения
Прескриптивная терминография Естественный язык и подъязыки Характер генеральной совокупности Необходимой частью математической статистики является составления репрезентативной выборки на основе принципа случайности, в которой всем единицам генеральной совокупности даётся возможность попасть в выборку. Характер генеральной совокупности определяет выполнение принципа случайности.
Генеральная совокупность бывает: статистически однородна (на разных участках действует один и тот же комплекс системных факторов) и неоднородна (комплекс факторов не постоянен). По объёму генеральные совокупности бывают: конечные (практически обозримый отрезок речи) и бесконечные. Если генеральная совокупность бесконечна, то применение статистических методов ограничено. Надо убедиться в однородности совокупности. Выборка в таком случае осуществляется на основе фрагмента бесконечной совокупности. Роль статистических исследований в речи Автоматический морфологический анализ Автоматический морфологический анализ — анализ форм слов. Первый этап автоматической обработки текстов. В него входят операции, позволяющие из формы слова получить максимальную информацию о роли слова в предложении. Для этого анализа нет разницы между словоизменением и словообразованием. Анализ исходит из классификации форм слов по частям речи и определённому набору синтаксических функций. Виды автоматического морфологического анализа: 1) Морфологический анализ со словарём основ — наиболее распространённый 2) Морфологический анализ со словарём словоформ. Словарь словоформ включает в себя все формы слов, которые имеют место в данном наборе текстов. Но! Возникает проблема определения части речи новых слов. Словари словоформ снабжают списком определяющих морфем, чтобы решить вопрос о частеречной принадлежности. 3) Морфологический анализ методом логического умножения 4) Морфологический анализ с помощью таблиц Наибольшее значение автоматический морфологический анализ имеет для языков флективного типа. На этом этапе выделяются также фразеологические сочетания. В основу метода морфологического анализа методом логического умножения положены положения формальной морфологии. Вводится понятие словарной функции – функции, определенной на словоформах, и сопоставляющей им некоторую информацию (последовательность нулей и единиц).
Морфологический анализ без словарей также называется независимым анализом. Он проводится без использования словарей лишь с использованием таблицы аффиксов, списка слов-исключений и списка служебных неизменяемых слов (например, союзов, междометий, предлогов). Этот способ используется достаточно редко.
Воспользуйтесь поиском по сайту: ©2015 - 2024 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...
|