Глава II. Методика исследования и основные результаты
Стр 1 из 2Следующая ⇒ Перечень условных обозначений ИТ – информационные технологии ФЭБ – Фундаментальная электронная библиотека ЭНИ – электронное научное издание ЮНЕСКО – Организация Объединенных Наций по вопросам образования, науки и культуры WWW – World Wide Web (Мировая Паутина) Реферат на тему «Применение IT в исследовании творчества Леонида Андреева» Введение XX век является беспрецедентным этапом в развитии человеческой культуры. За каких-то сто лет – очень незначительный отрезок времени в масштабах истории – наука коренным образом поменяла нашу жизнь. Революция, произошедшая в сознании человека, повлекла за собой необратимые последствия: мировидение и миропонимание изменились, фундаментальные понятия, такие как пространство и время, жизнь и смерть, Бог и человек наполнились новым содержанием. Как отмечает академик К.В. Вигурский, «развитие и широкое внедрение информационных технологий воздействует на все сферы современной жизни, включая экономику, политику, науку и образование» [2, 9]. Очевидно, что именно информационные технологии (ИТ) представляют собой авангард современного общества, несут в себе наиболее прогрессивные и перспективные идеи и в известной степени позволяют представить, какой будет жизнь в будущем. В специальной литературе тот тип общества, который в настоящее время функционирует в развитых странах, носит название постиндустриального, постэкономического или информационного. В таких обществах информация представляется в новых формах, которые «принципиально отличаются от традиционной печатной формы и основываются на разнообразных технологиях создания, переработки и использования информации» [5, 159]. Важнейшая роль ИТ признана повсеместно, например, в программе ЮНЕСКО «Информация для всех» (1997), развитие ИТ постулируется в качестве приоритетного направления в развитии любого современного общества.
По результатам исследования, проведенного О. Финько, можно судить об интенсивном росте количества информации на постсоветском пространстве: например, в России «только официально зарегистрированные базы данных содержат больший объем информации, нежели тот, что хранится в Российской государственной библиотеке» [9, 13]. «Филологи, – указывает К. Вигурский, – преимущественно лингвисты, но также стиховеды и литературоведы – одними из первых начали применять в своей работе вычислительную технику» [2, 10]. Исследования по машинному переводу, ведущиеся с 1950-х годов, разработка алгоритмов морфологического анализа лексики, которые стали прообразом современных поисковых систем, могут послужить подтверждением пристального и давнего внимания филологов к ИТ. Однако нельзя не согласиться с тем, что ИТ не получили широкого распространения и все еще остаются непривычным инструментом в руках филолога. Профильные Интернет-ресурсы, посвященные лингвистическим и литературоведческим исследованиям, можно считать плодотворным результатом взаимодействия филологии и ИТ. Сюда относятся все ресурсы, которые могут быть полезны филологам. И.А. Пильщиков отмечает, что к такой информации могут относиться «коллекции текстов, биографические материалы, результаты научных исследований, библиографическая информация, электронные версии профильных журналов» [2, 15]. Сравнение текстов и групп текстов по заданным параметрам является одной из специальных задач, которые стоят перед филологией и могут быть разрешены с помощью ИТ. М. Гаспаров еще в 1988 году в статье «Художественный мир писателя: тезаурус формальный и тезаурус функциональный» предложил принципиально новый метод анализа художественных текстов. Он заключался в сортировке слов, относящихся к одному грамматическому классу, по ассоциативным семантическим полям. Тем самым достигалась объективность результатов исследования, степень которой приближалась к объективности точных наук. Однако только с появлением и широким распространением ИТ подобный метод анализа стал эффективным и доступным большинству исследователей-филологов.
Таким образом, опираясь на все вышесказанное, можно определить цель настоящей работы, а именно: выяснить, как ИТ могут помочь в исследовании творчества Л. Андреева и действительно ли можно утверждать, что ИТ раскрывают недоступные ранее пути исследования художественного текста. Для достижения поставленной цели решались следующие задачи: 1. Познакомиться с литературой, посвященной взаимодействию ИТ и филологии. 2. Определить методы исследования художественных текстов Л. Андреева, которые базируются на ИТ, и оценить эффективность этих методов, проверив их на практике. Глава I. Обзор литературы Если содержание понятия «литературоведение» представляется достаточно традиционным, и дискуссии на эту тему закончились уже давно, то понятие «информационные технологии» и «информационные ресурсы» находятся в центре многочисленных споров, являются местом пересечения различных точек зрения на проблему. Ю. Данилевский и И. Петухов указывают на то, что «в основе этих понятий лежит представление о технологии как о целенаправленном процессе, которых характеризуется единством объекта и специфичностью методов и способов его обработки, благодаря которым происходит качественное изменение объекта» [6, 51]. Таким образом, конечной целью информационных технологий является удовлетворение потребности человека или технической системы в определенном типе информации. В 1996 году на II Международном конгрессе ЮНЕСКО «Образование и информатика» к ИТ были отнесены следующие технологии: «ввода/вывода, сбора, хранения, передачи и обработки данных; подготовка текстовых и графических документов, технической документации; интеграция и коллективное пользование разнородными информационными ресурсами» [1, 10].
Однако есть другие подходы к определению ИТ. Так, рабочая группа Экспертного совета по ИТ при Администрации Президента РФ предложила более широкую трактовку этого понятия. Было предложено включить в состав ИТ «все технологии, которые в совокупности обеспечивают процессы подготовки, переработки и доставки информации, в частности, технологии микроэлектроники, разработку и производство компьютеров, телефонию и т.д.» [2, 15] Терминологическая путаница, возникающая в отношении новых, еще не устоявшихся понятий, влечет за собой пагубные последствия как для науки в частности, так и для общества в целом. Мы полностью согласны с утверждением академика К. Вигурского о том, что «главный предмет филологии – тексты (со всеми их вербальными и, возможно, невербальными компонентами), и большая часть накапливаемых электронных информационных ресурсов представляет собой наборы текстов» [1, 11]. Е. Горный в статье «Интернет и филология» указывает на то, что большинство гуманитариев по-прежнему с опаской относятся к компьютерам, считая их частью инструментария естественников. Конечно, такой подход замедляет развитие ИТ в области филологии, потому что трудно ожидать от программиста создания программного обеспечения, в основе которого, например, положен принцип семантической дифференциации художественного текса. Оптимальный путь решения описанных выше проблем лежит через создание специализированных полнотекстовых информационных систем. Общие требования к таким системам следующие: «система должна подчиняться ясно сформулированной концепции, в которой отражаются цели и задачи системы, круг ее потенциальных потребителей и способ распространения информации; наличие научной редакторской работы и вспомогательного справочного аппарата, упрощающего доступ к информации» [2, 13]. Академик Вигурский подчеркивает, что «наиболее интенсивно развивающейся разновидностью полнотекстовых информационных систем являются электронные издания и библиотеки» [1, 13]. Создание Фундаментальной электронной библиотеки (ФЭБ) «Русская литература и фольклор», предпринятое РАН и Минсвязи России, – это попытка реализовать сформулированные выше требования. Об особенностях работы в этой системе мы поговорим в следующей главе.
Как отмечалось во введении, литературоведение и ИТ имеют длительную историю взаимоотношений. Такие направления исследовательской деятельности как синтаксический и семантический анализ текстов, создание автоматических средств разметки стихотворных текстов и др. указывают на то, что уже в середине XX века использование ИТ в филологии считалось перспективным направлением. В качестве примера может выступить теория Михаила Гаспарова. Исследователь отмечает, что художественный мир текста представляет собой совокупность образов и мотивов, в нем представленных. Следовательно, поскольку каждое существительное (с определяющими его прилагательными) потенциально является образом, а каждый глагол (с определяющими его наречиями) – мотивом, то «описью художественного мира оказывается полный словарь знаменательных слов соответственного текста» [3, 125]. И далее: «Чтобы эта совокупность образов стала системой образов, а опись художественного мира превратилась в описание художественного мира, она требует количественного и структурного упорядочения» [3, 126]. Гаспаров подчеркивает, что такой словарь должен быть частотным, а также должен быть построен по принципу тезауруса. Таким образом, на языке науки именно частотный тезаурус языка писателя (или произведения, или группы произведений) можно назвать художественным миром. Очевидно, что такая работа может быть проделана быстрее и качественнее с помощью ИТ. Преимущество этого метода заключается в высоком уровне объективности при анализе художественного текста. В настоящее время можно заметить следующую тенденцию: если сравнить языковедческие и литературоведческие тексты начала XX и XXI веков, можно отметить, что тексты начала XX века опираются на мощный эмпирический фундамент, и, несмотря на наличие выводов и обобщений, являются по преимуществу дескриптивными. Современные филологические тексты носят спекулятивный характер. Такая закономерность, конечно, не случайна. Сегодня, когда границы между дисциплинами размываются, когда непреодолимый барьер между естественными и гуманитарными науками больше не считается таковым, когда для дальнейшего развития человеческого знания необходим новый взгляд на науку, особое значение получают такие синтетические методы исследований, как, например, метод, предложенный М. Гаспаровым.
Труды В. Иноземцева, О. Финько, Ю. Данилевского, И. Петухова, а также академиков К. Вигурского и И. Пильщикова дают общее представление о том, как ИТ могут быть использованы сегодня в интересах филологической практики. Во-первых, создание электронного фонда русской/белорусской словесности, обеспечивающего надежное хранение и эффективное использование культурно значимых произведений литературы и фольклора. Во-вторых, создание электронного словарно-справочного фонда, дающего свободный доступ к словарям, справочникам, энциклопедиям и указателям, необходимым для проведения филологических исследований. В-третьих, создание свободного электронного каталога сетевых информационных ресурсов филологического профиля. Безусловно, спектр работ в этой области не исчерпывается этими направлениями. Работы ведутся в разных направлениях, однако во всем многообразии исследовательских программ, во всяком случае, в русскоязычном секторе Интернета нет ни одной работы, посвященной применению ИТ в исследовании творчества Л. Андреева. Таким образом, наша работа является первым шагом в этом направлении. Подведем предварительный итог. Во-первых, важнейшая роль информационных технологий в развитии постиндустриального общества признана повсеместно. Во-вторых, ИТ могут быть использованы в филологической практике для ускорения, облегчения и повышения объективности исследовательской деятельности, для сохранения и передачи культурно значимой информации. Глава II. Методика исследования и основные результаты Потенциал ИТ действительно заставляет задуматься о том, что филолог, работающий по старинке, лишает себя мощных и эффективных инструментов, позволяющих получить результат в кратчайшие сроки. В этой главе я расскажу о том, как ИТ помогают мне в моей работе. Речь пойдет о двух направлениях исследовательской деятельности: во-первых, составление формального тезауруса по методу М. Гаспарова с помощью поисковых возможностей Фундаментальной электронной библиотеки (ФЭБ); во-вторых, поиск информации о Леониде Андрееве с помощью поисковых машин, а также на специализированных, в том числе мемориальных сайтах. Как отмечают создатели ФЭБ, к особенностям данного ресурса можно отнести «точность представления и описания информации, системность формирования, развитые средства навигации и поиска» [10]. В основе тематических разделов ФЭБ, посвященных четырем хронологическим периодам русской литературы и фольклору, лежат электронные научные издания (ЭНИ). Каждое ЭНИ связано с какой-либо одной темой: для фольклора это определенный жанр, для древнерусской литературы – конкретный памятник словесности, для литературы нового времени – творчество отдельного писателя. Все ЭНИ содержат однотипные рубрики, в которых размещаются энциклопедические сведения, тексты произведений, исследовательская литература, летописи жизни и творчества, библиография, именные и прочие указатели. Для информационных поисков используется поисковая машина компании "Яндекс", модифицированная в соответствии с нуждами ФЭБ (так, в Библиотеке возможен лексический поиск по русским текстам в дореформенной орфографии). Особое место в ФЭБ занимает каталог сетевых ресурсов, который содержит более 300 гиперссылок на отечественные и зарубежные электронные библиотеки русской литературы и сетевые информационные ресурсы по русской филологии и фольклору, и в том числе более 50 ссылок на персональные (мемориальные) web-страницы, посвященные жизни и творчеству русских писателей. Вся информация, включаемая в каталог, тщательно отбирается и проверяется. Каталог регулярно пополняется; периодически проводится актуализация всех ссылок. Моя магистерская диссертация посвящена литературному апокрифу как художественному методу в творчестве Л. Андреева. Очевидно, что для подкрепления моих тезисов мне необходимо построить наглядную модель художественного мира писателя, т.е. составить формальный и функциональный тезаурусы его текстов. Одной из возможностей, предоставляемой ФЭБ, является полнотекстовый поиск. С его помощью можно легко найти все документы, содержащие определенное слово, словосочетание или отдельную словоформу. Найденные слова маркируются, и пользователь получает к ним прямой доступ. Благодаря этим средствам предельно ускоряется нахождение нужных цитат, легко получить данные, отражающие частотность словоупотребления. По точности и глубине поиска этот эффективный инструмент превосходит все существующие печатные словари и конкордансы. Например, мне необходимо было определить, какие слова и словоформы входят в семантическое поле «религия». При этом для меня была важна частотность словоупотребления, т.к. чем выше частотность, тем важнее слово для автора, тем большую функциональную и концептуальную нагрузку оно несет на себе. Открывая любой текст, я находил подходящие слова, например, вера, ангел, Бог, Иов, Сатана, затем пользовался полнотекстовым поиском на ФЭБ и получал необходимую информацию для ранжирования релевантных слов в семантическом поле. Однако не стоит переоценивать возможности ИТ, поскольку даже сегодня существует множество операций, которые может осуществить только человек. Это касается и взаимоотношений филологии с ИТ. М. Гаспаров указывает на опасность, которая может стать причиной получения ошибочных результатов исследований. Что же имеется в виду? Многозначность и метафоричность слова поисковой системой не учитывается, поэтому если слово день употреблено в контекстах ясный день, минувшие дни и а из стекла того <волшебного зеркала> струился день, то очевидно, что только человек может распределить полученные слова правильно: первое употребление попадет в рубрику «неживая природа: атмосфера», второе – «общие понятия: время», а третье – «общие понятия: зримость». Адекватное распознавание компьютерными программами семантического компонента текста – актуальный вопрос современной науки. Теперь следует сказать о различных информационных и коммуникационных ресурсах Интернета, которые могут быть использованы в исследовании творчества Л. Андреева. В основном к этим ресурсам относятся каталоги ресурсов (глобальные, локальные, специализированные) и поисковые машины, или автоматические индексы. Поисковая система представляет собой веб-сайт, с помощью которого можно искать информацию в Интернете. По данным исследования, проведенного компанией Net Applicants в декабре 2007 года, безусловным лидером среди поисковых систем является Google (77, 04 % рынка). Именно эта поисковая система дает наиболее мощные инструменты, необходимые для поиска специальной информации. Среди прочих поисковых возможностей, предоставляемых Google, можно отметить поиск по рубрикам Новости и Блоги. В этих рубриках можно найти наиболее актуальную информацию, так или иначе связанную с личностью Л. Андреева. Причем это не только сообщения о новых театральных постановках по пьесам автора или открытии дома-музея писателя. Это могут быть сообщения об Андреевских чтениях, конференциях, на которых будут доклады, посвященные его творчеству, блоги из www.livejournal.com, на которых профессиональные филологи обсуждают творчество мастера и др. Конечно, не только новости и блоги представляют интерес для литературоведа. В Сети существует большое количество филологических информационных ресурсов и электронных библиотек (см. подробнее об этом выше). Особое место в ряду таких ресурсов занимает Электронная библиотека диссертаций (www.diss.rsl.ru) – собрание авторефератов кандидатских и докторских диссертаций, а также полнотекстовых вариантов данных работ, защищенных в РФ. Доступ к информации бесплатный, навигация удобна и понятна, библиографические описания подробные. Наличие такого ресурса позволяет держать руку на пульсе российской филологии и, что также очень важно, выбирать такие направления исследовательской деятельности, которые были бы малоизученными, т.е. отвечали бы критерию научной новизны. Особо ценными являются Интернет-ресурсы, представляющие собой собрания различных словарей и тематических энциклопедий. Такие сайты как www.dic.academic.ru и www.edic.ru являются оптимальным средством терминологической и понятийной верификации. Портал www.gumer.info – это электронная библиотека, в которой представлены книги и статьи на различную тематику, в том числе большой выбор литературоведческих текстов. Сайт www.durov.com – это собрание трудов, посвященных лингвистике, русской, западной и восточной литературам, а также учебные материалы: конспекты лекций, ответы к экзаменам и пр. Следует отметить мемориальный сайт www.leonidandreev.ru, посвященный Л. Андрееву. На сайте представлены следующие разделы: романы и повести, рассказы, очерки и фельетоны, пьесы, фотографии и иллюстрации, жизнь, библиография и критика. Несмотря на то, что на сайте нет научных работ о творчестве писателя, это ресурс, безусловно, полезен исследователям творчества Л. Андреева, т.к. здесь представлены его тексты в электронном варианте, литературная критика, биографические заметки. Итак, можно сделать вывод, что применение ИТ в литературоведении может идти в различных направлениях, в числе которых составление формального тезауруса с помощью поисковых возможностей полнотекстовых электронных библиотек и поиск информации в Интернете с помощью поисковых машин. Применение ИТ помогает ускорить работу, получить наиболее полную и актуальную информацию о предмете своего исследования, заложить эмпирический фундамент своего исследования.
Воспользуйтесь поиском по сайту: ©2015 - 2024 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...
|