Главная | Обратная связь | Поможем написать вашу работу!
МегаЛекции

Схема представления исходных данных




Опыт статистического группирования позднепалеолитических комплексов Евразии

Деревянко А.П., Фелингер А.Ф., Холюшкин Ю.П.

Настоящая работа является частью осуществляемых в институте археологии и этнографии СО РАН исследований в археологии на основе статистических методов. Некоторые методы и результаты этих исследований представлены в вышедшей монографии (Деревянко, Фелингер, Холюшкин, 1989). Наряду с этим существенное внимание уделяется также вопросам системной классификации основных археологических понятий (Гражданников, Холюшкин, 1990). Актуальность этих вопросов значительно возрастает с расширением использования ЭВМ в исследованиях по археологии. Практические результаты в этом направлении позволяют формировать новые концепции структуры археологических понятий и их системных взаимосвязей. Тем самым реальнее становится переход к созданию археологических банков знаний, имеющих несомненное преимущество перед существующими ныне фактографическими банками (базами) данных.

Параллельно с этим ведется отработка и совершенствование средств программного обеспечения задач группировочного анализа, разрабатываются методики представления археологической информации, что немаловажно при использовании информации на основе публикаций. Определенное значение придается и использованию данных, полученных разными авторами при работах с коллекциями одних и тех же памятников. Все это позволяет в максимально возможной степени верифицировать интерпретацию получаемых результатов.

Работы, выполненные к настоящему времени, проводились на достаточно ограниченном материале и были направлены прежде всего на иллюстрацию возможностей метода оптимального группирования, а не на получение окончательного результата. Результаты группирования в значительной степени совпали с выводами большинства исследователей палеолита Северной Азии.

В ходе второго этапа работы были подготовлены для статистической обработки данные о 54945 каменных орудиях из 308 палеолитических комплексов Северной, Центральной, Средней Азии, Ближнего Востока, Урала, Восточно-Европейской равнины, Кавказа и ряда других территорий.

Процесс группирования осуществлялся до получения 10 итоговых групп памятников. В данной статье мы ограничимся интерпретацией результатов для одной из сформировавшихся групп, в которую включены позднепалеолитические памятники Средней и Западной Сибири, Алтая, Урала и Восточной Европы.

Схема представления исходных данных

При выборе системы признаков описания 308 археологических комплексов Евразии, их общей структурной организации и структурной организации отдельных признаков мы руководствовались условиями эффективности и оптимальности информационного представления объекта. Общие соображения целесообразности заставили нас снизить число классов каменных орудий, включенных в описание. Это определялось большим разнообразием археологических памятников, значительно отличающихся друг от друга контекстом, временными характеристиками, степенью разработанности, количеством артефактов. В этих условиях путем группирования число классов артефактов было сокращено до 29. Некоторые классы артефактов были вообще исключены на данном этапе из описания.

Ниже приведены коды классов орудий. по которым осуществлялась обработка, и их доли в процентах от общего числа орудий (54 945): 1) долота 3,69; 2 перфораторы (проколки, провертки, клювовидные и т.д.) 1,44; 3) орудия для производства орудий (отбойники, наковальни, ретушеры, отжимники) 0,94; 4) чопперы 1,56; 5) чоппинги 0,73; 6) отщепы с ретушью, в том числе рабочей 6,37; 7) зубчатые орудия 1,77; 8) выемчатые орудия 3,29; 9) скребки 20,81; 10) скребла 6,56; 11) бифасы 1,51; 12) скребловидные 0,63; 13) ножи 1,99; 14) наконечники разные 2,38; 15) леваллуазские остроконечники (неретушированные и ретушированные) 0,86; 16) острия 2,19; 17) пластины, пластинки, пластинчатые отщепы с ретушью краевой 10,34; 18) пластинки, пластины, микропластинки с пряморетушным концом 1,28; 19) пластинки и микропластинки с притупленным краем 4,13; 20) пластины, пластинки со следами использования 2,47; 21) резцы 18,80; 22) комбинированные орудия 0,91; 23) пластины леваллуа, в том числе треугольные сколы 1,87; 24) отщепы леваллуа, в том числе ретушированные 1,54; 25) остроконечники мустьерские 0,34; 26) лощила 0,01; 27) нуклевидные орудия 0,14; 28) пластинки и микропластинки с выпуклым и косоретушным концом (в последнем подразделении присутствуют и острия) 0,41; 29) микропластинки с ретушью 1,03.

Каждый памятник представлялся строкой из 29 признаков. Каждый признак представлял тип или класс орудий. Значениями признака являются количества орудий данного типа или класса. Для наглядности представим это в такой форме:

5 0 0 4...... 1

1 2 3 4...... 29

Каждый памятник имеет 29 признаков. Число в соответствующем признаке означает, сколько артефактов данного типа или класса найдено в данном памятнике. Процентные значения каждой такой строки выражают долю того или иного класса орудий, представляющих данный памятник. Сумма процентов каждой строки равна 100.

Приведем коды рассматриваемой группы в соответствии с их номерами в общей совокупности из 308 археологических комплексов: 1 Бедарево II; 2 Шорохово I; 3 Ильинка II; 7 Новоселово VI; 8 Новоселово VII; 9 Кокорево I, гор. 2; 10 Кокорево I, гор. 3; 11 Кокорево I, гор. 4; 12 Кокорево I, гор. 4а; 13 Кокорево I, гор. 5; 14 Кокорево I, гор. 5а; 15 Кокорево I, гор. 6; 27 Денисова Пещера, слой 9Б; 48 Голубая I, слой 3; 49 Макарово III; 56 Шамотный Завод, нижний горизонт; 58 Бигдон; 59 Юстыд I, слой 4; 61 Афанасьева Гора; 68 Чегерак; 69 Березовый Ручей I; 82 Игетейский Лог I; 83 Красный Яр, верхний культурный слой; 84 Макарово IV; 95 Сосновый Бор, гор. 6; 96 Мальта; 97 Усть-Кова, поздний комплекс; 102 Усть-Сема, средний культурный горизонт; 103 Усть-Скма, верхний культурный горизонт; 108 Буреть; 110 Кокорево IV, слой 2; 114 Дюктайская Пещера; слой 7б; 140 Студеное I, гор.15; 142 Студеное I, гор. 13/1; 143 Студеное I, гор. 11; 144 Студеное I, гор. 10; 145 Черемушки, гор.2; 153 Сухотино 4, слой 6; 174 стоянка Талицкого; 175 Устиновка I, слой 1; 176 Устиновка I, слой 2; 177 Устиновка I, слой, 3а; 178 Устиновка I, слой 3б; 180 Аешка; 184 Черноозерье II, гор. 1; 185 Черноозерье II, гор. 2; 187 Шикаевка; 207 Олон-Нор-2, коллекция 1; 210 Их-Цахир, группа 2; 250 Русланова Пещера; 264 Костенки-17, слой 2; 265 Костенки-17, слой 1; 267 Костенки-12, слой 3; 273 Костенки-1, II слой; 307 Бачо-Киро, слой 11.

Распределение всей совокупности артефактов (54 945) по всему комплексу памятников (308) и набору классов орудий (29) неравномерное. Более всего орудий 9-го класса 11 435 скребков, что составляет 20,81 % от общего числа орудий. Если бы орудия было распределены равномерно, то на каждый класс пришлось бы пи 1895 орудий, или 3,47 % от их общего количества. Меньше всего лощил 7 экз., или 0,01 % от общего количества. Примем число 1895 за среднеарифметическое число орудий на один класс. Число классов, где количество орудий выше среднего уровня, 7, ниже 22. Таким образом, наблюдается ярко выраженная асимметрия; по узкому классу типов орудий много, по большинству мало.

Рассмотрим теперь распределение общего количества орудий по памятникам. В среднем на один памятник приходится 177 артефактов. Больше этого количества орудий найдено в 55 памятниках, меньше в 253. Симметрия, равномерность распределения орудий по памятникам ниже, чем распределение орудий по классам.

Степень равномерности или неравномерности распределения совокупности объектов по некоторому классу возможных типов (состояний, значений) хорошо отражается величиной энтропии распределения.

Обозначим через X множество памятников, со значениями: х1 памятник с кодом 1, х2 памятник с кодом 2,..., х33 памятник с кодом 33 и т.д. Через Y обозначим множество классов орудий, со значениями: y1 орудия с кодом 1, y2 орудия с кодом 2,..., y29 орудия с кодом 29. В этих обозначениях энтропия (мера равномерности) распределения орудий по памятникам выражается формулой Н(Х) = p(xi) lg2p(xi), где p (Х) доля орудий. представляющих памятник Х (i = 1, 2,..., 308), из общего числа орудий. В конкретном выражении это определяется следующим образом: Н(Х) = 0,002 lg2 (0,002) + 0,004 lg2 (0?004) +... 0,097 lg2 (0,097) = 6,332. Мера структурированности распределения элементов совокупности по признаку Х определяется по формуле I(X) = lg(M) H(X) = 1,935, где lg(M) определяет максимальную энтропию (меру энтропии при равномерном распределении) для совокупности объектов, распределенных по М группам. В данном случае мы имеем дело с распределением всей совокупности артефактов (54 945 экз.) по М = 308 памятникам. Отношение I(X)/lg(M) выражает относительную структурированность данного распределения. Эта величина позволяет сравнивать структурированность распределений при различном числе групп, по которым могут быть рассредоточены элементы совокупности.

Итак, относительная структурированность распределения типов орудий по памятникам равна I(X)/lg (M) = 1?935 (lg 308) = 0,234.

Энтропия распределения орудий по типам выражается формулой

H(Y) = p(yi)lg2p(yj),

где p(yj) доля орудий представляющих тип yj (j = 1, 2,..., 29), из общего числа орудий.

Конкретное значение определяется следующим выражением: (Р(Н) = 0,0037 lg2(0,037) + 0,015 lg2 (0,015) +... + 0,01 lg2 (0,01) = 3,877. Мера структурированности распределения равна: I(Y) = lg(N) H(Y) = 0,981. Относительная структурированность равна

I(Y)/lg(N) = 0,981/lg(29) = 0,202.

Таким образом, распределение всей совокупности артефактов по типам орудий и по памятникам характеризуется примерно одинаковой мерой неравномерности (асимметрией), хотя, строго говоря, неравномерность распределения по памятникам несколько выше, чем распределение по типам орудий.

Перейдем теперь к совместному распределению артефактов по всем возможным различным сочетаниям памятников и типов орудий. Общее количество таких возможных комбинаций равно 308 Х 29 = 8932.

Энтропия фактически имеющего место совместного распределения выражается формулой

H(XY) = p(xiyi)lg p(xiyi),

а для наших конкретных данных H(XY) = 8,616.

Структурированность, определяемая зависимостью между признаками X и Y, выражается формулой

I(XY) = H(X) + H(Y) H(XY) = 6?332 + 3?877 8?616 = 1,593.

Значение I(XY) выражает то обстоятельство, что если известен памятник, то неопределенность распределения артефактов уменьшается в среднем на величину I(XY) по сравнению с неопределенностью (энтропией) общего распределения артефактов по класам орудий. В относительных величинах в нашем конкретном случае это в среднем составляет 1,593/3,877 = 0,410, т.е. 41 %. Интерпретация этого заключается в следующем: знание памятника уменьшает на 41% неопределенность распределения артефактов по классам орудий. С другой стороны, знание распределения артефактов по классам орудий повышает надежность предсказания, к какому памятнику относится данный комплекс орудий, на 25 %.

Исходя из полученных данных общая структурированность таблицы равна: S(XY) = I(X) + I(Y) + I(XY) = 1,935 I + 0?981 + 1?592 = 4,509. Мера зависимости признака Y от признака Х составляет (Х Y) = I(XY)/H(Y) = 1,592/3,877 = 0,411, или 41,1 % от функциональной зависимости, т.е. знание значений объекта статистической совокупности по признаку Х увеличивает точность предсказания его значения по признаку Y на 41,1 %. Мера зависимости признака Х от признака Y составляет (Х Y) = I(XY)/H(X) = 1,592/6,332 = 0,251, или 25,1 % от функциональной зависимости, т.е. знание значений объекта статистической совокупности по признаку Y увеличивает точность предсказания его значений по признаку X на 25,1 %. Таким образом, значения признака Y в большей мере регулируют (определяют) распределение объектов совокупности по значениям признака Х, нежели наоборот. В целом же влияние значений признака Х на распределения по значениям признака Y значительно.

Поделиться:





Воспользуйтесь поиском по сайту:



©2015 - 2024 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...