Логотип персонального сайта В.М.Стецюка
Письмо на сайт
Версия для печати
Лента новостей (RSS)
Научно-исследовательская… / Общие положения альтернативной лингвистики / Графоаналитический метод

Графоаналитический метод


Принципы отбора лексического материала для иследований рассматриваются отдельно


Применяемый в исследованиях метод, названый автором графоаналитическим, впервые был описан в 1987 р. в статье "Определение мест поселения древних славян графоаналитическим методом" в журнале "Известия Акадамии наук СССР. Серия литературы и языка". Фактически метод является практической реализацией теоретических рассуждений украинского филолога Иллариона Свенцицкого, который, отстаивая необходимость применения математики в гуманитарних науках, писал:


Важным является только то, что всякие взаимоотношения человеческие и вообще мировые легче всего обозначать числом, объемом и положением в пространстве и времени, благодаря чему они легко укладываются в рамки математических символов (Свєнціцкий І., 1927, 53)


Метод, действительно, определяет взаимное положение родственных языков в пространстве в определенное время и базируется на использовании одного из видов графов, который, возможно, еще ждет своего описания в математике (автор, по крайней, мере в теории графов его не обнаружил). Пока что он может быть охарактеризован как “взвешенный” граф, в котором связи существуют не между отдельными узлами, а обязательно между ними всеми, причем важной является не только сама связь, но и расстояние между каждым из узлов. Суть метода состоит в поиске точных координат узлов графа на основании неточных данных о длине ребер, которые их соединяют. (В случае, когда длина ребер известна точно, определение этих координат не составляет большого труда, в геометрии это элементарная задача). В нашем случае мы отыскиваем координаты центров мест поселений носителей отдельных языков, имея неточные данные о количестве общих слов в парах родственных языков, поэтому и длина ребер графа является приблизительной. В принципе построение графа возможно, если длина ребер не очень искажена, но узлы уже будут выглядеть не отдельными точками, а множеством компактных точек. Чем компактнее будут расположены точки в пределах множества и чем далее одно от другого расположены эти множества, тем точнее построен граф. Далее мы будем строить подобные графы в наших исследованиях, но существует вероятность того, что эти построенные нами графы будут получаться случайно. Попробуем вычислить эту вероятность.

При существовании графа A, состоящего из некоторого числа n узлов, соединенных между собой ребрами, а каждый узел имеет (n – 1) ребер. Как известно из математики, для размещения точки на плоскости нам нужны только две координаты в любой системе координат. Для нашего графа, при комбинации отрезков ребер между собой по два, мы можем получить гораздо большее число пар координат. Точное их число С, может быть вычислено по известной формуле:



При числе узлов n = 6 мы будем иметь количество пар координат С = 10, при n = 10 число возрастает до С = 36, при числе узлов n = 12 мы получим С = 55. 6 место Следовательно, при n большем или равным шести место каждого из узлов графа относительно других (n – 1) узлов мы можем получить десятками разных способов. В нашем случае для графа А при использовании всех возможных способов размещения узлов на плоскости с помощью ребер известной длины узлы всегда попадут в одну точку. При исследовании реальной системы, каковою, например, является система взаимоотношений родственных языков, нас удовлетворит граф В, каждый из узлов которого будет состоять из множества точек, занимающих определенную площадь, не перекрываемую площадями других узлов. Если у нас, например, число исследуемых объектов n = 6 и они занимают площадь, величина которой S = 1, то каждый из объектов займет максимум участок размером s = 1 / 6. В таком случае вероятность того, что при построении графа В хотя бы одна точка попадет на свой участок тоже равна 1 / 6. Для шести объектов каждый из его узлов мы можем построить десятью разными способами, тогда вероятность того, что все десять раз одна и та же вершина попадет в ту же площадь будет равняться 1/610 = 1 : 604 660 176. Поскольку у нас шесть объектов, то эту величину нужно умножить саму на себя еще шесть раз. Тогда в знаменателе будет величина с восьмьюдесятью нулями. Уже эта величина не поддается воображению. Когда же у нас число объектов будет увеличено до десяти, то количество нулей в знаменателе будет равняться 3600.

Чтобы не усложнять восприятие, приведенное здесь доказательство было проведено несколько упрощенно, но сами себе порядки полученных величин говорят в пользу того, что в случае построения графа по имеющимся данным о его случайности не может быть и речи. Указанное упрощение объясняется тем, что построение точек по их координатам несколько отличается от обычной. Действительно, в геометрии для построения любой точки нужно иметь только две координаты, но координаты могут иметь положительные и отрицательные значения. Мы используем только положительные числа, поэтому двумя координатами можно построить две точки, взаимные положения которых будут зеркальными. Метод построения имеет определенные особенности, когда логика подсказывает, точку из возможных нужно брать. Общий ход построения таков, что точки надо располагать от центра схемы, приблизительное расположение которого становится известным уже при построении первых трех центральных точек, то есть для тех языков, которые имеют между собой больше общих слов (признаков) – сначала откладывается отрезок, соответствующий наибольшему количеству слов в парах языков, а далее на базе этих двух точек по координатам строится третья. Собственно, только здесь мы стоим перед выбором – в какую сторону надо откладывать координаты третьей точки, и это делается произвольно, поэтому конечная схема может иметь два варианта, которые зеркально отражают друг друга. Но сомнений при выборе одного из двух вариантов не бывает никогда, потому что почти всегда известно, какие языки являются западными, а какие восточными или северными и южными. Когда же построено по одной точке каждого узла, то тогда исчезают всякие сомнения вообще – из двух возможных вариантов берется тот, при котором точки одного узла лягут наиболее тесно. Так делается для всех пар координат, но весь процесс требует проведения нескольких итераций, потому что выбор начала координат (центра узла) является несколько произвольным. Поскольку каждое ребро в качестве координаты используется несколько раз в комбинации с другими, то чертеж становится перегруженным большим количеством линий и точек, среди которых можно запутаться. Поэтому, когда данные довольно точны, можно каждое ребро использовать в качестве координаты только один раз. Тогда каждый узел будет состоять только из (n – 1) точек, каждая из которых является концом одного из ребер. Общее число ребер равно величине, которую можно вычислить по формуле:



Графоаналитический метод может найти применение не только в языкознании, но и в других науках, где проявляется корреляция между большим количеством общих признаков разных объектов и расстоянием между объектами в пространстве (необязательно даже в двухмерном). Этот метод был проверен, например, на статистических данных Федорова-Давыдова (Федоров-Давыдов Г. А., 1987) о количестве общих признаков орнаментальных композиций среднеазиатской керамики, произведенной несколькими мастерами, жившими в разных частях Пенджикента. Поскольку художественные взаимовлияния мастеров были тем сильнее, чем ближе они между собой проживали, то стало возможным определить расположение их мастерских на территории города. Конечно, проверить эти данные невозможно, поскольку неизвестно, где в действительности жили мастера, но сама возможность построения уже является определенным свидетельством действенности метода.

Нужно особенно подчеркнуть, что графоаналитический метод эффективен только при обработке абсолютных величин или отнесенных к одной общей. Отнесение количества общих признаков между двумя объектами к их общему количеству в этих языках или в одном из них не может достаточно характеризовать эти два объекты, поскольку общее количество признаков какого-либо из объектов само зависит от расположения объекта среди других. Маргинальные объекты имеют меньшее общее количество признаков, характерных для этой ассоциации, и это уже характеризует их периферийное положение. Когда же мы возьмем это сниженное значение в знаменателе, оно нам искусственно увеличит соотношение. Это не означает, что маргинальные объекты вообще имеют меньшее признаков. Они их могут мать даже и больше, но их часть может уже быть общей не с объектами исследуемой ассоциации, а соседней.

Процесс построения схем родства графоаналитическим методов по лексико-статистическим данными показан на конкретном примере ностратических языков по данным результатов исследований В. М. Иллича-Свитыча (Иллич-Свитыч В. М., 1971). Сам факт построения схемы родства языков ностратических языков будет свидетельствовать об этом. В. М. Иллич-Свитыч исследовал лексические, словообразовательные и морфологические сходства шести больших языковых семей Старого Света: алтайской, уральской, дравидийской, индоевропейской, картвельской и семито-хамитской. Часть данных, полученных в результате исследований Иллича-Свитыча, была представлена в таблицах (морфологические признаки и лексика в количестве 147 позиций), а еще 286 лексических параллелей можно было найти в тексте его книги, к которым при проверке всего материала с данными Андреева было дополнительно добавлено 27 слов из уральских и 8 из алтайских языков (Андреев Н. Д., 1986). Тут необходимо заметить, в составе всего материала алтайских языков настолько преобладают примеры из языков тюркских, что фактически именно о них и должна была бы идти речь, однако мы пока оставляем термин «алтайские языки» в понимании Иллича Свитыча.

После обработки всех материалов Иллича-Свитыча и Андреева оказалось, что из 433 всего количества признаков 34 являются общими (к ним мы еще вернемся), а остальное соответствовали 255 единицам из уральских, также 255 единицам – из алтайских, 253 единицам из индоевропейских, 240 – из семито-хамитских, 189 – из дравидийских и 139 из картвельских. Затем было подсчитано количество общих признаков в парах языков, но при этом не учитывалось разная весомость морфологических признаков и лексических единиц, хотя это совсем разные категории. Однако количественная оценка этой весомости все равно была бы субъективной, поэтому будем надеяться, что морфологические признаки распределились среди языков более или менее равномерно. Подсчеты дали результаты, представленные в таблице 1:


Таблица 1. Количество общих признаков между семьями языков


алтайские – уральские 167 уральские – картвельские 66
алтайские – индоевропейские 153 индоевропейские – семито-хамитские 147
алтайские – семито-хамитские 149 индоевропейские – дравидийские 108
алтайские – дравидийские 109 индоевропейские – картвельские 70
алтайские – картвельские 84 семито-хамитские – дравидийские 110
уральские – индоевропейские 151 семито-хамитские – картвельские 86
уральские – семито-хамитские 136 дравидийские – картвельские 54
уральские – дравидийские 134

Проанализировав полученные данные, нельзя сразу найти в них какую-либо закономерность, однако можно заметить, что больше всего общих слов имеют между собой алтайские, уральские, семито-хамитские и индоевропейские. С этих языков и следует начинать построение схемы. Сначала нужно выбрать коэффициент пропорциональности, а далее пересчитать количества общих признаков в расстояния между ареалами языков. Выбор значения коэффициента определяется размерами листа, на котором строится схема. В соответствии с нашими данными подходит значение K=1000. Тогда расстояния между ареалами отдельных языков будут иметь значения, представленные в таблице 2:


Таблица 2. Расстояния между центрами языковых семей на схеме, см.


алтайские – уральские 6.0  уральские – картвельские 15.2
алтайские – индоевропейские 6.5 индоевропейские – семито-хамитские 6.8
алтайские – семито-хамитские 6.7 индоевропейские – дравидийские 9.3
алтайские – дравидийские 9.2 индоевропейские– картвельские 14.3
алтайские – картвельские 11.9 семито-хамитские – дравидийские 9.1
уральские – индоевропейские 6.6 семито-хамитские – картвельские 11.6
уральские – семито-хамитские 7.4 дравидийские – картвельские 18.5
уральские – дравидийские 7.5

Построение схемы родства идет несколькими итерациями. Сначала по двум координатам для каждого языка находится одна точка, которая определяет приблизительное положение ее ареала, а в следующих итерациях идет уточнение расположения всех ареалов языков. В принципе можно начать с любого языка, но сразу неизвестно, в какую сторону пойдет построение, и схема может выйти за пределы листа. Тому удобнее всего начать построение с пары языков, которые имеют наибольшее количество общих признаков. В нашем случае это алтайские и уральские языки. Следовательно, сначала произвольно расположим где-то в центре листа отрезок AB длиной 6 см, который соответствует количеству общих признаков в этой паре (см. Рис. 5). Концы этого отрезка определяют место точек для алтайских и уральских языков. Далее на базе этого отрезка строятся точки для индоевропейских и семито-хамитских языков. Начнем с семито-хамитских, поскольку эти языка имеют больше общих признаков с картвельским и дравидийскими, чем с индоевропейским. В соответствии с количеством общих признаков точка семито-хамитских языков должна находиться на расстоянии 6,7 см от точки алтайских и на расстоянии 7,4 см от точки языков. Циркулем с соответствующим раствором делаем две засечки и на их пересечении находим точку семито-хамитских языков. Таких точек может быть две – слева и справа от базы. Выбор одной из этих двух возможных точек определяет окончательный вид схемы, которая может иметь два варианте, зеркальные по отношению друг к другу.

Выберем точку, которая лежит ближе к центру. Теперь у нас три точки – A, B, C, и мы переходим к построению точки D (индоевропейские языки). Ее положение определим тоже на базе отрезка AB. Она должна быть на расстоянии 6,5 см от точки A и на расстоянии 6,6 см от точки B. Циркулем делаем две соответствующие засечки в сторону, противоположную от точки C и получаем точку D. (Располагать ее возле точки C нельзя, поскольку в этом случае семито-хамитские и индоевропейские языки должны были бы иметь значительно больше общих признаков, чем они имеют на самом деле). Точку E для дравидийских языков строим на базе BC, поскольку именно семито-хамитские и уральские языки имеют более всего общих признаков с дравидийскими. Итак, эта точка располагается на расстоянии 7,5 см от точки уральских языков и на расстоянии 9,1 см от точки семито-хамитских языков в направлении от центра схемы, иначе она ляжет возле точки алтайских языков, почему противоречит количество общих признаков между ними. Аналогично строится точка F для картвельских языков, только в этом случае на базе AC. После этого первая итерация закончена – получена скелетная схема родства ностратических языков. Их ареалы должны быть где-то в районе полученных точек A, B, C, D, E, F.


Рис. 5. Первая итерация построения схемы родства ностратических языков


Вторая итерация дает возможность уточнить и проверить правильность расположения ареалов. При этом точки отдельных языков строят по другим координатам. Например, точка D строилась по двум координатам, которыми были отрезки AD и BD. Теперь мы можем использовать в качестве координат, скажем, те же самые отрезки в других сочетаниях – с отрезками, которые отвечают расстоянию ареала индоевропейских языков от ареала дравидийских, семито-хамитских и картвельских.

Потом можно взять еще и другие возможные сочетания. В целом мы должны были бы получить 10 точек, которые бы нам очертили ареал индоевропейского языка. При этом каждый раз при выборе одного из двух возможных вариантов мы должны выбирать тот, при котором новая точка ложится ближе к уже построенным. К сожалению, в случае с ностратическими языками не каждая пара координат дает нам возможность построить соответствующую точку. Иногда координаты слишком коротки и не пересекаются между собой. Это объясняется, очевидно, тем, что найти общие признаки между двумя языками, существовавшими тысячи лет тому назад, чрезвычайно сложно, и таблицы Иллича-Свитыча недостаточно полны. Однако вторую итерацию можно провести проще. На рисунке 5 уже хорошо видно, что центры ареалов индоевропейского и семито-хамитских языков должны были бы быть ближе один к другому, центр ареала картвельских языков – ближе к алтайским, а центр ареала дравидийских – ближе к семито-хамитским и уральским. Передвинув соответственно точки C, D, E, F,, а потом соединивши между собой полученные таким образом новые центры ареалов прямыми линиями, мы получим граф, показанный на рисунке 6.



Рис. 6. Вторая итерация построения схемы
родства ностратических языков


После этого на каждую из линий наложим соответствующие отрезки, размеры которых подсчитаны на основании количества общих признаков в парах языков (см выше), симметрично относительно середины расстояния между вершинами графа. Теперь концы отрезков будут расположены более компактно. Можно провести еще третью итерацию, если видно, что условные центры ареалов нужно передвинуть снова. Окончательно схема семейных отношений ностратических языков принимает вид, показаний на рисунке 7. Полученная схема обладает определенными фрактальными свойствами, частности, напоминает треугольник Серпинского. Полученная таким образом схема является одним из двух зеркальных вариантов, из которых выбрано именно этот по той причине, что именно для него удалось найти место на географической карте. Здесь нужно только обратить внимание, что при поисках соответствующего места на географической карте для получаемых схем родства нужно каждый раз подбирать новый коэффициент пропорциональности в соответствии с масштабом карты, то есть строить геометрически подобную схему другого размера в соответствии с размерами ареалов на карте.



Рис. 7. Схема родственных отношений ностратических языков





Free counter and web stats            

           

Понравилась страница? Помогите развитию нашего сайта!

© 1978 – 2017 В.М.Стецюк

Перепечатка статей с сайта приветствуется при условии
ссылки (гиперссылки) на мой сайт

Сайт живет на

Число загрузок : 1988

Модифицировано : 2.04.2016

Если вы заметили ошибку набора
на этой странице, выделите
её мышкой и нажмите Ctrl+Enter.