Форум » Тюркские языки » Глоттохронология тюркских языков » Ответить

Глоттохронология тюркских языков

Тахир: Глоттохронология (от греч. glotta — язык и Хронология) - совокупность разных статистических методов датировки доисторических процессов распадения языковых семей. Глоттохронология претендует на определение в абсолютном или относительном выражении эпохи дифференциации отдельных языков из праязыкового единства. Большая советская энциклопедия http://dic.academic.ru/dic.nsf/bse/79846/%D0%93%D0%BB%D0%BE%D1%82%D1%82%D0%BE%D1%85%D1%80%D0%BE%D0%BD%D0%BE%D0%BB%D0%BE%D0%B3%D0%B8%D1%8F В этой теме предполагается определение методики и выявление времени дифференциации тюркских языков.

Ответов - 301, стр: 1 2 3 4 5 6 7 8 9 10 11 All

Turk: Тахир ну что поехали :).

Turk: Давайте обозначим темы, над которыми нам надо будет поработать. Черновой вариант, просто мысли. Мне кажется надо сформулировать задачу в целом, затем разбить над подзадачи и на ниже уровня задания, и шаг за шагом выполнять, возможно даже паралельно. Примерно так: 1. Определение (исходные данные, опреление результата) 2. Анализ данных 2.1 Лингводаные 2.1.1 караимские пример 2.1.2 анализ исторических письменных источников тюрок: кодекс куманикус, бильге каган, Махмуд кашгари и другие 2.1.3 тюркские словари и общетюркские словарь 2.1.4 этимологические словарь 2.1.5 извелечение исходных данных на основе анализа 2.2 ДНК генеология 2.2.1 анализ гаплотипов, выявление линий и расчеты до общих предков, поиск совпадений с другими народами 3. Разработка 3.1. определение алгоритма вычесления - для выбранного примера (например караимы) 3.1.1 эмпиричское определение констатны для существующей формулы для выбранного примера 3.1.2 список "Сводеша" 3.1.3 Вычисления по существущей формуле, по подобранной константе 3.1.4 Сравнение предварительных результатов по времени распада караимских диалектов, с ДНК линиями караимов и их временем расхождения 3.2 экстрапаляция результатов по караимов на следующую группу 3.3 выведение общей константы для остальных тюркских ... можно продолжить.. Исходные данные: 1. общетюркские словари а) список сводеша на основании, которого вычесляется время распада по существующей формуле. б) караимские диалекты - пример, о котором говорил Альберт в) исторические письменные источники 2. формула глотохронологии где t — время от начала расхождения двух языков до настоящего момента, определяемое по количеству сохранившихся общих лексических элементов, С — сохранившийся в данном языке процент исконного состава универсального словаря, а r — эмпирически выведенный средний индекс сохранения его слов (в процентном выражении) за одно тысячелетие. Вследствие определённой механистичности исходных посылок методики результаты конкретных вычислений не дают твердой опоры для датировок. Получаемые абсолютные даты реально значимы, если они контролируются нестатистическими оценками лингвистического времени. Из ссылки Тахира. Теперь вопрос, есть диалект караимского имеем ли мы право исходя из "лингвистических законов" рассматривать эти диалекты типо как "языки", в том плане, что считать время их расхождения, строив для них списки - если подходить с существующим алгоримтом. Есть ли какое-либо ограничение в этом плане?

Turk: Да мы можем убрать все лишние из выше плана, сделать его проще на первом этапе и сконцентрироваться только на караимском примере на первом этапе на основе существующей форумлы, итерационно на след. направлениях, прогоняя по кругу, до опреденного момента (дадим определение..как выше по плану например). 1. дадим определение задачи (каковы исходные данные, каков выход) 2. анализ караимских дилаектов 3. определение списка сводеша 4. эмпирические определение константы --параллельно: ДНК караимов (если есть), 4.1. анализ линии у караимов 4.2. расчет времени расхождение линии, расчет времени жизни общих предков 5. сравнение полученного времени распада с историческими свидетельствами и ДНК генеологией. 6. выводы


Тахир: Ислам, нормальный план.

Turk: Для начала вопрос тебе и Альберту, где можно найти материал про карамиские диалекты и по каком принципу идет отбор слов в список, и вообще есть ли весовые категории у слов :), к тому что одно слово может иметь большой вес как в математике, а другое меньшее )) соотвественно может и вычесления иметь разные результаты.

Тахир: Turk пишет: Для начала вопрос тебе и Альберту, где можно найти материал про карамиские диалекты и по каком принципу идет отбор слов в список, и вообще есть ли весовые категории у слов :), к тому что одно слово может иметь большой вес как в математике, а другое меньшее )) соотвественно может и вычесления иметь разные результаты. Про караимов к Альберту больше вопрос, он лучше владеет им. От себя скажу, что отбор слов должен быть по разным тюркским языкам, только надо в методике избегать предположений о времени возможного разделения языков, например, между карачаево-балкарским и киргизским, или между турецким и гагаузским и т.д. К этому нас должна привести сама выработанная методология. Также думаю, что важным моментом в её определении должна быть фонетика. Т.е., нам надо определиться какие фонетические особенности тюркских языков архаичней, например джокающий или йокающий вариант и т.д. Может с этого начнём?

Turk: Тахир пишет: Может с этого начнём? Можно, я еще подумал сначала можно для интересна опробовать именно на караимских диалектах, так как мы и так знаем времени их физической изоляции друг от друга, что стало условиям для формирования этих двух диалектов, то есть оправдано ли будет по ним выбор в примерно 600 лет. Получим посути уровнение, где допустим 600 лет подставим вместо t в формуле а С - подберем по списку слова - % известное тоже. По полученному уровнению с одним неизвестным вычислим R - то есть импирический индекс. Это будет сделать просто, требует уточнение, такие вещи, караими физически разошлись (одни остались в крыму, другие ушли) примерно 600 лет, но является ли это отправной точкой для разделение их языка на диалекты или надо считать от даты первой фиксации диалектов? Второй момент мы можем полученный коэфициент опробовать на каком-нибудь точно известном факте среди тюрских языков. :) Это будет интересно попробовать. А дальше уже или параллельно обсудим и методологию подхода вообще в целом к вопросу как подбирать слова, на чем основываться на фонетике или еще каком-либо параметре, или комплексе параметров. И с тобой полностью согласен надо подходить без каких либо предположий - пусть нам даст ответы наши уровнения. Мы лишь потом проверим их.

Тахир: Turk пишет: я еще подумал сначала можно для интересна опробовать именно на караимских диалектах, так как мы и так знаем времени их физической изоляции друг от друга, что стало условиям для формирования этих двух диалектов, то есть оправдано ли будет по ним выбор в примерно 600 лет. Получим посути уровнение, где допустим 600 лет подставим вместе t в формуле а С - подберем по списку слова. По полученному уровнению выведем R - то есть импирический индекс. Это будет сделать просто, требует уточнение, такие вещи, караими физически разошлись примерно 600 лет, но является ли это отправной точкой для разделение их языка на диалекты или надо считать от даты первой фиксации диалектов? По этой формуле, как оно есть вышло бы, что караимы вообще не разделялись. Поэтому надо её переделать так чтобы t - было известной величиной. А тогда что искать по этой формуле?

Turk: Тахир да я это и имел ввиду, что вместе t поставим 600 лет (ну или какойм там возраст их разделения), наверное запутанно написал. Осталось коэфицент вычислить в уровнении с одним неизвестным дело техники :). п.с. поправил прошлое сообщение.

Тахир: Turk пишет: Тахир да я это и имел ввиду, что вместе t поставим 600 лет (ну или какойм там возраст их разделения), наверное запутанно написал. Осталось коэфицент вычислить в уровнении с одним неизвестным дело техники :). Нет, ты нормально написал. Просто, мне кажется, надо какую-то другую формулу. Эта же формула под особенности грамматики индоевропейских языков делалась. А под грамматику тюркских она не подходит, потому что у неё свои закономерности. А по переделанной этой формуле с уже известной величиной t, что мы будем искать? Я не представляю даже.

Turk: Тахир пишет: А по переделанной этой формуле с уже известной величиной t? что мы будем искать? Я не представляю даже Формула на самом деле простая, надо найти, то как они ее выводили - обоснование. Подставив t, у нас неизвестной будет R, т.е. индекс, вот его и найдем. Ведь при подсчете разделения тюркских языков использовали и используют всегда один и тот же индекс (константную величину), что и для индоевропейских языков, насколько мне известно. А тут мы найдем свою константу для тюркских языков, ну или попробуем найти. Она должна будет отличаться, в сторону замедленния. Ведь мы ожидаем, что тюркские языки медленнее изменяются, вот попробуем проверить. Ну это для начала, если смотреть на черновой план, что составил выше.

Тахир: Turk пишет: Формула на самом деле простая, надо найти, то как они ее выводили - обоснование. Подставив t, у нас неизвестной будет R, т.е. индекс, вот его и найдем. Ведь при подсчете разделения тюркских языков использовали и используют всегда один и тот же индекс (константную величину), что и для индоевропейских языков, насколько мне известно. А тут мы найдем свою константу для тюркских языков, ну или попробуем найти. Она должна будет отличаться, в сторону замедленния. Ведь мы ожидаем, что тюркские языки медленнее изменяются, вот попробуем проверить. Допустим, что у караимов только 5 слов фонетически изменилось в двух диалектах за 600 лет, и получится что вообще тюркские языки разделились 100 тысяч лет назад по данной формуле? Нет? Мне кажется, что ты лучше в ней разобрался. Объясни, пожалуйста, как мы её можем применить к тюркским, учитывая что константа изменчивости у тюркских другая.

Turk: Тахир пишет: Допустим, что у караимов только 5 слов фонетически изменилось в двух диалектах за 600 лет, и получится что вообще тюркские языки разделились 100 тысяч лет назад по данной формуле? Нет? Мне кажется, что ты лучше в ней разобрался. Объясни, пожалуйста, как мы её можем применить к тюркским, учитывая что константы изменчивости у тюркских другие. Да возможно и такое - ты прав, но для этого надо сначала узнать про диалекты караимов, послушаем, что скажет Альберт, потом сможем подумать об этом. То есть получим входные данные с примером караимов. Далее переменная C это процент изменных слов из списка, список состоит из какого-то количества слов, т.е. получается относительная величина. Если мы получим какой-то коэфицент, при том, что у караимов за 600 изменилось 5 слов допустим входящих в список. Посмотрим, что будет с другими тюркскими языками - если получим допустим 100 000 результат :)), если мы все правильно делали - это результат, тоже хороший результат, как опытное доказательство на реальном примере несостоятельности глотохронологической формулы. Для чистоты экперимента, можно сначала еще попробовать и с обычным коэффицентом и посмотреть даст ли близкое к 600 лет время или нет.

Тахир: Turk пишет: Да возможно и такое - ты прав, но для этого надо сначала узнать про диалекты караимов, послушаем, что скажет Альберт, потом сможем подумать об этом. То есть получим входные данные с примером караимов. Далее переменная C это процент изменных слов из списка, список состоит из какого-то количества слов, т.е. получается относительная величина. Если мы получим какой-то коэфицент, при том, что у караимов за 600 изменилось 5 слов допустим входящих в список. Посмотрим, что будет с другими тюркскими языками - если получим допустим 100 000 результат :)), если мы все правильно делали - это результат, тоже хороший результат, как опытное доказательство на реальном примере несостоятельности глотохронологической формулы. Для чистоты экперимента, можно сначала еще попробовать и с обычным коэффицентом и посмотреть даст ли близкое к 600 лет время или нет. Известно: 1. Изменение слов в двух диалектах караимского языка по списку Сводеша (нужен караимский словарь). 2. Время расхождения носителей языка. И надо узнать: 3. Коэффициент изменчивости языка за этот период. Он будет измеряться в % на отрезок времени. Так примерно?

Тахир: Тахир пишет: Да возможно и такое - ты прав, но для этого надо сначала узнать про диалекты караимов, послушаем, что скажет Альберт, потом сможем подумать об этом. Да.

Turk: Тахир пишет: Известно: 1. Изменение слов по списку Сводеша (нужен караимский словарь). 2. Время расхождения носителей языка. И надо узнать: 3. Коэффициент изменчивости языка за этот период. Он будет измеряться в % на отрезок времени. Так примерно? Да, именно так. Только 1. % сохранившийся в данном языке процент исконного состава универсального словаря (Сводеша).

Тахир: Turk пишет: Только 1.% сохранившийся в данном языке процент исконного состава универсального словаря (Сводеша). А почему сохранившийся? Я думаю, что вопрос скорее стоит не о "сохранившемся", а об "изменившемся" %, потому что сохраняется почти всё.

Тахир: Также надо будет уточнить, что включать в сумму % изменения в фонетике. Например, одно и тоже слово в двух диалектах может писаться в начале через г или к. Какова будет доля этого в сложении % изменения.

Turk: Тахир пишет: Также надо будет уточнить, что включать в сумму % изменения в фонетике. Например, одно и тоже слово в двух диалектах может писаться в начале через г или к. Какова будет доля этого в сложении % изменчивости. Не знаю, надо ли будет включать такие слова по существующей формуле или нет, а включим для начала, только такие, которые полностью отличаются, а не на букву. Давай тогда, сначала увидем список и подумаем. Если таких слов не найдем :), тогда наверное придется сразу всю формулу пересматривать, начиная с % изменичивости в словах диалектов. Возможно, нельзя и считать по диалектам, но такого ограничения я не нашел нигде.

Тахир: Turk пишет: Не знаю, надо ли будет включать такие слова по существующей формуле или нет, а включим для начала, только такие, которые полностью отличаются, а не на букву. Я думаю, что надо будет включать такие фонетические различия, только надо разобраться в весомости, какой она % может составлять. Давай тогда, сначала увидем список и подумаем. Если таких слов не найдем :), тогда наверное придется сразу всю формулу пересматривать, начиная с % изменичивости в словах диалектов. Возможно, нельзя и считать по диалектам, но такого ограничения я не нашел нигде. Конечно можно по диалектам одного языка, потому что в древности все языки так расходились.

Turk: С — сохранившийся в данном языке процент исконного состава универсального словаря. - судя из этого определения, я думаю, что тут не может быть одинаковых слов с разными буквами, речь идет о составе слов. Другое дело, считать ли слово чуть чуть измененое за другое слово :). Можно сделать так: 1. строго подойти к определению, то посчитать по формуле, но строго без чуть чуть измененых слов. 2. подойди уже не так строго, т.е. взять, что слово это 100% или 1 целое, процент изменных букв от этого слова - наш процент от слова или сотая или десятая доля 1 целого слова. Набор слов это список этих самых целых 1, процент сохранившийся в данном языке из унив. словаря + процент изменных букв от этого каждого слова (сотые иди десятые доли) из этого списка, получим процент типо XX,XX. И затем уже снова посчитать по формуле. Сравнить. Тахир пишет: Конечно можно по диалектам одного языка, потому что в древности все языки так расходились. Согласен, я из этого исходил тоже изначально, но не уверен.

Albert: Turk пишет: Для начала вопрос тебе и Альберту, где можно найти материал про карамиские диалекты и по каком принципу идет отбор слов в список, и вообще есть ли весовые категории у слов :), к тому что одно слово может иметь большой вес как в математике, а другое меньшее )) соотвественно может и вычесления иметь разные результаты. У меня есть караимско-польско-русский словарь. Он и в Интернете есть где-то. Там для каждого слова идет обозначение k, t или h, что, соответственно, означает крымский, тракайский и галицкий диалекты. Отбор слов в список идет по их употребимости. Если есть, скажем, синонимы в одном диалекте, то берётся именно то слово, которое чаще употребляется.

Albert: Тахир пишет: Также надо будет уточнить, что включать в сумму % изменения в фонетике. Например, одно и тоже слово в двух диалектах может писаться в начале через г или к. Какова будет доля этого в сложении % изменения. Это не считается. Имеются в виду не видоизмененные, а выпавшие полностью. Например, карачаевское "джокъ" и малкарское "зох" - одно и то же.

Albert: Надо при исследовании учитывать только тракайский и галицкий диалекты, поскольку крымский диалект - это фактически крымскотатарский язык. Крымские караимы постепенно перешли, как известно, на крымскотатарский язык на рубеже 18 - 19 вв. Так что, надо учитывать, что носители тракайского диалекта, проживавшие в Литве и Польше, и носители галицкого диалекта, проживавшие на Украине, оказались в явном меньшинстве среди сильно преобладающего иноязычного коренного населения. Соответственно, караимский язык в этих районах должен был испытать на себе очень серьезное воздействие местных языков. Поэтому надо учесть тот момент, что изменения в караимских диалектах будут более существенные, чем, скажем, для языков и диалектов моноэтничных регионов. То есть, процент отличий карачаево-балкарских диалектов будет заметно меньше, чем в караимских диалектах, даже если условно предположить, что карачаево-балкарские и караимские диалекты разошлись одновременно.

Turk: Albert Надо при исследовании учитывать только тракайский и галицкий диалекты, поскольку крымский диалект - это фактически крымскотатарский язык. Крымские караимы постепенно перешли, как известно, на крымскотатарский язык на рубеже 18 - 19 вв. Так что, надо учитывать, что носители тракайского диалекта, проживавшие в Литве и Польше, и носители галицкого диалекта, проживавшие на Украине, оказались в явном меньшинстве среди сильно преобладающего иноязычного коренного населения. Соответственно, караимский язык в этих районах должен был испытать на себе очень серьезное воздействие местных языков. Поэтому надо учесть тот момент, что изменения в караимских диалектах будут более существенные, чем, скажем, для языков и диалектов моноэтничных регионов. То есть, процент отличий карачаево-балкарских диалектов будет заметно меньше, чем в караимских диалектах, даже если условно предположить, что карачаево-балкарские и караимские диалекты разошлись одновременно. Тут мы будем доверять тебе :), соберем все данные какие можно, а потом отфильтруем по критериям. Если есть время начинай мы будем помогать. Думаю собрать этот список не долго и не сложно, если разбить над подзадания каждому, если один человек не справится.

Тахир: Albert пишет: Это не считается. Имеются в виду не видоизмененные, а выпавшие полностью. Например, карачаевское "джокъ" и малкарское "зох" - одно и то же. Таким образом коэффициент изменчивости получится очень незначительным, это в принципе так и есть. Но всё равно, наверно можно будет потом рассмотреть методику расхождения с учётом фонетической особенности слов. Теперь дело за словарём и подбором слов.

Turk: Тахир пишет: Теперь дело за словарём и подбором слов. Ну что досла, забросили это дело?) Я бы взялся за подбор слов, только увы не профи в этом), но помог бы, как будем делать? давайте, если вариант, разделим работеньку и сделаем).

Albert: Turk пишет: Ну что досла, забросили это дело?) Я бы взялся за подбор слов, только увы не профи в этом), но помог бы, как будем делать? давайте, если вариант, разделим работеньку и сделаем). Да вот лень, что-то... Пока у меня был караимско-польско-русский словарь в виде книги, я с удовольствием его листал, а сейчас у меня только его скан (я сам отсканировал этот словарь), а сканы листать я не очень люблю. Надо, конечно, заняться... Согласен...

Turk: Albert Мы все тебя ждем))). Интересно в электронном виде он есть? Был бы в электронном было бы легче работать за компом быстрее))

Albert: Turk пишет: Albert Мы все тебя ждем))). Интересно в электронном виде он есть? Был бы в электронном было бы легче работать за компом быстрее)) Он у меня в PDF-формате. В Интернете тоже есть, кажется, в де-жа-вю-формате. если я не ошибаюсь. С годами я становлюсь ленивее... Трудно было представить себе такое еще пару лет назад, чтобы я не ответил хоть на один пост, а теперь, видишь, я даже в "чингисхановской" теме так и не оставил неотвеченными посты Тахира. Просто нет времени...



полная версия страницы