DOI: 10.7256/2585-7797.2021.2.36061
Received:
04-07-2021
Published:
13-07-2021
Abstract:
The author develops a mathematical-statistical approach to the problem of estimating the size of Genoese medieval population in Byzantium. The data source is notarial acts covering commercial partnerships, freightage, wills, purchase and sale of houses, goods and people drawn up in the Genoese colony of Constantinople at the end of the 13th century. The will form has a fairly uniform structure. In addition to the mandatory record of names of the contracting parties and witnesses of the transaction, it may also register names of the third parties. Thus, these data on the clientele of Genoese notaries represent a dataset which may indirectly indicate the size of the entire trading Genoese community of Byzantium. This approach is based on a constructed formalized model that describes the behavior of merchants when visiting and concluding a transaction attested by a notary. This makes it possible to pass in a natural way from the initial to the statistical problem of estimating the size of a finite aggregate and use this mathematical theory for its calculation. In this case, the author applies the approach associated with the use of the maximum likelihood function that is a novelty. The resulting formula allows (with a certain degree of probability) one to estimate the required size of the Genoese population. It is interesting that this estimate, on the whole, coincides with the result of A.L. Ponomarev obtained earlier for the same problem using Zipf's empirical law.
Keywords:
Constantinople, Genoese, notarial acts, ranged series, statistical estimation, sample, size of a finite population, multinomial distribution, maximum likelihood estimation, Zipf’s law
I. Введение
Одной из интересных и захватывающих тем в исторических исследованиях является математическое, формализованное оценивание какого-либо неизвестного показателя по косвенным данным массовых источников. В частности, проблеме реконструкции численности генуэзской торговой общины в Византии посвящен ряд работ яркого, талантливого, но, к сожалению, рано ушедшего от нас историка Андрея Леонидовича Пономарева. Настоящая статья, можно сказать, подхватывает эту проблематику и предлагает для решения этой задачи использовать развитый математический аппарат статистического оценивания.
Вдохновленные Нимфейским договором 1261 года, генуэзцы, а если брать шире – жители Лигурийского побережья, развили уже к началу 1280-х годов в Византии бурную коммерческую деятельность, о чем красноречиво свидетельствуют многочисленные акты о торговых товариществах, наймах судов, завещаний, купли и продажи домов, товаров и людей. Один отрывок из хроники Никифора Григоры, относящийся, правда, к несколько более позднему времени, дает представление о масштабах деятельности генуэзской торговой общины: “их ежегодный доход от пошлин обратился, примерно, в 200 тысяч, а у византийцев он с трудом доходил до 30 тысяч”[1]. Вместе с тем ни один источник не говорит хотя бы приблизительно о численности этой общины. В связи с этой задачей А.Л. Пономарев привлекает опубликованные Г. Брэтиану в 1927 году акты в той их части, которые были составлены в 1281 году Габриэлем де Предоно, нотарием города Пера – генуэзской колонии напротив Константинополя [2].
Необходимо отметить, что далеко не все генуэзцы в Пере являлись клиентами Предоно. А те персоналии, которые упоминались в его актах, могли заключать сделки и у других нотариев. Несмотря на такую непростую картину, А.Л. Пономарев показывает как, зная частоты упоминания клиентов Предоно, можно оценить приблизительную численность клиентелы всех генуэских нотариев в Пере [3].
Для решения этой задачи реконструкции А.Л. Пономарев сначала строит формализованную вероятностную модель, описывающую поведение генуэзских купцов при заключении сделок и посещении нотария. Так, ученый представляет это как цепной процесс, в котором совершение очередной сделки у данного нотария обусловлено успешным совершением предыдущей у того же нотария. Другими словами, чем больше купец заключил сделок, тем больше вероятность что он заключит ее еще раз.
Учет указанных феноменов “успеха” и “склонности” А.Л. Пономарев проводит с помощью комбинации двух отрицательных биномиальных распределений [4, с.171-174], что позволяет получить формулу частоты упоминания различных персоналий в нотариальных актах Предоно. Отсюда ученый определяет и число персоналий, либо не упомянутых в его актах, либо совершавших сделки у других нотариев, либо вообще их не посещавших (общее число генуэзцев в Пере как 1786 против 507, упомянутых у Предоно). В то же время А.Л. Пономарев указывает и на недостаток предложенного подхода, заключающийся в необходимости учета дополнительного параметра–прогнозируемого числа генуэзцев, который строго не определяется.
В последующей своей статье ученый для описания зависимости между количеством упоминаний и числом купцов, отмеченных не менее, чем указанное число раз, предлагает использовать закон Ципфа, который весьма часто используется для анализа ранжированных рядов (например, частоты цитирования работ различных авторов) [5]. А.Л. Пономарев расширяет этот закон и на случай нулевого числа упоминаний, что приводит ученого к пересмотру прежней оценки численности купцов (645-650 человек).
Вместе с тем А.Л. Пономарев указывает и на один важный недостаток предложенного подхода – параметры закона Ципфа не имеют качественного наполнения, отчего этот закон описывает совокупность данных, но не объясняет их структуру. Для устранения этих недостатков при реконструкции общей численности автор настоящей статьи предлагает использовать новый подход, основанный на применении математического аппарата статистического оценивания.
II. Неформальное введение в статистическое оценивание объема конечной совокупности
Обозначим через N – число элементов (объем) генеральной совокупности, а через n – число элементов ее выборки. Будем считать (и это существенно!), что элементы попадают в выборку случайным образом, а затем возвращаются обратно в генеральную совокупность. Такая выборка называется выборкой с возвращением. То есть один и тот же элемент может встречаться в выборке несколько раз.
Интуитивно понятно, что чем чаще встречаются элементы в случайной выборке, чем меньше в ней число i различных элементов, тем правдоподобней выглядит гипотеза, что объем n выборки соразмерен с объемом N всей генеральной совокупности. На этом, по сути, и основана идея оценивания числа N. В данной статье автор следует подходу, основанному на применении принципа максимального правдоподобия [6]. Суть этого принципа состоит в предположении, что вся информация о выборке содержится в функции правдоподобия. В нашем случае эта функция представляет из себя формулу для совместной вероятности выборки, зависящей от N как от своего параметра. Подставляя в эту функцию реальные выборочные данные и максимизируя ее по параметру N, получаем наиболее “правдоподобную”, близкую к реальности величину объема генеральной совокупности.
Итак, исходя из нашего предположения о случайности выборки, вероятности оказаться в ней для каждого элемента генеральной совокупности одинаковы и равны 1/N. Наша задача состоит в оценивании величины N при условии, что число i различных элементов, оказавшихся в выборке объема n, известно. Вероятность того, что в выборке размера n первый элемент из генеральной совокупности содержится n1раз, второй элемент–n2 раза, …, последний – nN раза, носит название полиномиального распределения [4, с.174-175] и равна
где через n! обозначен факториал числа n: n=n(n-1)(n-2)..2·1, и n = n1+n2+..+nN.
Отсюда вероятность того, что ровно i различных элементов встретятся в выборке размера n равна
где через СNi обозначено число сочетаний из N по i: СNi=N!/(i! (N-i)!)), а через Σ – операция суммирования по всем наборам (n1,..,ni), таким, что nj>0 (j=1,2,..,i) и n1+n2+..ni=n, то есть все наборы состоят из положительных чисел, в сумме дающих величину n объема выборки.
Заметим, что в последней формуле от величины N зависят только первые два множителя. Поэтому для решения задачи максимизации функции правдоподобия достаточно ограничиться анализом функции f(N,n,i):
Максимальное значение эта функция в точке N0 принимает тогда и только тогда, когда выполняются два неравенства:
f(N0-1,n,i) ≤ f(N0,n,i) и f(N0,n,i) ≥ f(N0+1,n,i),
что эквивалентно выполнению двух неравенств с участием натуральных логарифмов ln:
ln N0 – ln(N0-i) ≥ n (ln N0 – ln(N0-1)) и ln(N0+1) - ln(N0-i+1) ≤ n (ln(N0+1) - ln N0).
Обозначив через S(N,i) функцию
,
мы приходим к более простой записи предыдущих двух условий:
S(N0,i) ≤ n ≤ S(N0-1,i).
Отметим, что функция S(N,i) (таблица ее значений частично приведена в Приложении 1) убывает с ростом N при фиксированном i. Поэтому, подставив в последние два неравенства реальные выборочные значения i и n, находим искомую оценку для объема генеральной совокупности как наименьшее значение параметра N, при котором целая часть от S(N,i) не превосходит n: ]S(N,i)[ ≤ n.
III. Численные эксперименты
Апробация предложенного автором подхода была проведена на том же материале, что и у А.Л. Пономарева – 149 актов Предоно, составленных в Пере с июня по октябрь 1281 года. Все они распадаются на несколько типов, наиболее часто встречающимся из которых является договор комменды [7]. Несмотря на однородность формуляра актов, идентификация упомянутых в них некоторых персоналий трудновыполнима. Так, довольно часто в актах упоминаются персоналии без указания фамилий, с одними именами или со схожими именами, как например Ogerius [2, с.89], Ogerinus [2, с.91]. И лишь дополнительное указание их профессии или должности (например, placerius peliparius) позволяет идентифицировать их как одно лицо. К тому же, весьма часто одно и то же лицо выступает в документах в разных ролях. Так, тот же Ogerius в одних договорах комменды выступает в качестве трактатора (accomendatarius, то есть партнера, получающего средства от коммендатора для ведения торговли в установленном месте), в других договорах – в роли свидетеля, а в актах завещания – в роли получателя по завещанию.
Решение подобной задачи идентификации было существенно облегчено созданием автором базы данных на Access (схему данных и структуру таблиц см. Приложение 2). Всего в актах было идентифицировано 447 персоналий, которые были упомянуты 866 раз (сюда включены и женщины). В то же время рабы, как объекты сделок купли/продажи, в рассмотрение не брались. Ниже приведен график частот упоминания отдельных персоналий, упорядоченный по неубыванию.
Рис. 1 Ранжированный ряд упоминаний персоналий в актах Предоно 1281 года
Первому рангу (максимальная частота – 68 упоминаний) соответствует одно лицо – нотарий Guglielmo Gandulfi, почти постоянно привлекавшийся в качестве свидетеля договора. Все остальные лица упоминаются существенно меньшее число раз, что приводит к существенной масштабируемости графика на рис.1. Для повышения наглядности ниже приводится тот же график, но без учета этой максимальной частоты:
Рис. 2 Ранжированный ряд упоминаний персоналий в актах Предоно 1281 года без первого ранга
Как мы видим, вторая по величине частота равна 16. Она соответствует меховщику Buongiovannino de S.Ambrogio, выступавшему и как свидетель и как сторона договора комменды (трактатор, коммендатор). Следующие по величине частоты (до 9 упоминаний) соответствуют восьми персоналиям, включая упомянутого Ogeriusа – меховщика и одновременно должностного лица консула. В общей сумме они упоминаются 82 раза. Остальные 437 персоналий упоминаются каждый от 8 до 1 раза.
Напомним, что необходимым условием применения предложенного подхода является случайность выборки (это значит, что частота упоминаний, рассматриваемая как случайная величина, имеет равномерное распределение). Простое визуальное наблюдение графика частот на обоих рисунках не позволяет с этим согласиться, что и подтверждается применением критерия χ2 (Пирсона).
Однако, если убрать из рассмотрения первые по частоте 10 персоналий (которые ранее нами были охарактеризованы), то с уровнем значимости 0,1 (то есть достаточно малой вероятностью, при которой событие уже можно считать неслучайным) данное распределение уже будет равномерным. Далее, после удаления указанных 10 элементов объем n выборки сокращается с 866 до 700, а число различных элементов i в ней становится равным 437 (вместо прежних 447). При этом рассчитанное по формуле значение χ2 статистики равно 448,6857, что меньше соответствующего квантиля, равного 475,2005 [8]. Все это позволяет перейти к оцениванию объема N генеральной совокупности. Обращаясь к таблице из Приложения 1, получаем: N=678+10=688. Понятно, что это является верхним значением. Так, если мы вернем в рассмотрение исключенные ранее первые 10 элементов и предположим чисто гипотетически, что выборка все же останется случайной, то получающаяся оценка для N становится только меньше (и равной 573).
Все это позволяет сделать вывод, что при заданном уровне значимости 0,1 число потенциальных клиентов генуэзских адвокатов Перы не превосходит величины, равной 688 человек. Довольно неожиданно, что это значение весьма близко результатам А.Л. Пономарева (645-650 купцов), полученным с помощью использования закона Ципфа, а не вероятностного подхода. Необходимо еще раз отметить, что все вышеперечисленные выводы справедливы лишь при условии, что все свои сделки купцы оформляют у нотариев, и выбор того или иного нотария равновероятен.
Приложение 1
Таблица значений функции ]S(i+j,i)[ для определения объема генеральной совокупности (округленные до целых значений функции обозначены квадратными скобками )
j
i
|
1
|
2
|
3
|
4
|
5
|
..
|
124
|
125
|
126
|
127
|
128
|
…
|
240
|
241
|
242
|
243
|
244
|
2
|
3
|
3
|
3
|
3
|
3
|
|
3
|
3
|
3
|
3
|
3
|
|
3
|
3
|
3
|
3
|
3
|
3
|
5
|
4
|
4
|
4
|
4
|
|
4
|
4
|
4
|
4
|
4
|
|
4
|
4
|
4
|
4
|
4
|
4
|
7
|
6
|
6
|
5
|
5
|
|
5
|
5
|
5
|
5
|
5
|
|
5
|
5
|
5
|
5
|
5
|
…
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
435
|
2352
|
2181
|
2061
|
1968
|
1893
|
|
840
|
838
|
836
|
834
|
832
|
|
697
|
696
|
696
|
695
|
694
|
436
|
2358
|
2187
|
2066
|
1974
|
1899
|
|
842
|
840
|
838
|
836
|
834
|
|
699
|
698
|
698
|
697
|
696
|
437
|
2365
|
2193
|
2072
|
1979
|
1904
|
|
845
|
843
|
841
|
839
|
837
|
|
701
|
700
|
700
|
699
|
698
|
438
|
2371
|
2199
|
2078
|
1985
|
1909
|
|
847
|
845
|
843
|
841
|
839
|
|
703
|
703
|
702
|
701
|
700
|
439
|
2377
|
2205
|
2083
|
1990
|
1915
|
|
850
|
848
|
846
|
844
|
842
|
|
705
|
705
|
704
|
703
|
702
|
440
|
2384
|
2211
|
2089
|
1996
|
1920
|
|
852
|
850
|
848
|
846
|
844
|
|
707
|
707
|
706
|
705
|
704
|
441
|
2390
|
2217
|
2095
|
2001
|
1925
|
|
855
|
853
|
851
|
849
|
847
|
|
709
|
709
|
708
|
707
|
706
|
442
|
2397
|
2223
|
2101
|
2007
|
1931
|
|
857
|
855
|
853
|
851
|
849
|
|
711
|
711
|
710
|
709
|
708
|
443
|
2403
|
2229
|
2106
|
2012
|
1936
|
|
860
|
858
|
856
|
854
|
852
|
|
714
|
713
|
712
|
711
|
710
|
444
|
2409
|
2235
|
2112
|
2018
|
1941
|
|
862
|
860
|
858
|
856
|
854
|
|
716
|
715
|
714
|
713
|
712
|
445
|
2416
|
2241
|
2118
|
2023
|
1947
|
|
865
|
863
|
861
|
859
|
857
|
|
718
|
717
|
716
|
715
|
714
|
446
|
2422
|
2247
|
2123
|
2029
|
1952
|
|
867
|
865
|
863
|
861
|
859
|
|
720
|
719
|
718
|
717
|
716
|
447
|
2429
|
2253
|
2129
|
2034
|
1957
|
|
870
|
868
|
866
|
864
|
862
|
|
722
|
721
|
720
|
719
|
719
|
448
|
2435
|
2259
|
2135
|
2040
|
1962
|
|
872
|
870
|
868
|
866
|
864
|
|
724
|
723
|
722
|
721
|
721
|
449
|
2441
|
2265
|
2141
|
2045
|
1968
|
|
875
|
873
|
871
|
869
|
867
|
|
726
|
725
|
724
|
723
|
723
|
450
|
2448
|
2271
|
2146
|
2051
|
1973
|
|
877
|
875
|
873
|
871
|
869
|
|
728
|
727
|
726
|
725
|
725
|
Искомый номер N определяется как сумма i и j0: N=i+j0, где i – номер строки, а j0 – номер первого столбца таблицы, при котором значение соответствующего элемента не превосходит n: ]S(N,i) ≤ n (i и n заданы).
Так, при i=437 и n=700 получаем j0=241 (соответствующий элемент выделен цветом). Отсюда N=678. Аналогично, при i=447 и n=866 получаем N=447+126=573.
Приложение 2
Схема данных и структура таблиц построенной базы данных по нотариальным актам Предоно 1281 года
References
1. Skrzhinskaya E.Ch. Genueztsy v Konstantinopole v XIV veke// Vizantiiskii Vremennik.– M., 1947. –Tom I (XXVII). – S.215-234;
2. Actes des notaires genoise de Pera et de Caffa de la fin de la treizieme siècle (1281-1290)/publies par Bratianu G.I. – Bucarest, 1927.– 381 P.;
3. Ponomarev A.L. Chislennost' kupechestva i ob''em torgovli genuezskoi kolonii v Pere v 1281 g. (po dannym kartulyariya Gabriele de Predono)// XVIII Mezhdunarodnyi kongress vizantinistov. Rezyume soobshchenii. Moskovskii gosudarstvennyi universitet im. M.V. Lomonosova 8-15 avgusta 1991 g.– M., 1991.– S. 913-914;
4. Feller V. Vvedenie v teoriyu veroyatnostei i ee prilozheniya.– M., 1964. – T.1. – 499 C.;
5. Ponomarev A.L. Kogo net, togo ne soschitat'? ili skol'ko v Vizantii bylo znati i kuptsov// Matematicheskie modeli istoricheskikh protsessov. — M., 1996. — S. 236—244;
6. Driml M., Ulrich M. Maximum likehood estimate of the number of types// Acta Technica ČSAV. Praha, 1967.–Vol.3.– pp.300-303;
7. Karpov S.P. Kontrakt kommendy v ital'yanskoi torgovle v Yuzhnom Prichernomor'e (XIII-XV vv.)// Vizantiiskii vremennik.– M., 1987. –Tom 48(73). –S.23-32;
8. Ivchenko G.I., Medvedev Yu.I. Vvedenie v matematicheskuyu statistiku.–.M., 2009. –S.577
|