Translate this page:
Please select your language to translate the article


You can just close the window to don't translate
Library
Your profile

Back to contents

Historical informatics
Reference:

To Count the Absent (or the Problem of the Total Number of Genoese Merchants in Byzantium)

Shpirko Sergey

Associate Professor, Moscow State Historical Archives Institute, Russian State University for the Humanities

119313, Russia, g. Moscow, ul. Leninskii Prospekt, 88 korpus 3, kv. 122

shpirkos@mail.ru
Other publications by this author
 

 

DOI:

10.7256/2585-7797.2021.2.36061

Received:

04-07-2021


Published:

13-07-2021


Abstract: The author develops a mathematical-statistical approach to the problem of estimating the size of Genoese medieval population in Byzantium. The data source is notarial acts covering commercial partnerships, freightage, wills, purchase and sale of houses, goods and people drawn up in the Genoese colony of Constantinople at the end of the 13th century. The will form has a fairly uniform structure. In addition to the mandatory record of names of the contracting parties and witnesses of the transaction, it may also register names of the third parties. Thus, these data on the clientele of Genoese notaries represent a dataset which may indirectly indicate the size of the entire trading Genoese community of Byzantium. This approach is based on a constructed formalized model that describes the behavior of merchants when visiting and concluding a transaction attested by a notary. This makes it possible to pass in a natural way from the initial to the statistical problem of estimating the size of a finite aggregate and use this mathematical theory for its calculation. In this case, the author applies the approach associated with the use of the maximum likelihood function that is a novelty. The resulting formula allows (with a certain degree of probability) one to estimate the required size of the Genoese population. It is interesting that this estimate, on the whole, coincides with the result of A.L. Ponomarev obtained earlier for the same problem using Zipf's empirical law.


Keywords:

Constantinople, Genoese, notarial acts, ranged series, statistical estimation, sample, size of a finite population, multinomial distribution, maximum likelihood estimation, Zipf’s law


I. Введение

Одной из интересных и захватывающих тем в исторических исследованиях является математическое, формализованное оценивание какого-либо неизвестного показателя по косвенным данным массовых источников. В частности, проблеме реконструкции численности генуэзской торговой общины в Византии посвящен ряд работ яркого, талантливого, но, к сожалению, рано ушедшего от нас историка Андрея Леонидовича Пономарева. Настоящая статья, можно сказать, подхватывает эту проблематику и предлагает для решения этой задачи использовать развитый математический аппарат статистического оценивания.

Вдохновленные Нимфейским договором 1261 года, генуэзцы, а если брать шире – жители Лигурийского побережья, развили уже к началу 1280-х годов в Византии бурную коммерческую деятельность, о чем красноречиво свидетельствуют многочисленные акты о торговых товариществах, наймах судов, завещаний, купли и продажи домов, товаров и людей. Один отрывок из хроники Никифора Григоры, относящийся, правда, к несколько более позднему времени, дает представление о масштабах деятельности генуэзской торговой общины: “их ежегодный доход от пошлин обратился, примерно, в 200 тысяч, а у византийцев он с трудом доходил до 30 тысяч”[1]. Вместе с тем ни один источник не говорит хотя бы приблизительно о численности этой общины. В связи с этой задачей А.Л. Пономарев привлекает опубликованные Г. Брэтиану в 1927 году акты в той их части, которые были составлены в 1281 году Габриэлем де Предоно, нотарием города Пера – генуэзской колонии напротив Константинополя [2].

Необходимо отметить, что далеко не все генуэзцы в Пере являлись клиентами Предоно. А те персоналии, которые упоминались в его актах, могли заключать сделки и у других нотариев. Несмотря на такую непростую картину, А.Л. Пономарев показывает как, зная частоты упоминания клиентов Предоно, можно оценить приблизительную численность клиентелы всех генуэских нотариев в Пере [3].

Для решения этой задачи реконструкции А.Л. Пономарев сначала строит формализованную вероятностную модель, описывающую поведение генуэзских купцов при заключении сделок и посещении нотария. Так, ученый представляет это как цепной процесс, в котором совершение очередной сделки у данного нотария обусловлено успешным совершением предыдущей у того же нотария. Другими словами, чем больше купец заключил сделок, тем больше вероятность что он заключит ее еще раз.

Учет указанных феноменов “успеха” и “склонности” А.Л. Пономарев проводит с помощью комбинации двух отрицательных биномиальных распределений [4, с.171-174], что позволяет получить формулу частоты упоминания различных персоналий в нотариальных актах Предоно. Отсюда ученый определяет и число персоналий, либо не упомянутых в его актах, либо совершавших сделки у других нотариев, либо вообще их не посещавших (общее число генуэзцев в Пере как 1786 против 507, упомянутых у Предоно). В то же время А.Л. Пономарев указывает и на недостаток предложенного подхода, заключающийся в необходимости учета дополнительного параметра–прогнозируемого числа генуэзцев, который строго не определяется.

В последующей своей статье ученый для описания зависимости между количеством упоминаний и числом купцов, отмеченных не менее, чем указанное число раз, предлагает использовать закон Ципфа, который весьма часто используется для анализа ранжированных рядов (например, частоты цитирования работ различных авторов) [5]. А.Л. Пономарев расширяет этот закон и на случай нулевого числа упоминаний, что приводит ученого к пересмотру прежней оценки численности купцов (645-650 человек).

Вместе с тем А.Л. Пономарев указывает и на один важный недостаток предложенного подхода – параметры закона Ципфа не имеют качественного наполнения, отчего этот закон описывает совокупность данных, но не объясняет их структуру. Для устранения этих недостатков при реконструкции общей численности автор настоящей статьи предлагает использовать новый подход, основанный на применении математического аппарата статистического оценивания.

II. Неформальное введение в статистическое оценивание объема конечной совокупности

Обозначим через N – число элементов (объем) генеральной совокупности, а через n – число элементов ее выборки. Будем считать (и это существенно!), что элементы попадают в выборку случайным образом, а затем возвращаются обратно в генеральную совокупность. Такая выборка называется выборкой с возвращением. То есть один и тот же элемент может встречаться в выборке несколько раз.

Интуитивно понятно, что чем чаще встречаются элементы в случайной выборке, чем меньше в ней число i различных элементов, тем правдоподобней выглядит гипотеза, что объем n выборки соразмерен с объемом N всей генеральной совокупности. На этом, по сути, и основана идея оценивания числа N. В данной статье автор следует подходу, основанному на применении принципа максимального правдоподобия [6]. Суть этого принципа состоит в предположении, что вся информация о выборке содержится в функции правдоподобия. В нашем случае эта функция представляет из себя формулу для совместной вероятности выборки, зависящей от N как от своего параметра. Подставляя в эту функцию реальные выборочные данные и максимизируя ее по параметру N, получаем наиболее “правдоподобную”, близкую к реальности величину объема генеральной совокупности.

Итак, исходя из нашего предположения о случайности выборки, вероятности оказаться в ней для каждого элемента генеральной совокупности одинаковы и равны 1/N. Наша задача состоит в оценивании величины N при условии, что число i различных элементов, оказавшихся в выборке объема n, известно. Вероятность того, что в выборке размера n первый элемент из генеральной совокупности содержится n1раз, второй элемент–n2 раза, …, последний – nN раза, носит название полиномиального распределения [4, с.174-175] и равна

1

где через n! обозначен факториал числа n: n=n(n-1)(n-2)..2·1, и n = n1+n2+..+nN.

Отсюда вероятность того, что ровно i различных элементов встретятся в выборке размера n равна

2

где через СNi обозначено число сочетаний из N по i: СNi=N!/(i! (N-i)!)), а через Σ – операция суммирования по всем наборам (n1,..,ni), таким, что nj>0 (j=1,2,..,i) и n1+n2+..ni=n, то есть все наборы состоят из положительных чисел, в сумме дающих величину n объема выборки.

Заметим, что в последней формуле от величины N зависят только первые два множителя. Поэтому для решения задачи максимизации функции правдоподобия достаточно ограничиться анализом функции f(N,n,i):

3

Максимальное значение эта функция в точке N0 принимает тогда и только тогда, когда выполняются два неравенства:

f(N0-1,n,i) ≤ f(N0,n,i) и f(N0,n,i) ≥ f(N0+1,n,i),

что эквивалентно выполнению двух неравенств с участием натуральных логарифмов ln:

ln N0 – ln(N0-i) ≥ n (ln N0 – ln(N0-1)) и ln(N0+1) - ln(N0-i+1) ≤ n (ln(N0+1) - ln N0).

Обозначив через S(N,i) функцию

4 ,

мы приходим к более простой записи предыдущих двух условий:

S(N0,i) nS(N0-1,i).

Отметим, что функция S(N,i) (таблица ее значений частично приведена в Приложении 1) убывает с ростом N при фиксированном i. Поэтому, подставив в последние два неравенства реальные выборочные значения i и n, находим искомую оценку для объема генеральной совокупности как наименьшее значение параметра N, при котором целая часть от S(N,i) не превосходит n: ]S(N,i)[ n.

III. Численные эксперименты

Апробация предложенного автором подхода была проведена на том же материале, что и у А.Л. Пономарева – 149 актов Предоно, составленных в Пере с июня по октябрь 1281 года. Все они распадаются на несколько типов, наиболее часто встречающимся из которых является договор комменды [7]. Несмотря на однородность формуляра актов, идентификация упомянутых в них некоторых персоналий трудновыполнима. Так, довольно часто в актах упоминаются персоналии без указания фамилий, с одними именами или со схожими именами, как например Ogerius [2, с.89], Ogerinus [2, с.91]. И лишь дополнительное указание их профессии или должности (например, placerius peliparius) позволяет идентифицировать их как одно лицо. К тому же, весьма часто одно и то же лицо выступает в документах в разных ролях. Так, тот же Ogerius в одних договорах комменды выступает в качестве трактатора (accomendatarius, то есть партнера, получающего средства от коммендатора для ведения торговли в установленном месте), в других договорах – в роли свидетеля, а в актах завещания – в роли получателя по завещанию.

Решение подобной задачи идентификации было существенно облегчено созданием автором базы данных на Access (схему данных и структуру таблиц см. Приложение 2). Всего в актах было идентифицировано 447 персоналий, которые были упомянуты 866 раз (сюда включены и женщины). В то же время рабы, как объекты сделок купли/продажи, в рассмотрение не брались. Ниже приведен график частот упоминания отдельных персоналий, упорядоченный по неубыванию.

1_01

Рис. 1 Ранжированный ряд упоминаний персоналий в актах Предоно 1281 года

Первому рангу (максимальная частота – 68 упоминаний) соответствует одно лицо – нотарий Guglielmo Gandulfi, почти постоянно привлекавшийся в качестве свидетеля договора. Все остальные лица упоминаются существенно меньшее число раз, что приводит к существенной масштабируемости графика на рис.1. Для повышения наглядности ниже приводится тот же график, но без учета этой максимальной частоты:

Рис. 2 Ранжированный ряд упоминаний персоналий в актах Предоно 1281 года без первого ранга

Как мы видим, вторая по величине частота равна 16. Она соответствует меховщику Buongiovannino de S.Ambrogio, выступавшему и как свидетель и как сторона договора комменды (трактатор, коммендатор). Следующие по величине частоты (до 9 упоминаний) соответствуют восьми персоналиям, включая упомянутого Ogeriusа – меховщика и одновременно должностного лица консула. В общей сумме они упоминаются 82 раза. Остальные 437 персоналий упоминаются каждый от 8 до 1 раза.

Напомним, что необходимым условием применения предложенного подхода является случайность выборки (это значит, что частота упоминаний, рассматриваемая как случайная величина, имеет равномерное распределение). Простое визуальное наблюдение графика частот на обоих рисунках не позволяет с этим согласиться, что и подтверждается применением критерия χ2 (Пирсона).

Однако, если убрать из рассмотрения первые по частоте 10 персоналий (которые ранее нами были охарактеризованы), то с уровнем значимости 0,1 (то есть достаточно малой вероятностью, при которой событие уже можно считать неслучайным) данное распределение уже будет равномерным. Далее, после удаления указанных 10 элементов объем n выборки сокращается с 866 до 700, а число различных элементов i в ней становится равным 437 (вместо прежних 447). При этом рассчитанное по формуле значение χ2 статистики равно 448,6857, что меньше соответствующего квантиля, равного 475,2005 [8]. Все это позволяет перейти к оцениванию объема N генеральной совокупности. Обращаясь к таблице из Приложения 1, получаем: N=678+10=688. Понятно, что это является верхним значением. Так, если мы вернем в рассмотрение исключенные ранее первые 10 элементов и предположим чисто гипотетически, что выборка все же останется случайной, то получающаяся оценка для N становится только меньше (и равной 573).

Все это позволяет сделать вывод, что при заданном уровне значимости 0,1 число потенциальных клиентов генуэзских адвокатов Перы не превосходит величины, равной 688 человек. Довольно неожиданно, что это значение весьма близко результатам А.Л. Пономарева (645-650 купцов), полученным с помощью использования закона Ципфа, а не вероятностного подхода. Необходимо еще раз отметить, что все вышеперечисленные выводы справедливы лишь при условии, что все свои сделки купцы оформляют у нотариев, и выбор того или иного нотария равновероятен.

Приложение 1

Таблица значений функции ]S(i+j,i)[ для определения объема генеральной совокупности (округленные до целых значений функции обозначены квадратными скобками )

j

i

1

2

3

4

5

..

124

125

126

127

128

240

241

242

243

244

2

3

3

3

3

3

3

3

3

3

3

3

3

3

3

3

3

5

4

4

4

4

4

4

4

4

4

4

4

4

4

4

4

7

6

6

5

5

5

5

5

5

5

5

5

5

5

5

435

2352

2181

2061

1968

1893

840

838

836

834

832

697

696

696

695

694

436

2358

2187

2066

1974

1899

842

840

838

836

834

699

698

698

697

696

437

2365

2193

2072

1979

1904

845

843

841

839

837

701

700

700

699

698

438

2371

2199

2078

1985

1909

847

845

843

841

839

703

703

702

701

700

439

2377

2205

2083

1990

1915

850

848

846

844

842

705

705

704

703

702

440

2384

2211

2089

1996

1920

852

850

848

846

844

707

707

706

705

704

441

2390

2217

2095

2001

1925

855

853

851

849

847

709

709

708

707

706

442

2397

2223

2101

2007

1931

857

855

853

851

849

711

711

710

709

708

443

2403

2229

2106

2012

1936

860

858

856

854

852

714

713

712

711

710

444

2409

2235

2112

2018

1941

862

860

858

856

854

716

715

714

713

712

445

2416

2241

2118

2023

1947

865

863

861

859

857

718

717

716

715

714

446

2422

2247

2123

2029

1952

867

865

863

861

859

720

719

718

717

716

447

2429

2253

2129

2034

1957

870

868

866

864

862

722

721

720

719

719

448

2435

2259

2135

2040

1962

872

870

868

866

864

724

723

722

721

721

449

2441

2265

2141

2045

1968

875

873

871

869

867

726

725

724

723

723

450

2448

2271

2146

2051

1973

877

875

873

871

869

728

727

726

725

725

Искомый номер N определяется как сумма i и j0: N=i+j0, где i – номер строки, а j0 – номер первого столбца таблицы, при котором значение соответствующего элемента не превосходит n: ]S(N,i) n (i и n заданы).

Так, при i=437 и n=700 получаем j0=241 (соответствующий элемент выделен цветом). Отсюда N=678. Аналогично, при i=447 и n=866 получаем N=447+126=573.

Приложение 2

Схема данных и структура таблиц построенной базы данных по нотариальным актам Предоно 1281 года

_

References
1. Skrzhinskaya E.Ch. Genueztsy v Konstantinopole v XIV veke// Vizantiiskii Vremennik.– M., 1947. –Tom I (XXVII). – S.215-234;
2. Actes des notaires genoise de Pera et de Caffa de la fin de la treizieme siècle (1281-1290)/publies par Bratianu G.I. – Bucarest, 1927.– 381 P.;
3. Ponomarev A.L. Chislennost' kupechestva i ob''em torgovli genuezskoi kolonii v Pere v 1281 g. (po dannym kartulyariya Gabriele de Predono)// XVIII Mezhdunarodnyi kongress vizantinistov. Rezyume soobshchenii. Moskovskii gosudarstvennyi universitet im. M.V. Lomonosova 8-15 avgusta 1991 g.– M., 1991.– S. 913-914;
4. Feller V. Vvedenie v teoriyu veroyatnostei i ee prilozheniya.– M., 1964. – T.1. – 499 C.;
5. Ponomarev A.L. Kogo net, togo ne soschitat'? ili skol'ko v Vizantii bylo znati i kuptsov// Matematicheskie modeli istoricheskikh protsessov. — M., 1996. — S. 236—244;
6. Driml M., Ulrich M. Maximum likehood estimate of the number of types// Acta Technica ČSAV. Praha, 1967.–Vol.3.– pp.300-303;
7. Karpov S.P. Kontrakt kommendy v ital'yanskoi torgovle v Yuzhnom Prichernomor'e (XIII-XV vv.)// Vizantiiskii vremennik.– M., 1987. –Tom 48(73). –S.23-32;
8. Ivchenko G.I., Medvedev Yu.I. Vvedenie v matematicheskuyu statistiku.–.M., 2009. –S.577