DOI: 10.7256/2585-7797.2021.3.35971
Received:
20-06-2021
Published:
28-07-2021
Abstract:
The article studies the issues of information visualization to demonstrate the results of historical research. It shows how MS Excel and Tableau Public Desktop Edition software can be used to visualize data and generate ideas on the basis of big data sets as well as facilitate the process of scientific research. This software can be used to show data in the form of tables, graphs, and charts helping to present information on the Russian Empire’s court activity. This is the so-called presentation method of visualization which is introductory in its nature and focuses on the audience for which the report is performed. The research is based on statistics of the Ministry of Justice of the Russian Empire and archival data for the period from the second half of the 19th century to the first quarter of the 20th century. It is concluded that today’s level of computing equipment allows researchers to have modern software tools at hand that provide for demonstrating results of their research at conferences, lectures, in dissertations, etc. The article can be used at scientific-methodical seminars of the departments, at professional development courses for teachers as well as to teach undergraduates and graduate students to present the research results.
Keywords:
data visualization, judicial chamber, MS Excel, Tableau Public Desktop, pivot table, radial chart, combination chart, bubbles chart, graph, data filtering
Различные методы визуализации помогают наглядно представить информацию, способствуют выявлению закономерностей в большом массиве данных. Вычленить важное для определенной ситуации — одна из первейших задач исследователя. Метод визуализации — это систематизированное, основанное на правилах динамическое или статическое графическое представление информации, способствующее появлению новых идей, помогающее разобраться в сложных понятиях, нацеленное на обобщение, анализ теории и опыта [2].
Не вдаваясь в классификацию методов и способов визуализации, достаточно широко освещенную в многочисленных источниках, покажем возможности использования современных программных средств для демонстрации итогов исторических исследований, что и является целью данной работы.
Историческая информация, как правило, изобилует сплошным текстом с большим количеством иллюстраций, схем, архивных документов и т. п. Согласимся с мнением П. В. Горы: наглядность служит опорой глубокого понимания сущности исторических событий и явлений, эффективным способом формирования важнейших исторических понятий [8].
Согласно эталонной модели процесса визуализации, она строится путем преобразования сырых (необработанных) данных сначала в таблицы, затем в визуальные структуры и, наконец, в итоговое представление [1].
Таблицы данных
Таблицы составляют для систематизации цифровых или текстовых материалов и установления взаимосвязи между ними, а также для наглядности и удобства сравнения различных показателей. Таблицы, представленные в мультимедийной презентации докладчика, могут сопровождать его подробное сообщение. Так, развернутый доклад, демонстрирующий различия почетных и участковых мировых судей в Российской империи [5, с. 13], можно подкрепить соответствующей таблицей (табл. 1), которая может быть создана как в MS Word, так и в MS Excel и дальше сопровождаться комментариями. Это один из простейших способов использования таблиц, однако умение переводить словесную информацию в табличный вид является показателем информационной культуры человека на этапе обработки информации [13, с. 97].
Таблица 1
Некоторые различия почетных и участковых мировых судей в Российской империи
Показатель
|
Почетный мировой судья
|
Участковый мировой судья
|
Оплата должности
|
–
|
+
|
Возможность занимать иную государственную или общественную должность
|
+
|
–
|
Пределы исполнения обязанностей
|
территория всего судебно-мирового округа
|
отведенный судебный участок
|
Начало производства дела
|
по заявлению обеих сторон
|
по заявлению одной из сторон
|
Приглашение в окружной суд для участия в его заседаниях
|
–
|
+
|
Взаимозаменяемость
|
замещали участковых судей
|
не замещали почетных судей
|
Сводные таблицы — неотъемлемый инструмент для анализа данных. Несмотря на большую распространенность использования сводных таблиц, создаваемых в MS Excel, в различных сферах, исследователи-историки практически не применяют этот инструмент, хотя он может быть полезен при разборе сложных таблиц, при необходимости агрегирования показателей, выборки уникальных значений. Сводные таблицы обладают свойством интерактивности, поскольку можно менять их структуру, изменяя порядок столбцов, переупорядочивать информацию, выполнять группировку, фильтрацию данных. В итоге все это позволяет получить компактные и удобные для работы таблицы, не содержащие избыточной информации.
Рассмотрим использование сводных таблиц на примере статистических сведений за 1908 г. о составе судебных палат Европейской и Азиатской России [19, 20]. В сборниках представлены сведения в виде табличных данных по 11 округам судебных палат Европейской России и 3 округам Азиатской России. В свою очередь, в составе каждого судебного округа показаны окружные суды (рис. 1 и 2).
Рис. 1. Состав судебных палат Европейской России
Рис. 2. Состав судебных палат Азиатской России
Информация об окружных судах Европейской России в первоисточнике занимает 11 страниц [19, с. 1–11], о судах азиатской части — 2 страницы [20, с. 5–6]. Объединив таблицы в MS Excel, мы получили 106 строк одного рабочего листа. Для еще более удобного представления данных и дальнейшего анализа все это можно организовать в одной сводной таблице и демонстрировать сравнение путем определенных действий.
Так, на рис. 3 в свернутом виде показана информация о личном составе судебных палат, занимающая 18 строк в свернутом виде, которую можно посмотреть и развернуто (рис. 4). При этом происходит автоматическое упорядочивание по алфавиту, суммирование данных по каждому судебному округу и в конце в целом по всем округам.
Рис. 3. Сводная таблица с информацией о составе судебных палат Европейской и Азиатской России
Рис. 4. Сводная таблица с информацией о составе судебных палат Европейской и Азиатской России в свернутом и развернутом виде
Добавив фильтр, можно посмотреть данные по определенным судебным округам или окружным судам. Так, на рис. 5 показана информация о личном составе окружных судов Казанского судебного округа. Кроме того, можно сделать выбор по нескольким элементам (рис. 6).
Рис. 5. Сводная таблица с фильтром
Рис. 6. Сводная таблица с фильтром по нескольким элементам
Добавив столбцы с названиями Европейская Россия и Азиатская Россия, можно выполнять фильтрацию по соответствующим элементам.
Таким образом, созданные таблицы в MS Excel помогут находить, сравнивать и выбирать нужные данные и анализировать их.
Диаграммы MS Excel
Диаграмма (от греч. Διάγραμμα (diagramma) — изображение, рисунок, чертёж) — графическое изображение, наглядно показывающее линейными отрезками или геометрическими фигурами соотношение между разными величинами [6].
Линейные графики, столбчатые и круговые диаграммы являются ранними формами визуализации [17, с. 162]. Графики можно найти в исторических изданиях разного периода. Так, в издании 1899 г. «Итоги русской уголовной статистики за 20 лет (1874–1894 гг.)», где приводятся статистические данные о подсудимых и осужденных общими и мировыми судами, в приложении под названием «Диаграммы и картограммы» имеется графическое представление данных об «общем движении преступности» в пределах 33 губерний Европейской России, а также о «движении главнейших видов преступности» в сравнении с ростом населения [11]. В работе [4] можно найти прообразы современных гистограмм, датированные 1910 г., показывающие количество населения и количество дел, приходящихся на одного адвоката, по округам судебных палат России.
Графики и диаграммы используют, так как на них порой видны нюансы, которые трудно заметить, глядя только в таблицы данных.
Рассмотрим таблицу 2, данные которой способствуют анализу судебной активности по мировым округам Бессарабской губернии [7].
Таблица 2
Количество гражданских дел на 1 тыс. чел., поступивших в суды мировых округов Бессарабской губернии в 1885 г., в сопоставлении с долей городского населения
Мировой округ
|
Численность населения, тыс. чел.
|
Поступило гражданских дел
|
Количество гражданских дел на 1 тыс. чел.
|
Доля городского населения, %
|
Доля населения вне юрисдикции сословных судов, 1880 г., %
|
Аккерманский
|
221,9
|
3467
|
15
|
21,1
|
30,4
|
Бендерский
|
165,3
|
3139
|
19
|
16,2
|
28
|
Измаильский
|
181,4
|
6981
|
38
|
23,3
|
100
|
Кишиневский
|
252,3
|
8238
|
32
|
45,3
|
51,2
|
Оргеевский
|
160,5
|
11901
|
74
|
3,9
|
22,2
|
Сорокский
|
164,6
|
5401
|
32
|
4,6
|
17
|
Хотинский
|
233,9
|
4041
|
17
|
6,7
|
22,5
|
Ясский
|
1465
|
4388
|
30
|
6,1
|
16,2
|
Покажем, как данные этой таблицы можно визуализировать с помощью различных типов диаграмм в программе MS Excel и подвергнуть дальнейшему анализу. Отметим, что данная таблица отсортирована в алфавитном порядке мировых округов.
Для оценки количества населения можно воспользоваться круговой диаграммой, которая покажет общую картину численности, а также долю населения каждого мирового округа относительно всей численности населения Бессарабии. Отметим, что последний показатель в таблице отсутствует (рис. 7). На диаграмме отчетливо выделяется Ясский уезд с населением, составляющим 51,5 %. Численность населения остальных округов приблизительно одинаковая и колеблется в пределах от 5,64 до 8,87 % от общего числа проживающих в Бессарабии.
Рис. 7. Круговая диаграмма с численностью населения по мировым округам Бессарабской губернии
Исследователей могут заинтересовать следующие вопросы: как соотносятся численность населения и количество гражданских дел, повлияла ли большая численность населения Ясского уезда на увеличение количества рассматриваемых дел. Для получения ответов можно воспользоваться диаграммой, в которой используется вспомогательная (промежуточная) ось (рис. 8). Введение вспомогательной оси необходимо в связи с тем, что два столбца имеют несоразмерные величины.
Рис. 8. Сравнение численности населения и количества дел по мировым округам Бессарабской губернии
В данном случае анализ показывает, что Оргеевский уезд, имея самую маленькую численность населения, дал самое большое количество дел на 1 тыс. населения, а самый большой уезд, Ясский, показал малое количество дел.
Поскольку данные исходной таблицы нацелены в первую очередь на рассмотрение количества гражданских дел, поступивших в суды мировых округов, для удобства может быть построена гистограмма, дающая сравнение по этому показателю (рис. 9).
Рис. 9. Количество гражданских дел на 1 тыс. человек по мировым округам Бессарабской губернии
Диаграмма наглядно показывает, что мировой округ Оргеевского уезда по количеству поступивших в 1885 г. в мировые суды гражданских дел в расчете на 1 тыс. чел. (74 дела) занимал первое место среди 8 мировых округов Бессарабии. В целом же общее лидерство Бессарабии по обращению к мировой юстиции обеспечивали, в первую очередь, суды центральной части Бессарабии: Оргеевского, Сорокского, Кишиневского уездов, а также южного Измаильского уезда.
Далее покажем соотношение количества обращений в мировые суды на душу населения и доли городского населения. В этом может помочь комбинированная диаграмма (гистограмма + график), в которой используется вспомогательная ось (рис. 10). Введение вспомогательной оси необходимо в связи с тем, что оцениваемые показатели имеют разные единицы измерения: количество и проценты.
Рис. 10. Количество гражданских дел и доля городского населения по мировым округам Бессарабской губернии
Однако по этой диаграмме невозможно судить о соотношении интересующих нас величин. Она оказалась малоинформативной, но при этом натолкнула нас на мысль о необходимости построения линии тренда для оценки количества обращений в мировые суды и доли городского населения. Данная зависимость (рис. 11) показала, что увеличение доли городского населения не вело к увеличению количества гражданских дел.
Рис. 11. Оценка соотношения количества обращений в мировые суды и доли городского населения
Рассмотрим возможности анализа данных исторических исследований с использованием лепестковой диаграммы. Лепестковая диаграмма представляет значения каждой категории вдоль отдельной оси, которая начинается в центре диаграммы и заканчивается на внешнем кольце. В результате построения обычно получается криволинейный многоугольник. Лепестковая диаграмма используется, когда надо оценить позиции сразу по нескольким параметрам или критериям [15]. За основу будет взята таблица «Статистика подсудимых и осужденных в 1911–1912 гг. окружными судами и судебными палатами по роду преступлений», представленная в работе [9]. Предположим, что нужно проанализировать часть этой таблицы, приведенную на рис. 12. В таблице имеются сведения по 39 видам преступлений и проступков.
Рис. 12. Статистика подсудимых и осужденных в 1911–1912 гг.
Пусть необходимо из всех преступлений и проступков рассмотреть те, число подсудимых по которым лежит в пределах от 100 до 1000 чел. Для этого необходимо скопировать исходную таблицу в Excel и сделать фильтрацию данных с помощью команды Числовые фильтры… (рис. 13). В результате отбора останется 13 записей из 39.
Рис. 13. Фильтрация данных в MS Excel
Далее строится лепестковая диаграмма, в которой для удобства анализа для одного ряда данных можно оставить ее стандартный тип, а для другого изменить на Заполненная лепестковая (рис. 14). В итоге получится наглядное представление в удобной форме для сравнения определенных тенденций. Так, на построенной диаграмме можно легко увидеть, что в 1912 г. было совершено больше преступлений и проступков, чем в 1911 г., всех видов, кроме трех: подделки монеты; преступления против народного здравия и общественного продовольствия; нарушение уставов фабричной и заводской промышленности. Количество таких зафиксированных преступлений, как святотатство и разрытие могил и другие преступления против общества, спокойствия и личной безопасности, осталось на том же уровне.
Также лепестковая диаграмма позволяет сравнивать совокупные значения нескольких рядов данных. На рис. 14 видно, что в целом количество преступлений в 1912 г. было больше по сравнению с 1911 г., т. к. площадь фигуры для рада данных 1912 г. на диаграмме является большей. Такой оценке способствовала замена для ряда 1912 г. типа диаграммы Лепестковая на Заполненная лепестковая.
Рис. 14. Лепестковая диаграмма по статистике подсудимых в 1911 и 1912 гг.
Tableau Public
В последние годы произошел качественный скачок в возможностях инструментов визуальной аналитики. За счет простоты интерфейсов, проработки структуры и способов визуализации информации разработчики, предоставляя бесплатно клиентские версии своих платформ, дают возможность специалистам разных областей самостоятельно провести сложный визуальный анализ данных и поделиться его результатами с коллегами. В комплексе это приводит к серьезному расширению числа пользователей, способных без привлечения IT-специалистов проводить анализ данных и получать практически полезные результаты [3, 12]. К таким программам относится и Tableau Public Desktop (далее — Tableau) [16], с помощью которой несложно проводить сравнительный анализ одновременно по нескольким показателям. Используя возможности Tableau, можно привязать те или иные данные к карте местности. К этой программе для анализа данных обращаются в том числе представители исторических наук [18].
После запуска Tableau и подключения файла Excel в окне программы появится таблица, подлежащая анализу (рис. 15). Используя Excel-вариант таблицы «Статистика подсудимых и осужденных в 1911–1912 гг. окружными судами и судебными палатами по роду преступлений» (рис. 12), покажем возможные визуализации.
Рис. 15. Окно программы Tableau Public Desktop Edition с загруженной таблицей
Переключившись с ярлыка Data Source на ярлык Sheet 1, можно выбрать нужные опции программы для демонстрации необходимых данных. Tableau автоматически оценивает выбранные поля и в разделе Show me дает возможность выбора нескольких типов представлений, подходящих для этих полей. Так, на рис. 16 показано сравнение 1911 и 1912 гг. по видам преступлений, доступное в виде линейчатой гистограммы (horizontal bars). Наведя указатель мыши на интересующую категорию, можно увидеть численное значение в виде всплывающей подсказки (tooltip).
Рис. 16. Линейчатая гистограмма (horizontal bars)
Отсортировав данные в порядке убывания или возрастания одного из полей, можно сразу же наблюдать изменения на диаграммах, анализируя при этом число преступлений и сравнивая с количеством осужденных по каждой категории преступлений и проступков (рис. 17).
Рис. 17. Линейчатая гистограмма после сортировки данных по одному из полей
В программе можно мгновенно переключаться от одного вида визуализации к другому. Так, изменив представление с horizontal bars на packed bubbles, получим пузырьковую диаграмму в виде группы кругов различных оттенков, наглядно показывающую относительные объемы разных преступлений без учета осей (рис. 18). Пузырьки упакованы максимально плотно, чтобы эффективно использовать пространство. Здесь также можно увидеть всплывающую подсказку.
Рис. 18. Пузырьковая диаграмма (packed bubbles)
Еще одним визуально привлекательным форматом, похожим на пузырьковую диаграмму, является древовидная карта (treemap), которая используется для представления данных во вложенных прямоугольниках (рис. 19). Здесь также по насыщенности цвета можно судить о количестве преступлений разных типов.
Рис. 19. Древовидная карта (treemap)
Интерес представляет такой вид визуализации, как маркированный график (bullet graphs), называемый еще «пулевая диаграмма» [12, 20]. Он полезен для сравнения рассматриваемой величины с одной или несколькими другими путем наложения цветовых линий друг на друга. На рис. 20 приведен график, показывающий количество фактически осужденных по сравнению с общим числом подсудимых по конкретной категории преступлений. Такой график можно сделать и в Excel, однако в силу того, что соответствующий тип диаграмм в табличном процессоре отсутствует, нужно для получения требуемого результата сделать ряд форматирований линейчатой диаграммы.
Рис. 20. Маркированный график (bullet graphs)
Сделанный обзор типов визуализаций не претендует на всю полноту описания возможностей программы Tableau Public Desktop Edition в силу ограничений на объем статьи, однако дает представление об особенностях ее использования при демонстрации данных.
Заключение
Развитие компьютерной индустрии и современные тенденции накопления информации в различных областях деятельности человека будут и дальше способствовать распространению, изучению и внедрению систем визуализации в целях обеспечения обзора и поиска информации, формирования идей. При сегодняшнем уровне оснащенности вычислительной техникой исследователи могут иметь под рукой современные программные средства, которые позволят демонстрировать результаты своих исследований на конференциях, на лекциях, при защите диссертаций и т. д. Такие программы, как MS Excel и Tableau Public Desktop Edition, могут этому содействовать за счет доступности, понятности интерфейсов, разнообразию своих возможностей.
References
1. Card S. K., Mackinlay J. D., Shneiderman B. Readings in information visualization: using vision to think. — Morgan Kaufmann Publishers, 1999. — 686 p.
2. Lengler R., Eppler M. J. Towards A Periodic Table of Visualization Methods for Management. — URL: https://www.visual-literacy.org/periodic_table/periodic_table.pdf
3. Tableau Desktop and Web Authoring Help. Version: 2021.1. — URL: https://help.tableau.com/current/pro/desktop/en-gb/default.htm (data obrashcheniya: 17.06.2021).
4. Administrativno-sudebnaya sistema Vostochnoi Sibiri kontsa XIX — nachala XX veka v litsakh i dokumentakh : materialy k entsiklopedii / sost. V. G. Vishnevskii. — Irkutsk : Izdanie OAO «Irkutskaya oblastnaya tipografiya № 1 im. V. M. Posokhina», 2004. — 400 s.
5. Bol'shakova V. M. Sravnitel'no-pravovoi analiz instituta mirovykh sudei v Rossiiskoi imperii i Rossiiskoi Federatsii // Voprosy rossiiskogo i mezhdunarodnogo prava. — 2019. — T. 9. — № 7–1. — S. 7–17.
6. Bol'shaya sovetskaya entsiklopediya : v 30 t. / gl. red. A. M. Prokhorov. — M. : Sov. entsikl., 1970–1981.
7. Vernyaev I. I. Mirovaya yustitsiya v Bessarabskoi gubernii: sravnitel'nyi analiz v imperskom kontekste // Vestnik Tomskogo gosudarstvennogo universiteta. Istoriya. — 2020. — № 63. — S. 5–15.
8. Gora P. V. Metodicheskie priemy i sredstva naglyadnogo obucheniya istorii v srednei shkole. — M. : Prosveshchenie, 1971. — 239 s.
9. Zheltova V. P. Statistika prestupnosti. — URL: https://istmat.info/node/244 (data obrashcheniya: 24.05.2021).
10. Iskakova N. A. Infografika na urokakh vsemirnoi istorii kak instrument razvitiya navyka orientatsii vo vremeni i prostranstve / N. A. Iskakova. — Tekst : neposredstvennyi // Pedagogicheskoe masterstvo : materialy XI Mezhdunar. nauch. konf. (g. Kazan', dekabr' 2019 g.). — Kazan' : Molodoi uchenyi, 2019. — S. 46–50. — URL: https://moluch.ru/conf/ped/archive/351/15442/ (data obrashcheniya: 24.05.2021).
11. Itogi russkoi ugolovnoi statistiki za 20 let (1874–1894 gg.). — URL: https://rusneb.ru/catalog/000199_000009_003555653/ (data obrashcheniya: 24.05.2021).
12. Mamaev I. I., Sakhnyuk T. I., Sakhnyuk P. A. Analiz zagryazneniya atmosfernogo vozdukha v regionakh Severo-Kavkazskogo federal'nogo okruga metodami vizual'noi analitiki Tableau Public 9.0 // Politematicheskii setevoi elektronnyi nauchnyi zhurnal Kubanskogo gosudarstvennogo agrarnogo universiteta. — 2015. — № 113. — S. 317–328.
13. Mikhaelis S. I. Aktivizatsiya formirovaniya informatsionnoi kul'tury studentov v protsesse samostoyatel'noi uchebnoi deyatel'nosti : dis. kand. ped. n.: 13.00.01 / S. I. Mikhaelis. — Ulan-Ude, 2006. — 201 s.
14. Mikhaelis S. I. Metodicheskaya razrabotka po teme «Sozdanie pulevoi diagrammy» // Modern Science. — 2021. — № 2–2. — S. 398–410.
15. Mikhaelis S. I., Mikhaelis V. V. Vozmozhnosti MS Excel dlya vizualizatsii dannykh v upravlenii personalom // Pedagogicheskaya informatika. — 2021. — № 1. — S. 113–120.
16. Novaya versiya Tableau 2020.4. — URL: https://analytikaplus.ru/novaya-versiya-tableau-2020-4/ (data obrashcheniya: 16.06.2021).
17. Peskova O. V. O vizualizatsii informatsii // Vestnik Moskovskogo gosudarstvennogo tekhnicheskogo universiteta im. N.E. Baumana. — 2012.— № 1 (1). — S. 158.
18. Pil'gun M. A. Reprezentatsiya istoricheskikh sobytii v yazykovom soznanii: 1917 god // Voprosy psikholingvistiki. — 2016. — № 29. — S. 241–258.
19. Sbornik statisticheskikh svedenii Ministerstva yustitsii. Vypusk 24. Chast' pervaya. Svedeniya o lichnom sostave i o deyatel'nosti sudebnykh ustanovlenii evropeiskoi Rossii za 1908 g. — S.-Peterburg : Senatskaya tipografiya, 1910. — URL: https://rusneb.ru/catalog/000199_000009_004990822/
20. Sbornik statisticheskikh svedenii Ministerstva yustitsii. Vypusk 24. Chast' vtoraya. Svedeniya o lichnom sostave i o deyatel'nosti sudebnykh ustanovlenii evropeiskoi Rossii za 1908 g. — S.-Peterburg : Senatskaya tipografiya, 1910. — URL: https://rusneb.ru/catalog/000199_000009_004990837
|