Translate this page:
Please select your language to translate the article


You can just close the window to don't translate
Library
Your profile

Back to contents

Historical informatics
Reference:

Digital History, Digital Historical Sources and Criticism: Review of “What is Digital History?”
by Hannu Salmi

Povroznik Nadezhda

PhD in History

Associate professor, the Department of Interdisciplinary Historical Research, Perm State University 

614990, Russia, Permskii krai, g. Perm', ul. Bukireva, 15

povroznik.ng@gmail.com
Other publications by this author
 

 

DOI:

10.7256/2585-7797.2021.1.35282

Received:

20-03-2021


Published:

17-05-2021


Abstract: The article is a review of the book “What is Digital History?” by Salmi H. which discusses digital history, a new field in history, and defines its framework. The review considers a range of issues related to digital sources, their typology, approaches to the formation of the source base and their criticism. The article analyzes the author’s attitude to digitized historical sources based on original analogous sources and born-digital ones as well as methods of their processing used by contemporary historians. These aspects have a direct impact on present day historical research and must be taken into account by historians. The review also addresses the author's views on epistemology and hermeneutics which are increasingly important in the digital age.  The topics named are unevenly distributed in the book. Sources of a new type are considered in detail in the chapter “The Digital Past: Sources and Problems”. Other issues are studied in the rest of chapters and in less detail. The review is complemented with examples of other projects and modern publications that were not included in the text of the reviewed book, but are essential for the topic as a whole.


Keywords:

digital history, source criticism, hermeneutics, epistemology, digitization, digitalization, born-digital resources, big data, research methods, digital criticism


Цифровая история как дисциплина только начинает свое оформление, что отражается на разнообразии подходов, определяющих ее содержание. Книга Ханну Салми “ What is Digital History?” призвана дать обзор цифровой истории как дисциплины, области знания или исторической практики. Данная рецензия охватывает не все содержание книги, а только фокус, касающийся рассмотрения исторических источников в электронном формате и их критики. Критические подходы к источникам, методы работы с ними и философский критицизм, связанный с получением исторического знания как такового не артикулированы в отдельной главе, а скорее распределены по всем главам книги, показаны в разных прикладных плоскостях. Рассмотрим кратко взгляд автора на обозначенные вопросы.

Развитие цифровой истории автор книги связывает с процессами оцифровки историко-культурного наследия и все расширяющейся публикацией исторических источников в электронном формате, что описывается в главе TheDigitalPast: SourcesandProblems [1, с. 9-28]. Говоря об исторических источниках в электронной форме, Х. Салми показывает разницу между оцифрованными источниками и историческими источниками, созданными изначально в цифровой форме. По мнению автора, эти два типа источников имеют существенную разницу, которая должна учитываться исследователями на всех этапах работы с этими источниками. Автор указывает, что ввиду разной природы источников должны использоваться разные методы, подходящие для источников конкретного типа. Поскольку оцифрованные источники являются, по сути, копией аналогового источника, и в процессе оцифровки неизбежно теряется часть информации, то историки, работающие с электронными копиями источников, имеют дело с их постоянной неполнотой [1, с. 11]. Несовершенство технологий для извлечения всей источниковой информации, а также постоянное изменение применяемых инструментов, приводят к тому, что оцифровка культурного наследия становится перманетной, представляя собой бесконечный процесс. Х. Салми задает важный вопрос о том, можно ли в таких условиях быть уверенным, что культурное наследие надежно сохранено для будущих поколений [1, с. 12]. Автор приводит пример с микрофишами, которые с одной стороны, позволили предоставить доступ к аналоговым источникам, находившихся в увядающем состоянии, а с другой стороны, оцифровка микрофиш сегодня – это, по сути, снятие копии с не самой лучшей копии источника, что неизбежно приводит к потере информации.

Х. Салми предлагает отличать оцифровку (digitalization) в общем потоке цифровизации (digitization), чтобы обозначить процесс перевода аналоговых объектов в электронный формат. Автором выделяется особенная характеристика, присущая современной истории, это ее дигитальность (digitality) [1, с. 21], которая определяет исследовательские процессы, неизбежно сталкивающиеся с цифровой культурой и, в частности, с историческими источниками, созданными изначально в цифровом формате. Кратко рассматривая эти особенности современности, автор обращает внимание на вопросы онтологии, определяющей возможность изучения сущностей прошлого, и эпистемологии как природы исторического научного знания, условий и способов его получения [1, с. 20]. Х. Салми считает, что эти два важных аспекта создают рамки изучения современной истории, которая все в большей степени становится представлена цифровой составляющей, определяют необходимость критики и использования источников цифрового происхождения.

Х. Салми показывает, что историки, работая с оцифрованными источниками часто вынуждены формулировать исследовательский вопрос не отталкиваясь от того, что ученый хотел бы узнать изначально, а исходя из доступности источниковой базы, возможностей ее формирования и обработки. В этой связи, внешняя и внутренняя критика источников должна осуществляться с учетом предвзятостей, связанных с созданием цифровых историко-ориентированных коллекций. Автор выделяет 4 группы факторов, которые должны приниматься во внимание (см. параграф “Biases of the Digital Past”, [1, с. 17-19]): во-первых, это партнерства (в т.ч. частные, общественные и государственные), которые участвуют в создании коллекций и определяют или как минимум могут влиять на содержание, полноту и качество контента; во-вторых, это различный временной ритм и масштаб оцифровки (в тексте книги приводится пример транснациональных проектов, которые изначально несбалансированны содержательно); в-третьих, это правовые ограничения, которые негативно влияют на возможности распространения коллекций в Интернет-пространстве (в т.ч. авторские права на цифровой контент); в-четвертых, это коммерциализация процессов оцифровки историко-культурного наследия, которая помимо блага в виде созданных электронных коллекций приносит неравенство возможностей их использования в случае предоставления доступа к ним по платным подпискам, например.

Характеризуя источники, которые имеют цифровое происхождение изначально (born-digital sources), автор прибегает к сравнению современного мира с глобальным симулякром, где нет постоянства и устойчивости данных [1, с. 26]. В этом мире, если неким образом сохраняются данные, они уже не в полной мере представляют ту действительность, которую призваны отразить. Действительно, заархивированные веб-ресурсы теряют присущую им динамичность, а динамичность социальных сетей и других источников является важным признаком цифрового века.

Другой характерный признак современных информационных ресурсов, являющихся частью современной повседневности и как следствие важным историческим источником, это их виральность (см. параграф “Virality”, [1, с. 22-25]). Виральность в данном контексте не имеет никакого отношения к вирусному программному обеспечению, а представляется как часть современной цифровой партиципаторной культуры, предполагающей создание новых слоев информации – реакции пользователей контента, комментарии, распространение в виде репостов и т.п. Очевидно, что участие пользователей и их отклики в разных форматах являются важными источниками знания о современном обществе, позволят в будущем дополнить историческую картину, дать оценку текущим событиям, а значит, эта информация также требует соответствующих подходов для ее сохранения как исторического источника.

Вместе с тем, возможности реконструкции современной нам истории существенно сужаются ввиду того, что многие цифровые источники уже утрачены, поскольку не были во время оценены и сохранены. Усилия, предпринимаемые сегодня для архивирования цифровых источников, возможно, не являются исчерпывающими для получения хоть сколько-то полной картины происходящего, и Х. Салми справедливо упоминает Internet Archive [2], но этого примера явно недостаточно, чтобы проиллюстрировать предпринимаемые на данном этапе проекты, которые направлены на сохранение современных цифровых ресурсов разного типа. Полагаю, что ценным было бы упоминание в книге и других проектов, в том числе, прорывных, например, проекта BeSocial [3], предназначенного сохранить социальные сети Бельгии, и ряда других.

Рассуждая о проблемах, связанных с историческими источниками типа born-digital, с которыми работают историки современности, автор указывает на их чрезмерное количество. Огромные массивы данных становятся вызовом для исследователей ввиду необходимости искать адекватные подходы, подбирать методы и инструментарий для работы с большими данными. Х. Салми ссылается на работу футуриста А. Тофлера «Шок будущего» (Toffler A. Future Shock, [4]), написанную еще в 1970 г., в которой обращалось внимание на «трудности сбора, манипуляции, оценки и удержания информации» [1, с. 26]. Эти процессы справедливы и для современного исследовательского процесса, но во многом остаются нерешенными и даже в полной мере недооцененными историками. Переполненность данными как проблема связывается автором не только со сбором цифровых ресурсов, например, в процессе архивирования веба, но и с постоянным их генерированием, в том числе, в процессе создания прикладных баз и банков данных. Х. Салми приводит в пример генерацию больших датасетов в ходе мониторирования процессов, в том числе, связанных с персональными данными о здоровье. Принимая приведенный пример во внимание, можно продолжить ход мысли и обратиться к более разнообразному с точки зрения сохраняемой информации и более полному с позиций ее накопления процессу лайфлоггинга (lifelogging), современного течения сохранения повседневной информации в формате видео, аудио, изображений на персональном уровне. В этой связи ресурсы лайфлоггинга являются примером создания больших массивов данных, ценных для историка [5] и требующих разработки новых подходов для их использования в гуманитарных исследованиях. Х. Салми справедливо поднимает вопросы размерах датасетов (bigness) [1, с. 41], о доступности этих цифровых изобильных данных для исследователей будущего, а также о необходимости разработки методологии и особого инструментария для работы с этими данными [1, с. 27]. Вместе с тем, хотелось бы отметить, что доступ к персональным данным должен обеспечиваться только принимая во внимание этическую сторону вопроса, что обойдено вниманием автором рецензируемой книги.

Х. Салми отчасти обращается и к способам интерпретации полученного знания и затрагивает вопросы герменевтики, которые, как представляется, рассматриваются несколько узко. Автор рецензируемой книги в основном фокусируется на толковании смыслов текста и интеллектуальных начал в нем (см. параграф “Reading and Textuality in Digital History”, [1, с. 43]), а герменевтика намного более широкая область, особенно в ее цифровом разрезе и в отношении типов данных, с которыми работают историки. Использование подходов цифровой герменевтики позволяет обозначить влияние цифровых технологий на производство исторического знания, принять во внимание особенности критики источников, существующих в электронной форме, а также существующие методы, инструменты и информационные инфраструктуры, обеспечивающие работу современных исследователей [6].

В целом вопросы критики цифровых источников рассмотрены не только с позиции внешней и внутренней критики исторических источников, но и в отношении конкретных типов источников. Х. Салми говорит о доминировании текстовых источников в исследовательском обороте историков и упоминает Леопольда Ранке в связи с необходимостью применения критических подходов к историческим текстам и их иерархичности [1, с. 42-43]. Автор кратко прослеживает эволюцию текстов, показывает усложнение работы с ними, обозначает появление новых возможностей, связанных с распознаванием и машиночитаемостью текстов, поиском по большим объемам данных и их обработкой. Х. Салми ставит вопрос о подходах к критике больших данных, способах формирования датасетов и возможностях извлечения из этих источников достоверных исторических свидетельств [1, с. 46]. Автор обозначает проблему сбора датасетов и представления максимально полной информации в них и связывает ее дисперстным расположением первичных источников. Так, нахождение истоников, к примеру, газет, в разных учреждениях хранения препятствует формированию единых источниковых корпусов, что создает сложности для автоматизированной организации данных и их обработки. Другой сложностью является разная степень глубины оцифровки источников, когда в информационных системах могут быть представлены изображения, распознанный, но неотредактированный текст, или отредактированный и размеченный семантической разметкой. Все эти уровни становятся принципиально несовместимыми, существенно сужая возможности оперирования данными. Вместе с тем, фокусируясь на анализе способов создания датасетов и проблем вокруг этого процесса, автор обращает мало внимания критике подходов к их анализу. Вероятно, уместным было бы упомянуть проект RANKE 2 [7], разрабатываемый в Центре современной и цифровой истории университета Люксембурга и посвященный цифровой критике исторических источников.

В главе Interdisciplinarity: ChallengesforResearch[1, с. 71-78], посвященной междисциплинарности подходов и цифровой истории, Х. Салми поднимает важный вопрос о степени достаточности избранных подходов для решения заявленных задач при работе современного историка в широком междисциплинарном поле. Автор обращает внимание на уровни междисциплинарности, реализуемые в сфере Digital Humanities, и рассматривая историческую компоненту, показывает, что история в таких проектах не всегда играет ведущую роль в союзе дисциплин. В последнем параграфе к главе Х. Салми обращает внимание на высокую степень неопределенности в любом междисциплинарном проекте [1, с. 77], которая проявляется в необходимости разносторонней критики источника с позиций разных дисциплин и создает дополнительные сложности для реализации проекта. В этом отношении автор даже делает вывод о том, что цифровая история «это не дисциплина, это ветвь исторической практики» [1, с. 78], которая также может иметь междисциплинарный характер. Реализация таких проектов требует понимания основы, обратной стороны используемого инструментария всех дисциплин, но иногда это упускается из виду и критика источников, методов и подходов с разных позиций является недостаточной. Особенно справедливым указанный фактор является для проектов, в которые вовлечены большие данные.

В заключении, следует отметить, что книга Ханну Салми “What is Digital History?” не имеет цели быть исчерпывающим исследованием, а дает скорее обзор основных тенденций в области цифровой истории. Следует согласиться с автором о том, что цифровые источники в их разнообразии сегодня требуют к себе внимательного отношения с разных позиций, в том числе, в отношении критики, и обратить внимание на необходимость дальнейшей проработки данных вопросов, развития методологии цифровой истории в союзе с цифровой герменевтикой, цифровой эпистемологией [8], компьютерным источниковедением и другими дисциплинами.

References
1. Salmi H. What is Digital History? Medford: Polity Press, 2020. 130 p.
2. Internet Archive. URL: https://archive.org (data obrashcheniya: 15.03.2021).
3. BESOCIAL – towards a sustainable social media archiving strategy for Belgium. URL: https://www.ugent.be/mict/en/research/besocial-towards-a-sustainable-social-media-archiving-strategy-for-belgium (data obrashcheniya: 15.03.2021).
4. Toffler E. Shok budushchego: Per. s angl. — M.: «Izdatel'stvo ACT», 2002. —557 s.
5. O’Hara K., Tuffield M.M., Shadbolt N. Lifelogging: Privacy and empowerment with memories for life. In: Identity in the Information Society. 2008. Vol. 1, pp. 155–172.
6. Fickers A. / Update for Hermeneutics. Historical sciences on their way to digital forensics? // Studies in Contemporary History, 2020. Vol. 1.
7. Ranke 2. Source Criticism in the Digital Age. URL: https://ranke2.uni.lu (data obrashcheniya: 15.03.2021).
8. Ingvarsson J. Digital Epistemology: An Introduction. // Towards a Digital Epistemology. Palgrave Macmillan, Cham, 2020. https://doi.org/10.1007/978-3-030-56425-4_1