DOI: 10.7256/2454-0668.2020.3.33274
Received:
21-06-2020
Published:
12-08-2020
Abstract:
The subject of this article is theoretical provisions of the new scientific field – digital sociology, developed by the leading foreign and Russian experts in the area of sociology, anthropology, public administration, as well as political, social and information technologies (K. Michael, R. Clark, M. Fourcade, K. Healy, L. Manovich, L. Sloan, J. Morgan). Along with theoretical positions, the author examines the results of empirical research in the area of digital sociology, acquired by the representatives of government structures, corporations, medical institutions, and secret services (K. Garattini, E. M. Chereshnev, G. Greenwald, and C. Sunstein). Leaning on the texts that are unfamiliar to Russian audience, the authors explore the theoretical positions of digital sociology, determine its object field, methodological capabilities, identify risks and boundaries, as well as outline the prospects for future development. The article analyzes the current trends in the area of cyborgization and chipping of humans, and assesses the risks of utilization of digital tools to controlling citizens in real and virtual environments. It is demonstrated that the interface and software of modern technologies pattern and determine reality. The authors reveal the methods used by a number of secret services in foreign countries that control and manipulate discussions in the social networks. The approaches of the theoreticians of sociology – J. Bentham, M. Foucault, and B. Latour are being adapted to the context of research. The authors also assess methodological traps related to big data analysis, and propose the ways for increasing validity of the results of research, obtained using the methods of digital sociology.
Keywords:
digital sociology, big data, social media, manipulation technology, digital capitals, observation, surveillance, monitoring, chip implants, digital traces
Введение
Цифровая социология – новая формирующаяся научная область, вызванная к жизни стремительным внедрением новейших цифровых технологий в различные сферы человеческой жизни. Специальных научных исследований, посвященных практике применения цифровой социологии, пока очень мало как в нашей стране, так и за рубежом. Вследствие этого главными действующими лицами, продвигающими и пропагандирующими новые тенденции и инновации, становятся коммерческие компании, главная цель которых – максимальное извлечение прибыли. Они нанимают ангажированных ученых, которые становятся «евангелистами» цифровых технологий, они же прививают обществу осознание необходимости технологий. Государственные структуры мотивируют использование технологий целями государственного управления, а на практике применяют их для наблюдения и слежки за гражданами. Правоохранительные органы адаптируют технологии для нужд пропаганды, агитации и манипуляции общественным сознанием в социальных медиа, о чем свидетельствуют отчеты отечественных компаний, которые занимаются анализом интернет-пространства.
С методологической точки зрения социология оказалась в положении, когда практические разработки в сфере цифровых технологий опережают их осмысление. Социальные ученые, как и широкая общественность, не успевают рефлектировать по поводу происходящих изменений.
В этой связи мы сочли необходимым проанализировать ряд наиболее важных работ, посвященных проблемам и результатам применения цифровых методов исследований, обобщить их, выделить в них общие структурные компоненты и высказать собственные суждения о возможных рисках и перспективах развития новой области научного знания, а также пригласить к обсуждению и дискуссии социальных ученых, теоретиков и практиков современных технологий.
Классификация видов цифрового наблюдения за гражданами
В статье К. Михаэль (Университет Уоллонгтона) и Р. Кларка (Национальный университет Австралии) «Отслеживание мобильных устройств: тотальный надзор приближается» рассматривается проблема слежки за людьми по их мобильным устройствам [1, с. 216-228]. Авторы приводят описание различных технологий, на основе которых работают современные телефоны и планшеты, и которые позволяют отслеживать местоположение. Это сотовая связь (3G / GSM/GPRS / HSPA, LTE «4G»), беспроводные локальные сети (WLAN, обычно Wifi), беспроводные глобальные сети (WWAN, обычно WiMAX). Далее авторы переходят к рассмотрению различных актуальных форм цифрового наблюдения (surveillance) и предлагают теоретическую классификацию его видов.
«Надзор» (Überveillance) – термин, вынесенный Михаэль и Кларком в название статьи, означает, что информация, передаваемая устройством, полностью показывает картину действий человека и позволяет судить о том, кто этот человек, где он находится, в какое время происходят события, и даже выявить мотивы и результаты его действий. Например, если абонент еженедельно посещает определенный религиозный книжный магазин в торговом центре, можно обоснованно предположить, что он связан с конкретной религией. В перспективе возможно даже предсказывать планы, привычки, вкусы, черты характера, политические и религиозные взгляды.
«Персональное наблюдение» (Personal surveillance) – наблюдение за отдельным субъектом. Такой вид наблюдения могут использовать правоохранительные органы для поиска преступников, террористов; социальные службы для обнаружения людей, нуждающихся в экстренной медицинской и другой чрезвычайной помощи; социологические службы для подсчета мигрантов. Американский журналист Г. Гринвальд выпустил ряд статей, в которых показал, как США используют данный вид наблюдения. Спецслужбы этой страны вычисляют по сигналам сим-карт геолокацию пользователя и наносят авиаудары беспилотниками в Пакистане и Йемене как по террористам, так и по мирным жителям [2]. В России во время пандемии этот вид наблюдения использовался Правительством Москвы, чтобы отслеживать перемещения людей. Были введены «цифровые пропуска», что позволило государственным органам отслеживать перемещения граждан по городу, а перемещения людей из групп риска отслеживались по покупкам банковской картой и геолокации телефона.
«Массовое наблюдение» (mass surveillance) – используется для отслеживания и мониторинга действий больших скоплений людей. Оно может применяться, например, при подсчете граждан, вышедших на протестную акцию. Могут составляться «черные списки», может проводиться слежка в отношении лидеров мнений, политических активистов, а также всех участников какого-либо мероприятия одновременно. Среди недостатков такого вида наблюдения можно выделить большую погрешность, в результате слежка может происходить за теми, кто изначально не был предметом наблюдения. Михаэль и Кларк здесь используют «рыболовную» метафору: «непреднамеренный вылов рыб или «прилов»».
«Умное наблюдение» (smart surveillance) – используется коммерческими компаниями для оптимизации продаж и извлечения прибыли, при этом понятие деловая этика для организаций, использующих умные цифровые технологии, зачастую отходит на задний план. Например, компания Path Intelligence (PI) продает технологию, позволяющую отслеживать время пребывания покупателей в магазине, оценивать места, в которых часто создаются очереди, фиксировать периодичность посещения магазина, выявлять типичные маршруты, которыми покупатели ходят по магазинам.
Желание знать все обо всех и тотальный цифровой надзор Михаэль и Кларк называют эпидемией наблюдения (the dataveillance epidemic) и настаивают на необходимости законодательного регулирования данной сферы. Авторы опасаются, что отсутствие конфиденциальности приведет к потере личных свобод, безопасности (преступник так же может собирать данные о перемещениях своей жертвы), свободы общения, передвижения, действий и может означать конец всей частной жизни.
Цифровая социология и медицина
Теоретическую рамку классификации наблюдений, предложенную Михаэль и Кларком, с некоторыми контекстуальными изменениями можно применить к формирующейся новой области исследований – цифровой социологии медицины.По данной тематике выходит значительное количество литературы, описаны примеры персонального, коллективного, «умного» наблюдения с использованием данных медицинских устройств, подключенных к телу человека, или носимых человеком на себе. Эти медицинские гаджеты считывают пульс, давление, считают шаги, фазы сна.
Одной из недавних работ, освещающих методы наблюдения с помощью технических средств в медицинской сфере, является исследование антрополога, исследователя Intel UK Health Innovation К. Гараттини и его коллег из университетского колледжа Лондона «Аналитика больших данных, инфекционные заболевания и их этические последствия» [4, с. 69-85]. Они анализируют исследования, проводимые с помощью устройств, которые люди носят с собой и на себе (wearables). Такие гаджеты, регистрируя личные медицинские параметры человека, способны удаленно передавать результаты сложных автоматических измерений артериального давления, частоты сердечных сокращений, уровня сахара в крови, уровня кислорода, температуры тела и показателей психического состояния. Данные технологии уже применялись для выявления вспышек инфекционных заболеваний в разных странах – Эболы в Западной Африке, пандемий гриппа в 2008-2009-е гг., инфекционных заболеваний в провинции Сычуань в Китае после землетрясения 2008 г., а также для наблюдения за больными туберкулезом в Кении.
В центре внимания авторов статьи – этичность сбора таких данных. Они генерируются, обрабатываются и хранятся в разных местах, что создает риски сохранности персональной информации. Гараттини признает полезность и нужность цифровых данных, так как они позволяют своевременно предсказывать и диагностировать вспышки заболеваний, вызванных массовой миграцией, авиаперелетами, путешествиями, международной торговлей, т.е. ежедневной активной деятельностью людей, перемещающихся через страны и континенты.
В статье подчеркивается, что должны быть регламентированы правила сбора, хранения, использования, передачи третьим лицам личных медицинских данных. Авторы пишут: «поскольку аналитика больших данных (BDA) в этой области расширяется, потребуется дальнейшая работа по определению и решению возникающих этических вопросов, а также по обеспечению последовательной прозрачности для формирования общественного доверия к этим развивающимся гиперсложным ситуациям».
Эксперименты по киборгизации человека
Аналогичного мнения придерживается Е. М. Черешнев – вице-президент «Лаборатории Касперского», который в рамках проекта «BionicMan» стал первым россиянином, вживившим себе чип в руку. Это было сделано им в качестве научного эксперимента, цель которого на себе испытать, каково это жить с чипом, и возможно ли «избавиться от всех типов ключей – от дверей, машин, офисов, забыть про пароли и логины, платить касанием, отказаться от бумажных документов». Действительно, в таком случае одно устройство может заменить все материальные документы, которыми человек пользуется, что ведет нас к «интернету вещей». На первый взгляд это кажется удобным, эргономичным и современным. Однако вживленный чип несет с собой целый ряд рисков, о которых пишет исследователь.
Автор признается, что эксперимент превзошел все ожидания, но только в худшую сторону. В первую очередь это связано с надежностью данных, которые собирает чип: «Стало очевидно, что если мы ничего не изменим в нашем подходе к приватным данным, нас ждет крайне печальное будущее. Цифровое рабство. Признаться, осознание этого факта в мои ожидания никак не входило».
Сегодня Черешнев выступает против чипирования, потому что данные, которые собирает устройство с человеческого тела, слишком уязвимы, они уже не принадлежат самому человеку и могут быть украдены: «технология на данном этапе небезопасная – данные пользователя легко можно украсть, а самого человека – профилировать и манипулировать его поведением в Сети – покупательским, потребительским, контентным <<…>> данные, которые он производит своим телом и поведением от природы принадлежат ЕМУ. И никому другому. Правильнее сказать – должны принадлежать, ибо сейчас это не так» [5].
Новая экономика цифровых капиталов
В рассуждениях о видах наблюдений уместно упомянуть работу М. Фуркада (Калифорнийский университет) и К. Хили (Университет Беркли) «Что видят рынки, когда наблюдают за людьми?» [6, с. 9-29]. В ней показывается, как компании, собирая, накапливая и обрабатывая большие данные, формируют новую экономику цифровых капиталов и диспозиций («ubercapital», или «eigencapital» – что перекликается с теорией практик П. Бурдье), основанную на предыдущем поведении человека, его потребностях и вкусах, информация о которых собирается на основании цифровых следов (digital traces): сообщений, комментариев, репостов, лайков, поисковых запросов, данных о подписках, о сети коммуникаций, покупки в онлайн магазинах, финансовые онлайн операции и.т.д. Авторы пишут, что грезы середины XX века о том, что технические машины облегчат человечеству жизнь, превращаются в цифровые социальные паспорта (например, в Китае). Формируется новый этический уклад, который «рассматривает людей в дихотомии достойный – недостойный, а сам алгоритм классификаций построен на моральных суждениях. В итоге будет выноситься вердикт об уровне доверия, платежеспособности, добропорядочности, доброжелательности, репутации, правильном или неправильном поведении. Фуркад и Хили основываются на теории бюрократии и рациональности М. Вебера, теории паноптикума и власти М. Фуко и пишут о том, что человеческое поведение базируется на сознательном выборе, а значит, приводит не только к контролю со стороны фирм, главная задача которых – извлечение прибыли, но и к постепенному внутреннему самоограничению человека, самоконтролю, самодисциплине, контролю поведения, поступков, мыслей. Однако, пользуясь социальными сетями люди, тем не менее, сознательно отказываются от частной жизни, они удовлетворены и явно рады использовать эти приложения в качестве услуги. Взамен владельцы серверов получают огромные базы данных своих клиентов и могут распоряжаться ими по своему усмотрению – чаще для извлечения прибыли, определяя местоположение, потребности, интересы, планы людей на будущее.
В классической полевой социологии или этнологии этический вопрос о том, должен ли социолог признаваться в том, что проводит исследование, решен положительно. В моральном кодексе социолога сказано: «Социолог обязан поставить респондентов в известность о подлинных целях проводимого исследования. Он не имеет права обманным путем или, пользуясь своим служебным положением, получать сведения, которые могут быть использованы в чьих бы то ни было корыстных интересах» [7].
Сегодня, если цифровые социологи считают себя продолжателями традиций классической социологии, необходимо обсуждать вновь возникающие этические вопросы – считаем ли мы человека, чьи цифровые следы наблюдаем, респондентом? Обязаны ли исследователи сообщать ему, что его изучают (через медицинские, бытовые или иные приборы)? Как изменится поведение человека в сети, если он будет знать, что его данные собираются и обрабатываются? Насколько данные человека остаются личными и неприкосновенными? На какие правовые нормы должны опираться частные фирмы, которые собирают информацию о своих клиентах? Где хранятся эти данные и как в дальнейшем используются? Имеет ли человек право на цифровое забвение? К обсуждению этих вопросов должны быть подключены философы, юристы, законодатели, широкий круг социальных ученых.
Культуромика как новое направление цифровых исследований
Продолжая нашу сквозную тему наблюдения за гражданами, остановимся на новых возможностях, которые предоставляет такое формирующееся направление цифровых исследований, как культуромика (culturomics). Это пока нечетко идентифицирующая себя область исследований, построенная на анализе с помощью сложных алгоритмов гигантских массивов оцифрованных культурно значимых текстов: книг, журналов, публикаций в СМИ, новостных лент за длительный временной период. Задачи, которые можно решать в рамках культуромики, самые разнообразные. От ретроспективного анализа того, как, например, за определенный период времени происходит эволюция какого-либо языка – до перспективного прогностического анализа событий или выявления социальных тенденций. Можно исследовать социальную память общества: фиксировать появление и исчезновение понятий, определений, трактовок. Суть подхода – в сочетании математических и семантических алгоритмов, позволяющих выявлять неявные связи между словами и фразами, использованными для характеристики явления, процесса или конкретного актора с учетом временного контекста, географической привязки источника новостей, и одновременно – эмоциональной окраски сообщения и наличия оценочных суждений об исследуемом явлении, процессе или акторе.
Примером применения культуромики для анализа и предсказания поведения больших групп людей посредством количественного и качественного анализа медиа текстов могут служить исследования К. Летару (эксперт Google, сотрудник университетов Дж. Вашингтона и Иллинойса). Он наиболее известен как создатель Глобальной базы данных событий, языка и настроений (Global Database of Events, Language and Tone, GDELT 1.0 и GDELT 2.0 с 2013 года) [8, с. 1-49]. База содержит данные о людях, местах, государственных организациях, частных компаниях, странах, новостных сообщениях, их цитированиях, изображениях, тональности информации. Система содержит архив новостей с 1 января 1979 г., следит за всеми мировыми новостями более чем на 100 языках (98,4% объема мониторинга составляет не англоязычный материал) и обновляется каждые 15 минут. Технологии искусственного интеллекта, позволяющие посредством алгоритмов естественного языка, баз данных глубокого обучения находить миллионы тем в день и связывать их с настроениями людей. В основу заложены оцифрованная литература за последние 215 лет, 21 млрд. слов академической литературы за последние 70 лет. Все это сгруппировано в 300 категорий по тональности. (Поскольку Компания исследования ученого и его коллектива публикуются на сайте ЦРУ, можно предположить, что Летару сотрудничает с этой организацией).
Одно из крупных исследований, информация о котором почерпнута из статьи, – «Культуромика 2.0: прогнозирование крупномасштабного поведения человека с использованием глобальных информационных медиа-тонов во времени и пространстве». К.Летару на материале 30-летнего архива новостей всех стран мира показывает, что глобальные мировые события, если их правильно анализировать, можно предсказывать [9].
Автор использует синтез четырех методологических подходов – контент-анализ, анализ тональности сообщения, геолокационный анализ и сетевой анализ. Он критикует классический культурологический метод, при котором подсчитывалась только частота употребления слов и фраз в течение времени без анализа контекста. В качестве эмпирического материала у автора выступают три источника – полный оцифрованный архив New York Times с 1 января 1945 по 31 декабря 2005 г. (всего 5.9 млн. новостных статей, объемом 2.9 млрд. слов), данные социальных сетей и поисковых систем 2006-2011-х гг. – как вспомогательный инструмент. Для «улавливания» мельчайших нюансов контента региональных СМИ использовались подборки службы глобального мониторинга новостей (США и Великобритания) – Информационной службы зарубежного вещания (Foreign Broadcast Information Service, FBIS) до 1993 г. и Резюме мировых новостей (Summary of World Broadcasts, SWB) до 1979 г. В день производилось сканирование от 10 000 до 100 000 статей, исследование длилось 5.5. лет (с 1 января 2006 по 31 июля 2011 гг.)
Метод состоял из двух элементов – интеллектуальный анализ и полнотекстовое геокодирование. Интеллектуальный анализ настроений подсчитывал количество слов в статье и определял «плотность» эмоциональной окраски. Для установления метрики были скомпилированы 6 словарей. Полнотекстовое геокодирование сравнивало тональность с географией, вплоть до установления широты и долготы того, о чем пишется в тексте. Всего проанализировано 369 тыс. оригинальных мест, которые упоминались более 10.4 млн. раз (одно на 279 слов).
Автор доказывает, что архив мировых новостей, благодаря анализу тональности сообщений, воспринимаемых во времени и пространстве, позволил предсказать Арабскую весну, отставку Президента Египта Х.Мубарака, протесты в Ливии, этнические конфликты на Балканах, стабильность Саудовской Аравии и даже местонахождение У. бен Ладена при его захвате. Летару считает, что история человечества, таким образом, может быть препарирована (деконструирована) и разложена на части.Компания использовала большие данные для картографирования протестных акций (майдана) в Киеве в 2013-2014, предсказывала отделение от Украины Крыма. Среди актуальных проектов на сайте компании сегодня темы, связанные с коронавирусной инфекцией, вакциной от него, президентской гонкой в США, изменением климата, гендерными исследованиями.
Летару говорит, что анализ местоположения играет огромную роль в понимании событий. Это позволяет «открыть окно в национальное самосознание», строить долгосрочные стратегии национальной безопасности и стабильности, предсказывать крупные мировые потрясения, предотвращать протестные акции и террористические атаки, т.е. в какой-то степени видеть будущее. Все это позволяет делать мониторинг новостей или «разведка с открытым кодом». Ссылаясь на «Вашингтон пост» за 2001 год Летару иронизирует: «многое из того, что знает ЦРУ, было собрано из газетных вырезок, поэтому директора ЦРУ можно назвать Главой Почтовой службы США».
Паноптикум М. Фуко и наблюдение за социальными сетями.
Метафора паноптикума М. Фуко применима к цифровым методам наблюдения за людьми. Напомним, что у М. Фуко есть описание так называемой «дисциплинарной мечты». Это мечта власти о том, чтобы все видеть и при этом оставаться невидимой. Идея паноптикума позаимствована Фуко у И. Бентама, который описал это архитектурное сооружение или тюрьму нового типа, когда один надсмотрщик, находясь в центре кольцевидного сооружения, может контролировать все действия заключенных, которые его видеть не могут. Важная деталь: хотя надсмотрщик не надзирает беспрерывно, заключенные (или в более широком контексте – подчиненные) должны знать, что они под постоянным контролем. В этом суть «дисциплинарной мечты»: не обязательно контролировать постоянно, важно сформировать психологическое состояние подчиненных, чувствующих, что в любой момент за ними могут следить. Тем самым власть становится анонимной и вездесущей. Метафора паноптикума отражает суть современного цифрового «всевидящего ока».
Паноптическое наблюдение ведется за простыми гражданами, статусными персонами, политическими лидерами, за коммерческими структурами, за ситуацией в стране для анализа общественно-политической обстановки. На портале «The Intercept» (Перехват), организованном Г. Гринвальдом (журналист, которому Э. Сноуден рассказал о слежке АНБ США) и его коллегами Л. Пойтрасом и Дж. Скэхиллом можно познакомиться со статьей Г.Гринвальда «Как тайные агенты проникают в интернет, чтобы манипулировать, обманывать и разрушать репутацию» [10]. В статье описывается деятельность альянса «Пяти глаз» (The Five Eyes, FVEY), в который входит Великобритания, США, Австралия, Канада, Новая Зеландия. Их деятельность выходит далеко за рамки простого наблюдения за информацией в интернете. Гринвальд по документам Сноудена пишет, что британская Объединенная группа по разведке и исследованию угроз (Joint Threat intelligence Group), принадлежащая спецслужбе Великобритании – Центру правительственной связи (Government Communications Headquarters, GCHQ) преследует две цели – наблюдать за материалами и дискуссиями в популярных социальных сетях и контролировать их. Эта Объединенная группа по разведке и исследованию угроз использует социально-психологические методы и технологии для публикации ложных новостей на популярных платформах для манипуляции дискуссиями в комментариях, размещает деструктивный и пугающий материал, создает фейковые странички известных личностей и блогеров, рассылает письма их друзьям и коллегам, публикует информацию с их страничек для разрушения репутации. Гринвальд называет эти технологии «операции под чужим флагом» (false flag operations).
Другой технологией являются «медовые ловушки» (honey traps), это техники общения на сексуальные темы для дальнейшей манипуляции полученными материалами и дискредитации жертвы. Мишенями влияния и манипуляции являются национальные лидеры, военные ведомства, медийные персоны. В одном из документов GCHQ все методы обобщаются как технологии «четырех D» – deny, disrupt, degrade, deceive – отрицать, нарушать, унижать, обманывать.
Аналогичные социальные технологии описываются советником Б. Обамы, начальником Управления регулирования информации профессором права Гарвардского университета К. Санстейном, автором «теории подталкивания». Эта теория предполагает возможность влиять на процесс принятия групповых решений посредством положительного подкрепления и «как бы» непрямых указаний. Подталкивание к действию не менее эффективно, чем силовое принуждение или прямая рекомендация. Именно Санстейн предлагал так называемое когнитивное внедрение (cognitively infiltrate) Правительству США. Оно заключается в найме якобы независимых тайных агентов (общественных активистов), которые должны внедряться в чаты, группы, на форумы, чтобы контролировать направления дискуссий и влиять на общественное мнение. Вышедшая в 2017 г. на русском языке книга Санстейна называется «Nudge», что дословно можно перевести как «слегка подталкивать локтем» [11].
О том, как «теория подталкивания» реализуется на практике, показано в недавнем исследовании, проведенном компанией Крибрум «Великая отечественная война. Фальсификация истории. Манипуляции в социальных медиа» [12]. В исследовании прослеживается процесс распространения в социальных медиа недостоверной или откровенно сфальсифицированной информации о Второй Мировой войне, о роли в ней Советского Союза. Информация направлена на развенчание подвига русского солдата и смысловую трансформацию праздника Победы. Временной период, охваченный исследованием – 2014-2019-е гг. Объем сообщений составляет более 4,7 млн. Информация анализировалась в русскоязычном сегменте социальных медиа по пяти выделенным наиболее обсуждаемым в социальных медиа темам, например, обвинения СССР в развязывании Второй Мировой войны. Центральное место в распространении этого тезиса занимают всевозможные манипуляции вокруг темы «Пакта Молотова-Риббентропа». Под каждую из пяти тем была разработана лингвистическая модель, состоящая из нескольких сотен запросов, позволяющих не только обнаружить необходимую информацию, но и исключить нерелевантные сообщения. Исследование ретроспективных данных за длительный промежуток времени стало возможным, благодаря использованию Платформы мониторинга и анализа социальных медиа «Крибрум».
Выявлено, что «когнитивное внедрение» в российский сегмент социальных сетей осуществлялось первоначально из-за рубежа. В период 2014-2017 гг. преобладают иностранные аккаунты, содержащие провокационную информацию, они являются первоисточниками «тезисов», дискредитирующих Победу и роль СССР во Второй мировой войне. Далее с 2017 г. происходит «экспорт повестки»: проблематика переходит в российский сегмент социальных сетей, и эти темы с теми же словесными формулировками становятся уже частью отечественных платформ. Исследованием детально показана активная работа по переформатированию сознания молодежи, составляющей значительную долю пользователей социальных сетей, что подтверждает описанную выше «теорию подталкивания» К. Санстейна. О «когнитивном внедрении» свидетельствует тот факт, что динамика роста количества сообщений по фальсификации истории превышает темпы роста общей аудитории Рунета
Социальная сеть структурирует реальность
Социальные сети могут многое рассказать аналитику. Для этого, используя лексику Б. Латура, исследователю нужно «разговорить» вещи. Л. Манович совместно с Н. Хохманом провел исследование «Увеличение масштаба изображения в Instagram-городе: чтение местных новостей через социальные сети» [13]. Авторы показывают, что с помощью фотографий, выставляемых пользователями популярной социальной сети Инстаграм, можно прослеживать закономерности использования Инстаграм при помощи самих публикаций, не прибегая к анализу геолокации, даты публикации. В качестве эмпирического материала были отобраны фотографии тринадцати городов – Сан-Франциско, Токио, Лондона, Бангкока, Москвы, Тель-Авива, Нью-Йорка, Сиднея, Стамбула, Сингапура, Парижа, Берлина, Рио-де-Жанейро. Использовалось 2.3 млн. фотографий из этих городов. С помощью «сетки фотографий» авторы определяют «ритмы» города – где (место), когда (время) конкретная фотография была сделана, как данный «ритм» сменяется в течение суток (день/ночь). Свой подход они называют этнографией данных (data ethnography).
По мнению Хохмана и Мановича, социальная сеть сама структурирует реальность пользователей посредством интерфейса (interface signature). Задается размер фотографий (квадратные 612 х 612 пикселей), фильтры для их обработки, циклический формат времени публикации (когда написаны не точные дата и время публикации, а сколько времени назад фотография была опубликована). Все это – средства, которые формируют особый образ интерфейса, определяют формат и стиль общения пользователей. Манович даже отрицает оригинальность контента и говорит о том, что медиа сегодня полностью определяются программами: "цифровых медиа" не существует. Существует только софт, применяемый к медиа (или "контенту"). Другими словами, для пользователей, которые взаимодействуют с медиаконтентом лишь через приложения, "свойства" цифровых медиа определяются конкретной программой, а не содержатся непосредственно в самом контенте» [14, с. 30].
Трактовка Хохмана и Мановича является иллюстрацией к упомянутому Б. Латуру. Теоретические положения его акторно-сетевой теории подтверждаются актуальной практикой формирующейся новой цифровой реальности, где взаимоотношения людей и вещей принципиально меняются. «Вещи» начинают действовать, они играют все более активную роль, их статус повышается, и одновременно статус и роль человека как актора и активного деятеля снижается. Как показали нам это Хохман и Манович, формат и стиль общения пользователей определяются софтом. Пользователь заблуждается, полагая, что играет активную роль, на самом деле он зависим от «вещей», которые руководят его действиями. Если мы пока не наблюдаем на практике латуровскую равнозначность агентности человека и технологических объектов, то свидетельствовать о тенденции повышения статуса и значения «вещей» в современном цифровом мире мы уже можем.
Л. Манович является теоретиком, который задает вектор дискуссий в социально-гуманитарной среде исследователей «новых медиа», как он их называет. Он определяет их структуру, исходя из понятий математики и программирования, и определяет четыре принципа, которые различают старые и новые медиа:
· Дискретность или принцип модульности подразумевает, что медиа имеют элементы, которые обладают самостоятельностью по отдельности, но вместе составляют большие объекты, такие как фильмы, отдельные видео, программы, приложения.
· Числовое представление означает возможность описать новые медиа математически с помощью формул.
· Автоматизация означает, что машина может создавать данные, тиражировать их и манипулировать ими, исключая из этого процесса человека. Этот принцип сегодня можно наблюдать в специализированных программах по обработке фотографий (Photoshop), видео (Premiere Pro) и многих других. Не являются исключением программы для писателей и журналистов, которые редактируют, изменяют текст, способы тиражировать его без участия человека, используя ботов. Пользователь, читая новости и публикации, может думать, что читает реальную новость, написанную человеком, однако, она может быть вымышленной, написанной и растиражированной алгоритмом.
· Изменяемость означает, что социальные медиа не являются статичными, они постоянно трансформируются. Если традиционные медиа, например газеты, были неизменны, т.е. с них в конечном итоге можно было делать только копии, то современные медиа с помощью программного обеспечения могут быть изменены, перегруппированы под требования заказчика.
Все четыре принципа демонстрируют слияние медиатехнологий с современными технологиями цифровых вычислений. Это видно на примере таргетинговой рекламы, которая подстраивается под потребности пользователя, и каждый пользователь видит свой сайт с оригинальным дизайном, рекламой и новостными сводками.
Мониторинг социальных медиа и методы использования больших данных
Далее мы рассматриваем прикладные исследования, которые проводятся с помощью инструментов анализа и мониторинга социальных медиа, генерирующих и обрабатывающих большие данные. Важно, что они ставят серьезные методические вопросы, решать которые социологам предстоит в ближайшее время.
Британские исследователи Л. Слоун (Школа социальных наук, Университет Кардиффа) и Дж. Морган (Школу компьютерных наук и информатики, Университет Кардиффа) в статье «Кто твитит? Получение демографических характеристик возраста, профессии и социального класса из метаданных пользователя Twitter» рассматривают профили пользователей Твиттера и выявляют их социально-демографические характеристики – возраст, род занятий, увлечения, социальный класс [15]. Авторы собирали информацию двумя способами: через Совместную обсерваторию социальных сетей (Collaborative Online Social Media Observatory, COSMOS), которая является частью крупнейшей в Великобритании организации по финансированию исследований по экономическим и социальным наукам Совета по экономическим и социальным исследованиям Великобритании (ESRC) и через Национальную статистическую службу Великобритании (ONS) с использованием Стандартной классификация профессий на 2010 г. (SOC10).
Цель исследования состояла в том, чтобы оценить возможность автоматического определения возраста и профессии человека по профилю в Твиттере. Были скачаны 150 тыс. персональных страниц пользователей (менее 1% пользователей Твиттера), затем они сравнивались с данными вышеперечисленных социологических служб. Авторы оценили выборку как «крошечное ядро полезных данных небольшой доли от всех пользователей, которая все равно больше, чем самые крупные выборки статистических служб Великобритании». В итоге, пишут авторы исследования, был выявлен ряд ограничений и неточностей, которые накладывает система в Твиттере при сопоставлении данных.
Оказалось, что пользователи в поле информации о себе указывают несколько занятий, например: «преподаватель общественных наук, автор ужастиков, писатель-любитель, увлеченный садовник». По классификатору специальностей пользователь попадал в три группы – «преподаватель», «писатель», «садовник». В свою очередь каждая из групп делится далее по классификатору. Другая сложность состояла в том, что пользователи указывают свои хобби и досуговые занятия. Это может быть довольно большой список, и первая профессия в списке не всегда будет являться именно профессией, потому что пользователь может не идентифицировать себя со своей специальностью.
Третье ограничение – «ложное срабатывание», т.е. использование слова в разных контекстах. Например, в списке: «игрок в карты, преподаватель общественных наук, увлеченный садовник», слово «игрок» попадает сразу в несколько классификаций специальностей – «игрок» в карты, «игрок» на музыкальных инструментах, «игрок» в спортивных состязаниях. Также пользователи могут лгать о своей профессии, участвуя в игре идентичностей (identity-play)и выстраивая «виртуальную идентичность» (virtual identity).Также пользователи указывают свою семейную роль – «отец», «сестра», что в христианской традиции имеет иной смысл и должно быть включено в соответствующую классификацию религиозной (духовной) специальности или выполняемой роли. Кроме того, в Великобритании часто имена или фамилии образованы от названия профессий – Бейкер (пекарь), Смит (кузнец), Таннер (кожевник), что также повышает вероятность «ложного срабатывания».
Определение возраста для авторов стало более простым действием и менее субъективным, хотя им встречались ошибки, когда человек в профиле указывал: «17 лет работаю лектором» или «у меня 4-х летняя дочь». Валидность повышается, если пользователь указывает точный год рождения, а не пишет свой возраст, так как есть вероятность, что пользователь давно не обновлял свой профиль, и он может оказаться старше (не обновлять человек может и профессию, даже сменив ее). Женщины реже указывают свой возраст в интернете, что приводит к их «омоложению». Получается, что при таком методе интернет пользователи моложе, чем в переписи населения.
Не исключена и игра идентичностей (identity-play)при которой и женщины, и мужчины лгут о своем возрасте. Оказалось, что 93,9% пользователей в возрасте до 35 лет, 67% из которых это пользователи 16-22 лет. Причины данного явления объясняют тем, что, во-первых, люди старшего поколения меньше присутствуют в сетевом пространстве, а во-вторых, люди считают, что молодым быть более привлекательно, больше шансов завести новые знакомства, казаться здоровым и успешным [16].
Слоун и Морган предлагают также нетривиальный подход к определению возраста, при помощи подсчета частоты использования определенных слов, семантического анализа, правильности лексики и пунктуации, использования смайликов, хэштегов, жаргонизмов, сокращений (laughing out loud, LOL; You only live once, YOLO; Laughing my ass off, LMAO; What the fuck? WTF; Oh My God! OMG; Rolling On the Floor Laughing, ROFL). Авторы здесь следуют за методикой выявления возраста в социальных сетях Г. Шварца и его коллег из Университета Пенсильвании, которые предложили выявлять возраст в социальных сетях по объему словарного запаса, характерного для определенных возрастных групп. Исследователи взяли 700 млн. слов и фраз из сообщений 75 000 добровольцев на Facebook и обнаружили различия в языке в зависимости от личности, пола и возраста пользователя. Например, оказалось, что мужчины чаще употребляют притяжательное местоимение «моя», когда упоминают жену или подругу, чем женщины «мой» при упоминании мужа или парня [17].
В заключении авторы рассуждают об этических проблемах использования больших данных в исследованиях, а также говорят, что изучение демографических особенностей в социальных сетях станет ключевым вопросом для социологии в XXI веке.
Если принять за аксиому, что мы доверяем большим данным, возникает проблема их группировки и классификации. Согласно отечественной методологии следует использовать возрастную шкалу, принятую в государственной статистике, чтобы данные можно было сравнить. В. Ядов рекомендует использовать следующую группировку: 1-4, 5-9, 10-14, 15-19, 20-24, 25-29, 30-34, 35-39, 40-44, 45-49, 50-54, 55-59, 60-69, 70-79, 80 и старше. В группировках же до 25 лет целесообразно использовать шкалу, учитывающую особые стадии жизненного цикла: 0-2, 3-4, 5-6, 7-9, 10-12, 13-14, 15, 16, 17, 18-19, 20-21, 22, 23, 24. Некоторые социальные сети предлагают графу «о себе» или «статус профиля», которая является открытым вопросом, и мы не знаем, что вздумается написать пользователю о своем возрасте – «родился в 1998 году», «мне 18» лет», «школьник», «студент». Если социальная сеть предлагает вопрос в закрытой форме, то мы можем доверять этим данных и лишь группировать их, выделяя группы, которые представляют для нас исследовательский интерес.
Многие методологические и методические проблемы, касающиеся повышения надежности результатов исследований, основанных на больших данных, совпадают с рекомендациями Г. С. Батыгина, В. А. Ядова, А. П. Аверина, других социологов, что говорит в пользу плодотворного взаимодействия классических и цифровых социологов.
Что касается определения рода занятий, то, во-первых, нужно использовать официальную государственную классификацию специальностей (как это делали Слоун и Морган), чтобы иметь возможность дальнейшего сравнения и делать надежные выводы. Однако исследователю не следует надеяться, что в социальной сети пользователь охарактеризует себя как низкоквалифицированный или неквалифицированный рабочий, что он мог бы сделать при «живом» опросе или интервью. Поэтому при составлении лексико-семантического словаря для анализа профессии следует максимально подробно прописывать специальности, например, это могут быть грузчики, дворники, разнорабочие и т.д. Исследователь после получения первичных результатов уже отнесет их к нужной группе.
Важно принять во внимание «игру идентичностей» (identity-play),при которой пользователь будет конструировать свой образ в сети. Это представляется особенно актуальным при постановке исследователем цели обнаружить девиантное поведение или найти сторонников оппозиционных и деструктивных течений (скулшутеры, наркоманы, ультрадвижение, суицидники, сектанты и т.д.). Ведь наивно полагать, что участники таких групп открыто заявят о своих взглядах и расскажут о планах. Члены таких групп используют специальный язык общения, собственную субкультуру (музыка, одежда, прически), символику. При полевой работе найти подход к таким группам удается не всегда: табуированные в публичном дискурсе практики употребления наркотиков тщательно скрываются от окружающих. Молодежные компании выстраивают жесткие границы по отношению к «миру взрослых» [18, с. 78]. В техническом плане по косвенным признакам путем составления социально-психологических портретов, разработки семантических ядер для выявления девиантных и деструктивных владельцев персональных страниц удается решить некоторые из проблем «живой» полевой социологии. Этим занимается компания «Крибрум», которая мониторит и анализирует социальные медиа в режиме реального времени, и методологическим и методическим разработкам которой будут посвящены специальные статьи.
Заключение
За последние годы было опубликовано большое число исследований по различным аспектам цифровой социологии, в которую вовлечены ученые из многих научных областей.
Теоретики рассуждают о цифровом будущем, этичности цифровых исследований и сохранности конфиденциальных данных, о возможности внедрения цифрового права, строят классификации видов наблюдения, спорят о том, как в цифровом мире трансформируется менталитет, культура, традиции, как меняются политические дискуссии и религиозные верования.
Исследователи-практики с помощью методов цифровой социологии изучают и выявляют деструктивное поведение, психологические состояния людей, успеваемость школьников, взаимоотношения в семье, работу полицейских, деятельность государственных структур, способы вербовки в террористические организации, использование социальных сетей миллионерами, употребление неправильных английских глаголов, привычки покупателей и многое другое.
Одной из наиболее проблемных зон в цифровой социологии сегодня остается методология и методика исследований. Ученые ищут способы получения максимально адекватного знания, используя различные платформы, построенные на данных крупных медиа интернет игроков, таких как Твиттер, Фейсбук, Гугл. Могут ли они манипулировать данными, выдавая одни запросы и умалчивая о других? Насколько надежны эти сырые данные?
Сегодня исследователи, собирающие данные с помощью этих платформ, часто не знают, какая лингвистическая модель была заложена для поиска. В результате получаются нерелевантные данные, на основе которых делаются нерелевантные выводы. Доверять большим данным можно в том случае, когда известен сложный механизм, по которому поисковая машина отбирает одну информацию и отфильтровывает другую.
Исследования, построенные на мониторинге социальных медиа, не могут ответить на многие вопросы, отразить многогранную социальную реальность. Приблизиться к адекватному анализу реальности можно, только используя методы цифровой социологии в сочетании с методами социологии классической. Кроме того, цифровая социология представляет собой некую наддисциплинарную область исследований, которая не может обойтись без специалистов различного профиля. Здесь помимо социологов необходимы лингвисты, психологи, социальные антропологи, аналитики, программисты, IT-инженеры, математики. Тем самым цифровая социология обозначает перспективный вектор научного развития: конвергенцию наук и технологий.
References
1. Michael K., Clarke R. Location and tracking of mobile devices: Überveillance stalks the streets // Computer Law & Security Review. 2013. T. 29. №. 3.
2. Scahill J., Greenwald G. The NSA’s secret role in the US assassination program // The intercept. 2014. T. 10.
3. Zhang X., Xu H., Fang J. Multiple vehicle tracking in aerial video sequence using driver behavior analysis and improved deterministic data association // Journal of Applied Remote Sensing. – 2018. T. 12. №. 1.
4. Garattini C. et al. Big data analytics, infectious diseases and associated ethical impacts // Philosophy & technology. – 2019. T. 32. №. 1.
5. Chereshnev E.M.: Ya protiv chipirovaniya, potomu chto eta tekhnologiya na dannom etape nebezopasna // Robogik: informatsionno-analiticheskii resurs. URL: http://www.robogeek.ru/intervyu/evgenii-chereshnev-ya-protiv-chipirovaniya (data obrashcheniya: 02.05.2020)
6. Fourcade M., Healy K. Seeing like a market // Socio-Economic Review. – 2017. T. 15. №. 1.
7. Moral'nyi kodeks sotsiologa. 2008. URL: http://www.isprras.ru/pages_23/index.html (data obrashcheniya-14.05.2020)
8. Leetaru K., Schrodt P. A. Gdelt: Global data on events, location, and tone, 1979-2012 // ISA annual convention. Citeseer. 2013. T. 2. №. 4.
9. Leetaru K. Culturomics 2.0: Forecasting large-scale human behavior using global news media tone in time and space // First Monday. 2011. T. 16. №. 9
10. Greenwald G. How covert agents infiltrate the internet to manipulate, deceive, and destroy reputations // The Intercept. 2014. T. 24.
11. Taler R., Sanstein K. Nudge. Arkhitektura vybora. Kak uluchshit' nashi resheniya o zdorov'e, blagosostoyanii i schast'e. – M.: Mann, Ivanov i Ferber. – 2017.
12. Velikaya otechestvennaya voina. Fal'sifikatsiya istorii. Manipulyatsii v sotsial'nykh media // Kribrum. URL: http://kribrum.ru/upload/buklet.pdf?fbclid=IwAR0GCIWneW65Y216SagVzFRWc_4_rZY8YHF9V7EMD-v1yTckVVNStyHiqpI (data obrashcheniya: 21.05.2020)
13. Hochman N., Manovich L. Zooming into an Instagram City: Reading the local through social media // First Monday. 2013. T. 18. №. 7.
14. Manovich L. Teorii soft-kul'tury. – Nizhnii Novgorod. – 2017. 208 s.
15. Sloan L., Morgan J., Burnap P., Williams M. Who Tweets? Deriving the Demographic Characteristics of Age, Occupation and Social Class from Twitter User Meta-Data. PloS one. – 2015. T. 10. №. 3
16. Duggan M., Brenner J. The demographics of social media users 2012. Washington, DC: Pew Research Center's Internet & American Life Projec. 2013. T. 14.
17. Schwartz H. A. Personality, gender, and age in the language of social media: The open-vocabulary approach // PloS one. 2013. T. 8. №. 9.
18. Uiti, chtoby ostat'sya: Sotsiolog v pole. Seriya «Kachestvennye metody v sotsial'nykh issledovaniyakh»: Sb. statei / Pod red. V. Voronkova E. Chikadze. – SPb.: Aleteiya. – 2009.
|