Big Data для историков: уже реальность или все еще перспектива?
Д.и.н. наук, профессор, зав. кафедрой исторической информатики Л.И.Бородкин посвятит свою лекцию ответу на вынесенный в заголовок вопрос. Прежде всего необходимо определиться с понятием, ведь, если следовать авторам вышедшей в 2015 г. в США книги «Exploring Big Historical Data: The Historian’s Macroscope», то это такие данные источников, которые требуют компьютерной обработки для их понимания. Приведенное определение позволило авторам провозгласить, что историки живут в мире больших данных. Однако можно следовать и устоявшемуся определению больших данных, в соответствии с которым Big Data – это данные, которые имеют своими источниками непрерывно поступающую информацию с измерительных устройств, потоки сообщений из социальных сетей, метеорологические данные, потоки данных о местонахождении абонентов сетей сотовой связи и т. д. Если исходить из последнего определения, то вопрос о данных подобного рода в исторических исследованиях пока только обсуждается. Тем более что, говоря о реализации технологий Big Data, часто отмечают в качестве базового принципа обработки больших данных массово-параллельную обработку неопределенно структурированных данных, распределенных на сотни вычислительных узлов, на основе специализированных аппаратно-программных комплексов. Тем не менее уже сегодня можно говорить о проблеме анализа больших данных в исторических исследованиях. Характерной их особенностью является не только огромный объем источников, лежащих в основе масштабных компаративных исследовательских проектов, реализуемых историками в составе международных коллабораций, но и вариативность этих источниковых комплексов, охватывающих тексты и статистику, визуальные и аудиоматериалы и т. д. Особенности источников такого рода делают неизбежными особые приемы их анализа и обработки. В лекции будут приведены примеры исторических исследований на основе анализа Big Data, включая проекты CLARIAH (Common Lab Research Infrastructure for the Arts and Humanities), IPUMS (Integrated Public Use Microdata Series), а также российские проекты по созданию виртуальных реконструкций историко-культурного наследия.