Данные окружают нас, данные о прошлом можно встретить повсюду. Актуальные данные очень быстро становятся данными о прошлом. Ученые наблюдают сегодня процесс датафикации, то есть устойчивую фиксацию массовых наблюдений в разных форматах данных, позволяющих осуществить их качественную и количественную обработку, их научный анализ и синтез. Часто можно встретить и такое понятие, как датаизм – это точка зрения, что Вселенная состоит из потоков данных, когда ценность всякого явления определяется вкладом в обработку данных.
Если данные (data) часто имеют заранее заданную строгую структуру, заданную программой и методикой сбора, то так называемая капта (capta) устроена иначе – это исследовательский «улов», самостоятельно и тщательно собранные данные с целью решить важную научную проблему.
Как быть историку в этом новом мире, где базы данных собираются в репозитории данных, а из репозиториев данные стекаются в озера данных?
Как осмыслить собственный «улов» данных и как ученому совладать с океаном данных в эпоху машинного обучения?