Науки о Земле

Принципиально новый подход к пространственной индексации объектов на земной поверхности, который повысит ее производительность в 5-6 раз, предложили ученые МИИГАиК. По их мнению, новый подход найдет применение в системах экологического мониторинга, городского управления, логистики и других пространственных моделях любого масштаба и назначения. 

Индексация — это краеугольный камень всех современных баз данных. Именно благодаря ей возможно из миллионов и миллиардов записей найти необходимые практически моментально. Простейшим, знакомым всем индексом является алфавитный указатель в книге, сообщил доцент кафедры информационно-измерительных систем Московского университета геодезии и картографии (МИИГАиК) Олег Гвоздев.

"Пространственные индексы, в свою очередь, позволяют быстро искать пространственные объекты, имея координаты в пространстве. Найти ближайшую станцию метро или ресторан. Направить обращение в обслуживающую конкретный адрес диспетчерскую скорой помощи или пожарной. Распределить нагрузку на сотрудников курьерской службы и пункты самовывоза. Сформировать отчет, отражающий распределение событий по районам города и решить другие повседневные задачи", — рассказал Гвоздев.

Олег Гвоздев отметил, что обычные методы пространственной индексации позволяют найти объекты, близкие к нужной области, но каждый из них нужно проверить на точное совпадение требованиям запроса.

"Наш метод позволяет сразу получить готовый результат, не обращаясь к данным этих объектов. Более того — он позволяет устранить повторные проверки, для случаев, когда, например, несколько объектов имеют общие точки или границы. Это существенно сокращает объем вычислений и дает 5-6-кратный прирост производительности, по сравнению с доминирующими на рынке универсальными решениями (PostgreSQL+PostGIS), и до 30 процентов — по сравнению со специализированными высокопроизводительными методами на базе сеточных индексов", — пояснил он.

По мнению авторов, предлагаемый метод будет особенно полезен в системах типа "умный город" или "цифровой двойник", куда данные поступают непрерывным потоком, а количество запросов достигает нескольких десятков тысяч в секунду, и уже в этом десятилетии может достичь уровня миллионов в секунду.

Другое потенциальное направление применения разработки — "наука о данных" (Data Science) и анализ больших данных (Big Data Analytics), которые лежат в основе современных методов выработки рациональных управленческих решений в коммерческих организациях и общественных институтах.

"Этот результат усиливает и дополняет существующую инструментальную базу, доступную исследователям и разработчикам. С его помощью можно оптимизировать решение множества практически значимых задач. А он, в свою очередь, основан на еще более фундаментальных исследованиях в области теории построения адаптивных информационных и геоинформационных систем. Все это способствует выходу геоинформатики на новый виток интенсивного развития", — рассказал Олег Гвоздев.

В заключение ученый напомнил, что любой способ высвободить 5 процентов или даже 2 процента вычислительной мощности позволяет провести больше экспериментов, проанализировать больше данных, а в перспективе — совершить новые открытия. К тому же, предложенный метод принципиально расширяет инструментальную базу специалистов в Data Science. 

Источник: РИА Новости