#Наука в России

Ученые факультета ВМК МГУ с коллегами представили результаты исследования, посвященного развитию вероятностно-информированного подхода в машинном обучении для прогнозирования характеристик сетевого трафика и детектирования событий в нем. Новый метод опубликован в журнале Computer Networks. Развитие предлагаемых методов актуально для решения задач оптимизации производительности телекоммуникационных сетей и управления качеством обслуживания. Это способствует повышению эффективности, надежности и устойчивости к внешним сбоям, а также снижению затрат на эксплуатацию и обслуживание.

Сети пятого (5G) и последующих поколений будут обслуживать большое количество пользователей, предоставляя широкий спектр приложений с высокими скоростями передачи данных и строгими требованиями к качеству обслуживания. Чтобы удовлетворить эти требования, сеть должна поддерживать точную реконструкцию исторических событий, обнаружение инцидентов в реальном времени и прогнозирование будущих событий, связанных с качеством обслуживания. Это необходимо для динамического распределения сетевых ресурсов для различных приложений посредством «нарезки» сети.

«Мы разработали инновационный метод, который сочетает сильные стороны машинного обучения и статистических моделей. Это позволило значительно повысить качество обработки сетевого трафика», – отметил Андрей Горшенин, доцент кафедры математической статистики факультета ВМК МГУ, главный научный сотрудник и руководитель отдела ФИЦ ИУ РАН. 

В работе предложена регрессионная модель глубокой гауссовой смеси, в которой сначала выполняется предварительная кластеризация на основе нейронной сети и конечных нормальных смесей. Затем эта информация используется в качестве входных данных для алгоритмов машинного обучения с учителем, таких как градиентный бустинг. Подобный подход, являющийся одним из возможных вариантов вероятностного информирования моделей машинного обучения, позволил значительно повысить точность прогнозирования. Так, в ходе тестирования на реальных данных мобильных операторов связи было продемонстрировано уменьшение ошибок в метриках RMSE и MAPE на 13% и 35,7%, соответственно, по сравнению со стандартными для данных задач алгоритмами машинного обучения и рекуррентными нейронными сетями LSTM.

Основные полученные результаты включают вероятностно-информированный подход к машинному обучению для телекоммуникационных сетей, регрессионную версию глубоких гауссовых смесей – первую реализацию данной нейросетевой архитектуры для задач обучения с учителем, а также ансамблевый метод детектирования аномальных наблюдений на базе вероятностной модели сетевого трафика, основанной на обобщенном гамма-распределении, элементов математической теории экстремальных значений и композиции алгоритмов машинного обучения.

«Наше исследование показывает, что вероятностно-информированные подходы оказываются точнее и вычислительно эффективнее в задачах анализа данных современных сетей связи. Их дальнейшее развитие видится в разработке более сложных глубоких архитектур и расширении областей применения», – добавляет Андрей Горшенин.

Новый метод значительно повышает точность и эффективность анализа данных в телекоммуникационных сетях, а также снижает вычислительные затраты.