loader image
Гравитация данных

Что такое гравитация данных и как с ней бороться?

С развитием цифровой экономики объём генерируемых, потребляемых, копируемых и хранимых данных динамично растёт. Так, например, в 2021 году общий мировой объём данных достиг уровня 79 зеттабайт. Ожидается, что к 2025 году это значение удвоится. Расширение объёма данных привело к появлению явления, известного как гравитация данных.

Что такое гравитация данных

Этот термин впервые был использован в 2010 году Дэйвом МакКрори, руководителем отдела анализа и аналитики компании Digital Realty, оператора центров обработки данных. Эксперт имел в виду наблюдаемую особенность, характеризующую большие наборы данных. Она заключалась в склонности притягивать к себе меньшие наборы данных, приложения и сервисы – точно так же, как планеты притягивают спутники силой гравитации. Таким образом, чем больше гравитация (база данных), тем больше объектов (данных, приложений и сервисов) она притягивает.

Со временем термин «гравитация данных» также стал обозначать сложность перемещения больших и «тяжёлых» наборов данных. Этот процесс становится всё более обременительным из-за возрастающей важности данных и их неотъемлемой роли в деятельности компаний. Таким образом, это может сделать смену поставщиков облачных услуг или перемещение данных обратно локально не только трудным и дорогим, но также медленным и ресурсоёмким.

Поэтому при разработке решений, использующих бизнес-данные, важно учитывать не только текущую значимость данных, но и их потенциальный рост. Плотность данных со временем увеличится и привлечёт больше приложений и услуг. Это явление вызвано двумя причинами:

  • постоянным внедрением новых технологий, таких как популярный искусственный интеллект;
  • растущими потребностями в локализации, регулировании и суверенитете данных.

Это представляет проблему для предприятий.

Гравитация данных: как с ней бороться

Для гарантии того, что предоставляемая информация актуальная, точная и полезная, ею необходимо эффективно управлять. Без правильных политик, процедур и правил объём данных в хранилище или другом наборе данных может стать огромным. Хуже того, эти данные могут остаться неиспользованными. Умное управление, в свою очередь, создаёт данные более высокого качества. Оно позволяет легко их идентифицировать, находить и перемещать при необходимости.

Серьёзность данных оказывает большое влияние на возможности интеграции данных, особенно когда речь идет об унификации систем, сокращении нерациональных ресурсов или переработке решений. Поэтому заранее понимание того, как это явление повлияет на организацию, должно обеспечить соответствующие средства для борьбы с быстро растущим воздействием данных на систему. В частности, стоит сосредоточиться на оптимизации хранилища, чтобы обеспечить большую эффективность манипулирования данными.

Проблема, возникающая из-за растущей важности данных, заключается в задержке, которая возникает, когда приложения начинают слишком далеко отходить от используемых данных. Поэтому предприятиям следует сосредоточиться на том, чтобы баланс пропускной способности и рабочей нагрузки рос по мере увеличения объёма данных.

В этом поможет использование периферийных вычислений. Оно заключается в размещении вычислительных мощностей и приложений ближе к месту генерации данных. Это может уменьшить необходимость перемещения больших объёмов данных на большие расстояния, упрощая обработку и анализ данных в режиме реального времени.

Мультиоблачная стратегия

Ещё один способ справиться с гравитацией данных – принять мультиоблачную стратегию. Это означает использование нескольких поставщиков облачных услуг для использования различных функций, предлагаемых каждым из них. Это должно помочь смягчить последствия гравитации данных, позволяя перемещать данные и вычислительные мощности между поставщиками.

Организации также могут реплицировать данные и хранить их в нескольких местах. Это может быть полезно в случаях, когда:

  • переносимость данных невозможна;
  • данные ценны и важно иметь резервную копию данных на случай любого сбоя.

Наконец, Вы можете использовать облачные службы управления данными. Эти сервисы могут автоматизировать многие процессы, связанные с перемещением данных между разными местами. Это упрощает борьбу с гравитацией данных.

Предыдущая запись
PEP 703: Python наконец-то удалит GIL из интерпретатора CPython?
Следующая запись
Электронная коммерция: 11 технологических тенденций, которые её стимулируют
Добавить комментарий
Ваш электронный адрес не будет опубликован. Обязательные поля помечены *