Anton Sidorov homepage

Bookmark this to keep an eye on my project updates!

Follow me on GitHub

Data Vault

Зачем

Одна из моделей хранилищ данных Data Warehouse с временными отметками размещения данных в архитектурном стиле BigData.

  • следствие необходимости избавиться от последовательного изменения множества связанных таблиц в случае изменения ключевых полей одной из них
  • подтип хранилищ с измерениями

Структура организации данных состоит из:

  • Хабов
  • Связей
  • Сателлитов

Плюсы-минусы

Плюсы:

  • возможность использования гибкого подхода к конструированию
  • Хранение версионных записей в небольших специализированных Сателлитах, а не полноразмерных фактовых таблицах, уменьшает общий объем базы данных
  • Сателлиты связаны с Хабами и Связями по принципу «один ко многим» (например, несколько контактных телефонов одного клиента). Это делает структуру хранилища интуитивно понятной и обеспечивает простой доступ к анализу информации.
  • При необходимости можно создать дополнительные Сателлиты под конкретные задачи без нарушения структуры Data Vault (например, отдельный Сателлит для загрузки информации из нескольких внешних источников данных).

Минусы:

  • Относительно РСУБД, сложность проектирования

Технологии