Массово-параллельная архитектура (Massive Parallel Processing, MPP)
- Класс параллельных вычислительных систем, состоящих из множества узлов, где каждый узел представляет собой автономную, независимую от других единицу
- Если применить это определение к области хранилищ данных, то лучше всего его смысл будет отражать термин «распределённые базы данных»
- Каждый узел в распределенной базе данных представляет собой полноценную СУБД, работающую независимо от других
- Сама же распределенная база данных – это совокупность независимых, автономных узлов, связанных коммуникационной сетью
Плюсы-минусы
Плюсы:
- линейная масштабируемость, которая обеспечивает стабильные и предсказуемые параметры производительности и развитие системы.
Минусы:
- чтобы соответствовать функциональным требованиям ACID, система должна получить отклик от каждого узла, поэтому коммуникационная сеть между узлами должна обладать высокой пропускной способностью, а также отказоустойчивостью.
Технологии
- Teradata Database 14
- Google Big Query
- Amazon Redshift
- Apache Hive
- EMC Greenplum
- HP Vertica
- Sybase IQ
- IBM Netezza
- IBM InfoSphere Warehouse
- Microsoft PDW
- Vertika