1、问题现象
分布式集群采用水平分表的方式,将业务数据表的元组/行打散存储到各个节点内。
2、技术背景
通过全并行数据处理技术和快速定位到数据存储位置等手段可极大提升数据库性能,GaussDB分布式部署下可以创建俩种类型表,在做实际业务系统开发时根据业务场景创建不同表。复制表一般使用在小数量、更新操作少的场景下。
- 分布表:数据会根据函数映射(hash,range,list),将数据打散在不同的DN上存储。
- 复制表:每个DN上copy一份完整的数据。
如下图:复制表与分布表数据处理过程
有四种分式方式:
分布方式 | 说明 |
Replication | 集群中每一个DN都有一份全量表数据。 |