Gartner<Reference Architecture Brief: Data Integration>学习心得

数据集成参考架构解析

引言

在当今数字化时代,数据已成为企业最宝贵的资产之一。随着企业规模的不断扩大和业务的日益复杂,数据来源也变得多样化,包括客户关系管理(CRM)、企业资源规划(ERP)、人力资源管理(HR)和市场营销等领域的运营系统。这些系统虽然在其特定功能领域表现出色,但将它们作为企业所有数据的中央存储库来满足运营、高级分析和人工智能/机器学习(AI/ML)需求则具有挑战性。因此,数据集成架构的设计与实施显得尤为重要。

架构核心概念

Gartner 将数据集成定义为一种学科,涵盖了架构模式、方法论和工具,使企业能够跨多种数据源和数据类型实现数据的稳定访问和交付,以满足业务应用程序和最终用户的数据消费需求。数据集成架构通过开发和监控数据管道,以系统化和一致的方式移动数据,从而提高数据的可用性和可理解性。

架构用例

数据集成在多个领域有着广泛的应用场景。例如,SaaS 数据集成能够将来自各种 SaaS 系统的数据整合在一起,创建更全面的分析;一致的报告和分析则确保所有系统使用相同的数据;主数据引用/同步将主数据分发或同步到中央位置,作为所有用户的参考;在数据集成管道中标准化/收集元数据可以收集操作和业务元数据;商业智能则通过整合来自各种业务功能的数据,提供全面的洞察和报告。

架构图解析

数据集成在核心功能层面涉及从源读取数据,无论直接还是间接,然后执行转换,再将其交付至目标系统。根据数据源、数据格式和业务用例,可以利用不同的方法和技术来集成和处理数据。如今的集成挑战主要源于多样化数据格式、动态商业模式和不断增长的数据量。集成架构需要读取和解析不同来源的数据,高效地组合和集成,然后将数据传递给下游进行消费或进一步处理。

架构能力与组件

数据集成架构包含八个组件:基于存储的数据源、ETL(提取、转换、加载)、ELT(提取、加载、转换)、事件代理/集群服务、流处理、API 网关、目标数据存储、数据可视化和元数据管理。

基于存储的数据源

基于存储的数据源是数据的生成器或需要集成的数据的位置。这些通常是某种类型的数据库,如关系型或非关系型数据库。它们以表格格式或不同结构组织数据。

存储类型
  • 关系数据库/数据仓库:如 Amazon Redshift、Google Cloud AlloyDB、Oracle、SQL Server 等。

  • 非关系数据库:如 Amazon DynamoDB、Apache Cassandra、MongoDB、Redis 等。

  • 数据湖:如 Amazon S3、Azure Data Lake Storage、Google Cloud Storage、Snowflake Cloud Data Platform 等。

  • 湖仓架构:如 Amazon Web Services(AWS)(多种服务组合)、Databricks、Microsoft Fabric Lakehouse 等。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.pswp.cn/pingmian/84481.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

JAVASE:方法

JavaSE 方法详解 一、方法的核心概念 方法(Method)是一组执行特定任务的语句集合,它将代码逻辑封装为可复用的单元,提高代码的模块化和可维护性。 方法的组成: [修饰符] 返回类型 方法名([参数列表]) {// 方法体[r…

MXNet-cu101 + CUDA 10.1 在 Windows 11 上启用 GPU 的完整指南

一、报错信息 (pytorch) C:\Users\Administrator\Desktop\test>D:/conda/anaconda3/envs/pytorch/python.exe c:/Users/Administrator/Desktop/test/test.py Traceback (most recent call last): File “c:/Users/Administrator/Desktop/test/test.py”, line 1, in import…

Python基础数据类型与运算符全面解析

Python作为一门动态类型语言,拥有丰富的内置数据类型和运算符系统,构成了编程的基础。本文将深入介绍Python核心数据类型的基本概念、特点及使用方法,并系统梳理运算符的分类、优先级和实际应用示例,帮助开发者全面掌握Python的基…

Mysql分区(单服务器应对大数据量方案)

参考资料: 参考视频 参考博客 分区的复杂操作 参考资料 概述: 这里只讲实操,不讲原理,看原理请看参考资料Mysql自5.1后支持分区,在Mysql8之后只有InnoDB支持分区,Mysiam不支持分区本例只是一个简单的说…

[Java恶补day22] 240. 搜索二维矩阵Ⅱ

编写一个高效的算法来搜索 m x n 矩阵 matrix 中的一个目标值 target 。该矩阵具有以下特性: 每行的元素从左到右升序排列。 每列的元素从上到下升序排列。 示例 1: 输入:matrix [[1,4,7,11,15],[2,5,8,12,19],[3,6,9,16,22],[10,13,14,17…

基于Master-Slave主从博弈论的储能与能源协调算法matlab仿真

目录 1.课题概述 2.系统仿真结果 3.核心程序 4.系统仿真参数 5.系统原理简介 6.参考文献 7.完整工程文件 1.课题概述 基于Master-Slave主从博弈论的储能与能源协调算法matlab仿真.主从博弈(Stackelberg Game)是一种具有层级决策结构的博弈模型&am…

vue-print-nb 打印相关问题

一、背景与解决方案 1、ElementUI表格打印通病,均面临边框丢失、宽度超出问题:相关解决代码有注释; 2、大多数情况下不会打印页眉页脚的日期、网址、未配置popTitle显示的undefined:相关解决代码有注释; 3、打印预览页…

Agent应用案例精选,以及主流Agent框架开源项目推荐

一、Agent技术概述 在人工智能领域,Agent(智能体)是指能够感知环境、自主决策并执行动作以实现特定目标的智能系统。随着大语言模型(LLM)的快速发展,基于LLM的Agent系统已成为当前AI研究的热点方向,为复杂任务解决提供了全新范式。 Agent的核心特征 自主性(Autonomy): 能够…

Linux下基础IO

1 文件 这里首先得理解一下文件,文件存放在磁盘中(磁盘是永久性存储介质,是一种外设,也是一种输入输出设备),磁盘上的文件的所有操作,都是对外设的输入和输出简称IO,linux下一切皆⽂…

云原生核心技术 (6/12): K8s 从零到一:使用 Minikube/kind 在本地搭建你的第一个 K8s 集群

摘要 本文是一篇保姆级的实践指南,旨在解决学习 Kubernetes (K8s) 时“环境搭建难”的头号痛点。我们将对比分析 Minikube、kind、K3s 和 Docker Desktop Kubernetes 等主流本地 K8s 环境方案的优缺点,帮助你选择最适合自己的工具。随后,文章…

线程运行的现象和相关指令

一.多个线程运行的现象 1.规律 交替执行谁先谁后,不由我们控制 2.举例 Slf4j(topic "c.Test6") public class Test06 {public static void main(String[] args) {//创建并运行线程1new Thread(()->{while (true){log.debug("running");…

Windows网络配置避坑指南

Windows网络配置避坑指南 一、网络配置是什么?防火墙的“信任开关”二、何时需要手动切换网络配置文件?​必需切换的场景高危!绝对禁止选错的两个场景三、3种切换指南(Win10/11通用)方法1:图形化操作(推荐小白)​方法2:用PowerShell强制切换方法3:注册表底层修改(应…

基于ThinkPHP8.*的后台管理框架--Veitool框架学习使用

基于ThinkPHP8.*的后台管理框架--Veitool框架学习使用 一、安装部署二、目录结构 一、安装部署 环境要求 Linux、Unix、macOS、Windows Nginx、Apache、IIS PHP > 8.1.0 MySQL > 5.7 下载地址 官网下载:https://www.veitool.com/download 境内仓库&#xff…

Java多线程通信核心机制详解

在Java中,多线程通信与协作主要通过以下几种核心机制实现,每种方式适用于不同的并发场景: 🔄 一、共享变量同步控制(基础方式) // 使用volatile保证可见性 private volatile boolean flag false;// 线程A…

Django知识-视图

视图设置 一个视图函数,简称视图,是一个简单的Python 函数,它接受Web请求并且返回Web响应。代码写在哪里也无所谓,只要它在你的应用目录下面。但是为了方便视图一般被定义在“应用/views.py”文件中。 视图的第一个参数必须为Ht…

DevSecOps实践:CI/CD流水线集成动态安全测试(DAST)工具

🔥「炎码工坊」技术弹药已装填! 点击关注 → 解锁工业级干货【工具实测|项目避坑|源码燃烧指南】 让安全扫描成为代码交付的“守门员” 引言:安全漏洞的代价,越早发现越好 在软件开发领域,安全漏洞的修复成本随着开发…

使用CSDN作为Markdown编辑器图床

使用CSDN作为Markdown编辑器图床 一、CSDN图床的优势 MD编辑器在撰写文档时功能强大,但插入图片需借助图床。CSDN作为免费图床,操作简单且稳定性高,适合日常使用。只需将图片上传至CSDN的MD编辑器,即可获取可直接访问的图片地址…

python打卡day51

复习日 作业:day43的时候我们安排大家对自己找的数据集用简单cnn训练,现在可以尝试下借助这几天的知识来实现精度的进一步提高 还是继续用上次的街头食物分类数据集,既然已经统一图片尺寸到了140x140,所以这次选用轻量化模型 Mobi…

Vuex 自动化生成工具

Vuex 自动化生成工具需求文档 1. 需求背景 为提升前端开发效率,减少重复代码编写,需开发一个自动化工具,根据输入参数自动生成完整的 Vuex 存储模块(包括api.js,mutations.js,actions.js,gette…

深入浅出多路归并:原理、实现与实战案例解析

文章目录 二路归并多路归并方法一:指针遍历(多指针比较法)方法二:小根堆法(最小堆归并) 实际场景外部排序 经典题目丑数Ⅱ方法一:三指针法方法二:优先队列法(K路归并&…