数据分析实战2(Tableau)

1、Tableau功能

数据赋能(让业务一线也可以轻松使用最新数据)

  • 分析师可以直接将数据看板发布到线上
  • 自动更新看板
  • 自由下载数据
  • 线上修改图表
  • 邮箱发送数据
  • 设置数据预警

数据探索(通过统计分析和数据可视化,从数据发现问题,用数据验证假设)

  • 支持亿级数据的连接和处理
  • 自由地对字段进行各种计算
  • 拖拽就可以轻松制作图表
  • 数据可以随意聚合下钻
  • 图表类型可以灵活转换
  • 内置算法智能建模

2、下载安装

下载网址:https://www.tableau.com/zh-cn/products/public/download

3、数据连接

①连接类型

  • 本地文件
    • csv数据连接到文本
    • xls/xlsx连接到Excel
    • json直接连接到json
  • 数据库
    • 下载数据库对应的驱动后,填写地址等参数连接到对应数据库

②连接方式

  • 默认使用智能连接,只需选择连接所用的数据字段即可
  • 连接所用的字段可以通过函数进行计算和编辑
  • 表格之间的连接原理
  • 课程操作 

③提取方式

  • 实时
    • 每次计算都会连接一次数据库进行取数运算
    • 这是因为Tableau的本质是Vizql查询语言,每做一个操作就查询一次是可以实现的不过在数据量级较大的情况下就会比较慢了
  • 数据提取
    • 将当前连接所涉及的数据全部都查询提取到hyper格式的数据提取(相当于Tableau自己的数据库和对应类型的文件)
    • 如果保存为twbx格式,hyper会自动打包进twbx,使tableau自带数据
    • 缺点是每次修改完数据源都要重新提取一遍数据,如果是实时,则不需要先提取,等你作图时他才会再提取
    • 如果要将Tableau上传到Sever服务器,则必须使用提取的数据连接方式
    • 其实大量级数据都要用数据提取,除了修改连接键,其他操作在工作表的视图界面都能操作

④提取选项

  • 如果选择数据提取,Tableau还支持对表格进行基于字段和函数的增量刷新,提升数据提取的性能,但百万级以下的数据,除非频繁提取,否则一般不需要这样操作

⑤连接筛选

  • 可以在提取数据后进行预筛选,只保留筛选后的数据进行视图操作保存类型
  • twb不包含数据
  • twbx内置数据到tableau的文件中点提取但是还没保存时,tableau会让你先保存提取的数据数据处理
  • 可以查看数据,进行排序、重命名、拆分等操作,这些操作在做图界面也可以完成

⑥理解本次课程的数据

  • shop表有2385行
  • cpc表有1177行
  • orders表有4419行

4、数据可视化原理

人是可视化动物,看图比看数据快

①2类型:

  • 度量:映射图形
    • 可映射的图形类型
      • 位置
      • 长度
      • 角度
      • 方向
      • 形状
      • 面积和体积
      • 颜色和深浅
  • 维度:负责区分

②将数据变成图表

  • 对【度量】和【维度】进行拖拽操作,从而完成可视化图标的制作,是被称作Tableau第一概念,是最重要的知识。(!!智能推荐不算作图)
    • 行:纵坐标
    • 列:横坐标

  • 离散形成标签,连续形成数轴

③5个知识点总结

  • 度量默认聚合
  • 度量值会形成图形标记,图形标记可以切换
  • 维度会对度量值进行区分,增加度量值的信息密度(单个图标传达信息的多少)
  • 图标分为有轴图标和无轴图表(极坐标图表)
  • 离散形成标签,连续形成数轴

④基础图标制作

堆积图:

折线图:

面积图:

5、数据可视化原则、BI仪表盘搭建

(1)数据可视化原则

  • 区分用户
  • 主次分明、详略得当
    • 强调信息的方式有很多种,用恰当的方式去强调恰当的内容
  • 真实准确:数据要从0开始
  • 符合大众的认知和审美
  • 适度原则
    • 颜色不超过8种
    • 排版、字体、大小、形状等都要合适
    • 避免使用3d效果,容易产生错觉
  • 五秒原则(5秒能看懂)
  • 恰到好处的说明(说明:标题、图例、标注等)
  • 少即是多
  • 可视化案例

(2)BI仪表盘搭建

①仪表盘搭建原则

  • 符合业务的阅读、思考、操作逻辑

②明确仪表盘主题

观众是谁,他们对什么感兴趣

  • 普通业务人员(跟业务相关的数据)
    • 销售:注册—激活—成交
    • 投放:消耗—转化率
    • 运维:搬车数—换电数
  • 中层管理者
    • 整体的总体报告
      • 业务整体的绝对值、达成率、同比环比;
      • 有哪些数据异常、优秀表现
    • 各个维度的数据
      • 各个业务动作的绝对值、达成率、同比环比
      • 数据异常的具体原因
  • 高层管理者
    • 整体的总结报告
      • 业务整体的绝对值、达成率、同比环比;
      • 有哪些数据异常、优秀表现
  • 用人单位
    • 有一个明确的分析主题
    • 分析维度越多越好
    • 图标越高级越好

课程数据可发挥的主题

  • 每日营收情况
  • 无效订单与配送距离的关系
  • 用户下单时间分布
  • 用户客单价变化
  • cpc投放效果

③仪表盘主题拆解

  • 怎样的数据能表达清楚想说的主题?
    • 这个主题涉及到哪些数据?
    • 数据的重要程度是否相同?
    • 最适合数据的图表是那种?
      • 对比
        • 绝对值对比——条形图/柱状图
      • 变化
        • 没有累计关系——折线图+柱状图
        • 有累计关系——面积图/堆积图
      • 构成
        • 对象少于3个——环形图
        • 对象大于3个——树地图
      • 分布
        • 单变量分布——直方图
        • 多变量分布——散点图、气泡图
  • 以每日营收情况主题为例
    • 关键数据
      • 营收数据
        • GMV
        • 商家实收
        • 用户实付
        • 总订单数
        • cpc总费用
        • 各平台数据对比
      • 流量数据
        • 曝光人数
        • 进店人数
        • 下单人数
        • 进店转化率
        • 下单转化率
        • 新客数
        • 老客数
        • 复购率
    • 数据排序
      • 营收>投放>流量
    • 图表选择
      • 经营情况总览:突出显示的文字
      • 经营数据详情:表格
      • 每日营收数据:多轴折线图
      • 每日流量数据:双轴组合图
      • 新老客占比:环形图
      • 平台占比:环形图
      • 门店排名:条形图
      • 投放情况:散点图

④开发设计工作表

  • 经营情况总览:突出显示的文字
  • 经营数据详情:表格
  • 每日营收数据:多轴折线图
  • 每日流量数据:双轴组合图
  • 新老客占比:环形图
  • 平台占比:环形图
  • 门店排名:条形图
  • 投放情况:散点图

⑤构思仪表盘布局

⑥加“亿点点”细节

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.pswp.cn/pingmian/84253.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

CentOS7_Linux下安装Docker和docker-compose

目录 环境要求安装步骤1、修改镜像源配置文件2、卸载旧版本 Docker(如有)3、安装依赖工具4、添加 Docker 官方仓库5、安装 Docker 引擎6、启动 Docker 并设置开机自启7、验证安装8、配置镜像加速器创建配置文件重启 Docker 生效 9、允许非 root 用户操作…

ubuntu中使用docker

上一篇我已经下载了一个ubuntu:20.04的镜像; 1. 查看所有镜像 sudo docker images 2. 基于本地存在的ubuntu:20.04镜像创建一个容器,容器的名为cppubuntu-1。创建的时候就会启动容器。 sudo docker run -itd --name cppubuntu-1 ubuntu:20.04 结果出…

均衡后的SNRSINR

本文主要摘自参考文献中的前两篇,相关文献中经常会出现MIMO检测后的SINR不过一直没有找到相关数学推到过程,其中文献[1]中给出了相关原理在此仅做记录。 1. 系统模型 复信道模型 n t n_t nt​ 根发送天线, n r n_r nr​ 根接收天线的 MIMO 系…

佰力博科技与您探讨热释电测量的几种方法

热释电的测量主要涉及热释电系数的测定,这是表征热释电材料性能的重要参数。热释电系数的测量方法主要包括静态法、动态法和积分电荷法。其中,积分电荷法最为常用,其原理是通过测量在电容器上积累的热释电电荷,从而确定热释电系数…

idea中 maven 本地仓库有jar包,但还是找不到,解决打包失败和无法引用的问题

1、删除本地仓库中的文件 进入本地仓库对应jar包文件目录中删除_remote.repositories文件和结尾为.lastUpdated的文件 2、回到IDEA刷新Maven 3、查看之前引用不了的jar是否引入成功

ALOHA ACT算法与源码笔记

算法 一文通透动作分块算法ACT:斯坦福ALOHA团队推出的动作序列预测算法(Action Chunking with Transformers) 比较简单,算法题目里就写了:Action Chunking with Transformers,比较有特色的地方就是Action Chunking,核…

数字ic后端设计从入门到精通6(含fusion compiler, tcl教学)repeater详解

Repeaters RC延迟与导线长度的关系: 导线的电阻(R)和电容(C)都会随着导线长度(l)的增加而增大。RC延迟是电阻和电容共同作用导致的信号延迟。由于RC延迟与R和C的乘积有关,因此它会随…

Data Warebase 成功押注 PostgreSQL 生态,或成 AI 时代数据底座

本文内容整理自 ProtonBase CEO 王绍翾在 AICon 的主题演讲《Data Warebase: Instant Ingest-Transform-Explore-Retrieve for AI Applications》。作者的职业经历贯穿了 AI 1.0、2.0 和 3.0 的时代,从搜索推荐,到视觉 / 语音 / NLP 智能,再到…

【电力电子】基于STM32F103C8T6单片机双极性SPWM逆变(硬件篇)

本项目是基于 STM32F103C8T6 微控制器的 SPWM(正弦脉宽调制)电源模块,能够生成可调频率和幅值的正弦波交流电源输出。该项目适用于逆变器、UPS电源、变频器等应用场景。 供电电源 输入电压采集 上图为本设计的电源电路,图中 D1 为二极管, 其目的是防止正负极电源反接, …

Kubernetes (k8s)版本发布情况

Kubernetes (k8s)版本发布情况 代码放在 GitHub - kubernetes/kubernetes: Production-Grade Container Scheduling and Management https://github.com/kubernetes/kubernetes/releases 文档放在 kubernetes.io各个版本变更等: https://github.com/kubernetes/kubernet…

Python 接口:从协议到抽象基 类(Python使用register的方式)

Python使用register的方式 示例 11-14 把 Tombola.register 当作类装饰器使用。在 Python 3.3 之 前的版本中不能这样使用 register,必须在定义类之后像普通函数那 样调用,如示例 11-14 中最后那行注释所述。 虽然现在可以把 register 当作装饰器使用了…

GRU 参数梯度推导与梯度消失分析

GRU 参数梯度推导与梯度消失分析 1. GRU 前向计算回顾 GRU 单元的核心计算步骤(忽略偏置项): 更新门: z_t σ(W_z [h_{t-1}, x_t]) 重置门: r_t σ(W_r [h_{t-1}, x_t]) 候选状态: ̃h_t tanh(W_h [r_t ⊙ h_{t-1}, x_t]) 新…

【字节拥抱开源】字节团队开源视频模型 ContentV: 有限算力下的视频生成模型高效训练

本项目提出了ContentV框架,通过三项关键创新高效加速基于DiT的视频生成模型训练: 极简架构设计,最大化复用预训练图像生成模型进行视频合成系统化的多阶段训练策略,利用流匹配技术提升效率经济高效的人类反馈强化学习框架&#x…

分布式增量爬虫实现方案

之前我们在讨论的是分布式爬虫如何实现增量爬取。增量爬虫的目标是只爬取新产生或发生变化的页面,避免重复抓取,以节省资源和时间。 在分布式环境下,增量爬虫的实现需要考虑多个爬虫节点之间的协调和去重。 另一种思路:将增量判…

单片机0-10V电压输出电路分享

一、原理图 二、芯片介绍 GP8101是一个PWM信号转模拟信号转换器,相当于一个PWM信号输入,模拟信号输出的DAC。此 芯片可以将占空比为0%到100%的PWM信号线性转换成0-5V或者0-10V的模拟电压,并且输出电压 精度小于1%。GP8101M可以处理高频调制的…

Spring AMQP

在现代分布式系统中,消息队列是一种非常重要的通信机制,它能够实现服务之间的异步通信、负载均衡以及解耦。Spring AMQP 是 Spring 框架对 AMQP(高级消息队列协议)的支持,而 RabbitMQ 是 AMQP 协议的最流行实现之一。通…

第6章:Neo4j数据导入与导出

在实际应用中,数据的导入与导出是使用Neo4j的重要环节。无论是初始数据加载、系统迁移还是数据备份,都需要高效可靠的数据传输机制。本章将详细介绍Neo4j中的各种数据导入与导出方法,帮助读者掌握不同场景下的最佳实践。 6.1 数据导入策略 …

RKNN开发环境搭建1-基于Ubuntu 18.04系统使用Docker安装rknn-toolkit2

目录 写在最前面Docker 方式安装rknn-toolkit2写在最前面 瑞芯微在RKNN的环境搭建方面的资料很多,但是在搭建过程中发现很多问题教程中并未提及,对初学者不友好。所以博主做了这个系列的文章,从开始搭建环境到对于RKNN Model Zoo的示例进行实践,希望能对初学者有帮助。坚持…

【实施指南】Android客户端HTTPS双向认证实施指南

🔐 一、所需准备材料 证书文件(6类核心文件) 类型 格式 作用 Android端要求 CA根证书 .crt/.pem 验证服务器/客户端证书合法性 需预置到Android信任库 服务器证书 .crt 服务器身份证明 客户端需持有以验证服务器 客户端证书 .crt 客户端身份…

FPGA管脚类型,及选择

fpga的IO Type选择,如下: 具体的定义: