数据产品(2)用户画像数据分析模型

目录

  • 1 用户画像
  • 2 RFM模型 (用户价值分群模型)
  • 3 PSM 价格敏感度
  • 4 精细化运营

1 用户画像

也称用户表标签,是基于用户行为分析获得的对用户的一种认知表达,即用户数据标签化,通过收集与分析用户的用户属性(年龄、性别、城市、职业、设备、状态)、用户偏好(购物偏好,听歌偏好、访问时间偏好)、用户行为(近N日行为、消费行为、售后行为、累计行为:购物金额订单数客单价)、用户分层(rfm、会员分层、生命周期、预流失模型、活跃分层、消费分层)等,抽象出一个用户的全貌。
各类应用推荐场景

2 RFM模型 (用户价值分群模型)

用于判断用户价值度,通过三个指标进行综合分析,可以将客户分为不同的类别,如高价值客户、重要挽留客户、低价值客户等,从而方便市场业务部门根据不同的客户群体制定相应的营销策略,以实现低成本高回收。

Recency 越小越好:最近一次消费距今多久(消费周期的标签)7天作为阈值,小于7天或者大于等于7天
Frequency 越大越好:某段时间内消费频率或次数:半年为周期,小于25次大于等于25次
Monetary 越大越好:某段时间内消费金额:半年为周期,小于2000大于等于2000
都是按照用户ID进行分组,按照相应的指标进行聚合

RFM模型的作用:
RFM模型作用
RFM模型的作用
RFM如何使用
每个维度划分两个区间:2^3=8组
每个维度划分三个区间:3^3=27组
每个维度划分五个区间:5^5=125组

RFM使用场景
M需要有消费、F需要有一定的频次,频次还需要有区分度、R最近半年/一年用户需要出现过
外卖/打车/电商

RFE(RFM变种)
Engae:参与度、浏览、收藏、点赞、评论、弹幕、分享
浏览*1 收藏*2 点赞*3 评论*4 弹幕*5 分享*6
适用于信息流产品:微博、今日头条、朋友圈、短视频、抖快

RFM计算流程

1.第一步,以用户为分组,
R:使用from_unixtime函数将时间戳转化成日期格式并使用max函数计算出每个用户最新的消费时间
F:使用counDistinct函数计算出每个用户不同订单的订单总数,
M:sum计算出每个用户所有订单金额之和
2.第二步:把每个维度划分为5个区间,在1-5之间打分,根据制定的打分标准使用when函数和otherwise函数为每个用户打分,打分标准可以使用describe()函数计算出最大值和最小值去指定,需要注意的是,消费周期这个是时间越短分数越高,如果when的条件是多个,需要用&符号连接
3.第三步:提前计算出三个维度分数平均分,把用户R F M三个维度的分数和三个维度的平均分数进行比较,把每个维度划分为两个区间比较,如果用户分数大于等于平均分就是 1 这个区间,反之就是 0,然后使用withColumn函数添加R F M三个维度计算出的区间也就是0和1合并为RFM的列
4.第四步:把得到的RFM列和5级标签的rule使用join连接,进行规则匹配,从而得出每位用户RFM标签

       # 1.根据用户id分别计算RFM的原始值esDF2:DataFrame=esDF.groupby('memberid').agg(F.datediff(F.date_sub(F.current_date(),1027),F.from_unixtime(F.max('finishtime'))).alias('recency'),F.countDistinct('ordersn').alias('frequency'),F.sum('orderamount').alias('monetary'))# esDF2.show()# +--------+-----+---------+------------------+# | memberid | recency | frequency | monetary |# +--------+-----+---------+------------------+# | 29 | 60 | 246 | 403524.2501525879 |# | 474 | 60 | 105 | 203666.499929199 |# esDF2.describe().show()# +-------+------------------+-------------------+------------------+--------------------+# |summary|          memberid|            recency|         frequency|            monetary|# +-------+------------------+-------------------+------------------+--------------------+# |  count|               950|                950|               950|                 950|# |   mean|             475.5|   60.0178947368421|126.44736842105263|   366299.1070466518|# | stddev|274.38567746877766|0.14035852584856298| 39.00137616686665|  3276502.4657239863|# |    min|                 1|                 60|                81|  114856.25006103516|# |    max|               950|                 62|               355|1.0018663619982529E8|# +-------+------------------+-------------------+------------------+--------------------+# 2.每个维度分成5份,根据业务规则标准打分# R 0~30 5 31~60 4 61~90 3 91~140 2 141 1recency = F.when(esDF2.recency <= 30, 5) \.when((esDF2.recency >= 31) & (esDF2.recency <= 60), 4) \.when((esDF2.recency >= 61) & (esDF2.recency <= 90), 3) \.when((esDF2

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/web/94310.shtml
繁体地址,请注明出处:http://hk.pswp.cn/web/94310.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

03_数据结构

第3课&#xff1a;数据结构 课程目标 掌握Python的基本数据结构&#xff1a;列表、元组、字典、集合学习字符串的高级操作方法理解不同数据结构的特点和适用场景 1. 列表&#xff08;List&#xff09; 1.1 列表的创建和基本操作 # 创建列表 fruits ["苹果", "香…

【JavaEE】多线程 -- CAS机制(比较并交换)

目录CAS是什么CAS的应用实现原子类实现自旋锁ABA问题ABA问题概述ABA问题引起的BUG解决方案CAS是什么 CAS (compare and swap) 比较并交换&#xff0c;CAS 是物理层次支持程序的原子操作。说起原子性&#xff0c;这就设计到线程安全问题&#xff0c;在代码的层面为了解决多线程…

The United Nations Is Already Dead

The United Nations Is Already Dead When children in Gaza rummage through rubble for food, when UN-run schools are reduced to dust, when the Security Council cannot even pass the mildest ceasefire resolution—blocked by a single veto— we must confront a br…

Kubernetes v1.34 前瞻:资源管理、安全与可观测性的全面进化

预计正式发布&#xff1a;2025年8月底 | 分类&#xff1a;Kubernetes 随着2025年8月底的临近&#xff0c;Kubernetes社区正紧锣密鼓地准备下一个重要版本——v1.34的发布。本次更新并非简单的功能叠加&#xff0c;而是在资源管理、安全身份、可观测性和工作负载控制等核心领域的…

用 Bright Data MCP Server 构建实时数据驱动的 AI 情报系统:从市场调研到技术追踪的自动化实战

前言 本文通过两个真实场景&#xff08;云服务商对比与 AIGC 技术追踪&#xff09;&#xff0c;展示了如何使用 Bright Data MCP Server 与 Lingma IDE 构建一个具备实时网页数据抓取、结构化分析与自动化报告生成能力的 AI 工作流。通过简单的 API 调用与 JSON 配置&#xff…

牛顿第二定律的所有表达方式:1、线性表达 2、圆形表达 3、双曲线表达 4、抛物线表达5、数列表达

牛顿第二定律是经典力学中的核心定律&#xff0c;表述为&#xff1a;物体的加速度与所受合力成正比&#xff0c;与质量成反比&#xff0c;方向与合力方向相同。其基本矢量形式为&#xff1a; F⃗ma⃗ \vec{F} m \vec{a} Fma 其中&#xff0c;F⃗\vec{F}F 是合力&#xff08;单…

【开发日记】SpringBoot 实现支持多个微信小程序的登录

在实际业务场景中&#xff0c;需要一个后台同时支持多个微信小程序的登录。例如&#xff0c;企业有多个不同业务的小程序&#xff0c;但希望统一在同一个后台系统里进行用户认证和数据处理。这时候&#xff0c;我们就需要一个灵活的方式来管理多个小程序的 appid 和 secret&…

Docker 容器(一)

Docker一、Docker是什么1.什么是Docker2.Docker特点3.比较虚拟机和容器二、Docker安装1.Docker​​三大核心组件​​2.安装步骤&#xff08;Ubuntu&#xff09;3.阿里云镜像加速三、Docker镜像1.什么是镜像2.UnionFS&#xff08;联合文件系统&#xff09;3.Docker镜像加载原理4…

容器安全实践(二):实践篇 - 从 `Dockerfile` 到 Pod 的权限深耕

在上一篇《容器安全实践&#xff08;一&#xff09;&#xff1a;概念篇》中&#xff0c;我们深入探讨了容器安全的底层原理&#xff0c;并纠正了“容器天生安全”的误解。我们了解了 root 用户的双重身份&#xff0c;以及特权容器的危险性。 然而&#xff0c;仅仅了解这些概念…

c#_数据持久化

数据持久化架构 数据是应用程序的命脉。持久化架构的选择直接决定了应用的性能、可扩展性、复杂度和维护成本。本章将深入探讨.NET生态中主流的数据访问模式、工具和策略&#xff0c;帮助你为你的系统做出最明智的数据决策。5.1 ORM之争&#xff1a;Entity Framework Core深度剖…

996引擎-骰子功能

996引擎-骰子功能 测试NPC QF回调函数 结果 参考资料 在测试NPC播放骰子动画。 播放前需要先设置骰子点数 测试NPC [[骰子的显示顺序和点数 对应 私人变量 D0 D1 D2 D3 D4 D5]] -- NPC入口函数 function main(player)-- 骰子共6个,设置骰子点数后,再执行摇骰子,否则没动画…

Vue 3多语言应用开发实战:vue-i18n深度解析与最佳实践

&#x1f4d6; 概述 Vue 3 国际化&#xff08;i18n&#xff09;是构建多语言应用的核心需求。本文档介绍 Vue 3 中实现国际化的主流方案&#xff0c;包括 vue-i18n、Vite 插件方案和自定义解决方案。 &#x1f3af; 主流方案对比 方案优点缺点适用场景vue-i18n功能完整、生态成…

港口船舶流量统计准确率↑27%!陌讯多模态融合算法实战解析

一、行业痛点&#xff1a;港口船舶流量统计的三大核心难题智慧港口建设中&#xff0c;船舶流量统计是泊位调度、航道管理与安全预警的核心数据支撑&#xff0c;但传统方案受场景特性限制&#xff0c;长期存在难以解决的技术瓶颈。据《2023 年中国港口智能化发展报告》显示&…

Shell脚本的基础知识学习

Shell 脚本是 Linux/Unix 系统的核心自动化工具&#xff0c;能够完成以下任务&#xff1a; &#xff08;1&#xff09;批量操作&#xff1a;一键安装软件、批量处理文件&#xff08;重命名、压缩、备份等&#xff09;。 &#xff08;2&#xff09;系统管理&#xff1a;监控资源…

k8s部署,pod管理,控制器,微服务,集群储存,集群网络及调度,集群认证

k8s部署 k8s中容器的管理方式 ​ Kubernetes集群创建方式 centainerd 默认情况下&#xff0c;K8S在创建集群时使用的方式 docker docker使用的普记录最高&#xff0c;虽然K8S在1.24版本后已经费力了kubelet对docker的支持&#xff0c;但时可以借助cri-docker方式来实现集…

JAVA限流方法

在 Java 项目中限制短时间内的频繁访问&#xff08;即接口限流&#xff09;&#xff0c;是保护系统资源、防止恶意攻击或高频请求导致过载的重要手段。常见实现方案可分为单机限流和分布式限流&#xff0c;以下是具体实现方式&#xff1a;一、核心限流算法无论哪种方案&#xf…

性能比拼: .NET (C#) vs. Fiber (Go)

本内容是对知名性能评测博主 Anton Putra .NET (C#) vs. Fiber (Go): Performance (Latency - Throughput - Saturation - Availability) 内容的翻译与整理, 有适当删减, 相关指标和结论以原作为准 在本视频中&#xff0c;我们将对比 C# 与 .NET 框架和 Golang 的表现。在第一个…

信誉代币的发行和管理机制是怎样的?

信誉代币的发行与管理机制是区块链技术与经济模型深度融合的产物&#xff0c;其核心在于通过代码和社区共识构建可量化、可验证的信任体系。以下从技术架构、经济模型、治理机制三个维度展开分析&#xff0c;并结合具体案例说明&#xff1a;一、发行机制&#xff1a;行为即价值…

神经网络|(十二)概率论基础知识-先验/后验/似然概率基本概念

【1】引言 前序学习进程中&#xff0c;对贝叶斯公式曾经有相当粗糙的回归&#xff0c;实际上如果我们看教科书或者网页&#xff0c;在讲贝叶斯公式的时候&#xff0c;会有几个名词反复轰炸&#xff1a;先验概率、后验概率、似然概率。 今天就来把它们解读一下&#xff0c;为以…

使用UE5开发《红色警戒3》类战略养成游戏的硬件配置指南

从零开始&#xff0c;学习 虚幻引擎5&#xff08;UE5&#xff09;&#xff0c;开始游戏开发之旅&#xff01;本文章仅提供学习&#xff0c;切勿将其用于不法手段&#xff01;开发类似《红色警戒3》级别的战略养成游戏&#xff0c;其硬件需求远超普通2D或小型3D项目——这类游戏…