• ​ ClickHouse 自动 Merge 完整详解(MergeTree 引擎核心机制) 一、什么是自动 Merge MergeTree 系列引擎(包含 ReplacingMergeTree/AggregatingMergeTree)写入数据时不会直接合并分区内数据,每次 INSERT 都会生成独立小数据块(part); ClickHouse 后台有自动合并后台线程,定时把多个小 part 合并成大 part,实现: 减少文件数量,降低磁盘
  • 前言 在用户行为分析、埋点平台、人群分群、UV统计等业务场景中,我们经常需要存储整个人群包的用户ID列表,用于后续人群圈选、人群交集/并集计算、留存分析、报表复盘。 绝大多数业务初期都会直接使用 Array(String) 存储用户UUID,开发简单、上手零成本,但随着分群数量上涨、单分群用户体量突破十万/百万级别,会暴露出致命问题:存储空间爆炸、ARRAY JOIN查询缓慢、人群运算SQL极其复杂。 本文基于真实业务数据,横向对比 Array
  • 容器内执行clickhouse-backup的完整方案 适用环境 Docker单机部署ClickHouse Webfunny埋点日志库(分表多、分区多、ReplacingMergeTree引擎为主) 备份工具:clickhouse-backup(远程SFTP异地备份+本地备份双兜底) 配套能力:定时自动备份、备份过期自动清理、企业微信备份结果告警 关键避坑点 路径映射问题 宿主机执行备份恢复会因路径不一致失败,所有操作必须在容器内执行 权
  • 用户分析报告是产品团队最熟悉的"熟悉的陌生人"。每一轮迭代启动前,用研团队会交出一份结构工整、图表丰富、结论清晰的分析报告;产品经理在评审会上翻阅一遍,点头认可;设计师从中提取几个关键洞察贴进设计稿的理由说明里。然后,迭代继续向前滚动,那份报告被收进共享文件夹,很少有人再打开。 这个场景几乎发生在每一家有用户研究能力的产品团队里。问题不在报告的"有没有",而在结论的"能不能用"。一份报告包含的用户数据越多,往往离工程师的行动清单越远;结论越追求
    • 12天前
  • 通用说明 统一测试表:biz_data 时间字段:dt(日期时间类型) 统计指标:行数 cnt、金额求和 sum_amt 分组维度:分钟、小时、天、周、月、年,附带排序; 周统计附带说明周起始规则差异。 一、MySQL(5.7 / 8.0) 1. 按分钟(yyyy-MM-dd HH:mm) sql SELECT DATE_FORMAT(dt, '%Y-%m-%d %H:%i') AS stat_min, COUNT(*) AS cnt, SU
  •  什么是漏斗分析? 漏斗分析是一种强大的用户行为分析工具,它能够帮助您: 可视化用户转化路径:清晰展示用户从第一步到最终目标的完整流程 识别转化瓶颈:快速定位用户流失最严重的环节 量化转化效果:精确计算每一步的转化率和整体转化率 优化业务策略:基于数据驱动的决策,提升关键指标  如何新建漏斗图? 步骤1:进入数据看板 登录 Webfunny 埋点系统 选择目标项目(如:电商APP、官网、小程序等) 进入或创建
  • 用户分群虽然是精细化运营的核心工具,但在实际落地中,往往会陷入“为了分群而分群”的怪圈,导致最终产出的策略无法落地、运营效果大打折扣。本文从数据模型、策略应用、执行落地、认知合规四大核心维度,梳理高频误区及解决方案,帮你彻底避开分群陷阱。   数据与模型层面的误区 1. 维度单一,盲目贴标签 误区表现:只根据单一属性(如性别、地域)或简单的RFM模型就把用户强行分类。比如认为“女性用户”就一定喜欢美妆,“男性用户”就一定喜欢数码。
    • 24天前
  • ​ 本文档用于指导开发者快速对接 Nacos 实现服务注册、服务发现、配置管理、服务治理(权重、路由、熔断、健康检查),覆盖 Spring Cloud Alibaba + Nacos 标准对接方案,适用于微服务架构生产环境使用。 适用版本: Nacos Server:2.x 系列(推荐 2.2.3 / 2.3.0) Spring Cloud Alibaba:2021.0.5.0 / 2022.0.0.0 Spring Boot:2.7.x /
  • 对于多分支的代码库,将代码从一个分支转移到另一个分支是常见需求。 这时分两种情况。一种情况是,你需要另一个分支的所有代码变动,那么就采用合并(git merge)。另一种情况是,你只需要部分代码变动(某几个提交),这时可以采用 Cherry pick。 一、基本用法 git cherry-pick命令的作用,就是将指定的提交(commit)应用于其他分支。 $ git cherry-pick commitHash> 上面命令就会将指
  •   Webfunny的用户分群功能是数据分析与运营管理的核心工具,支持通过多种方式创建和管理用户群体,便于后续的数据分析与运营触达。 用户分群的入口与创建方式 登录Webfunny平台后,点击顶部导航栏的【用户管理】,选择【用户分群】即可进入管理页面。 用户可以通过三种方式创建分群:保存分群、规则创建分群和导入分群。 方式一:保存分群 该方式适用于在数据查询或用户列表中,直接将当前结果保存为用户分群,操作便捷,适合快速提取特定场景的