科学方法必须包括:问题陈述、产生假设、收集数据、分析数据,然后获取结果并采取行动.......当你使用科学方法做事情时,你会更快取得成功。

—— Bob Hayes 博士,百老汇商业总裁

前面我们已经介绍了评估和定位问题、确定潜在原因和分析数据的必要性和方法,详情请戳?极简数据分析实操指南(上)

下面将为你重点介绍:

  • 数据分析实操指南实例解读

  • 如何避免数据分析中的坑?

  • 解决问题,做出明智的决定

数据分析实操指南实例解读

下面我们将按照极简数据分析实操指南(上)中提到的方法,对文章中提到的几个场景进行详细解读。

SaaS 公司的营销实例

SaaS 公司的营销经理 Jody ,需要向产品副总裁汇报注册量下降的原因。

◆ 核心问题:最近我们产品的注册量下降,是什么原因导致?

◆ 假设:由于......注册量下降

o  最近对营销网站的更改

o  某些地区的公众假期

o  广告投放转化率下降减少了注册量

o  有机搜索排名(针对我们的产品页面)下降到搜索结果的第二页

◆ 数据分析:

Jody 第一步思考数据有多少变化?是否是真的异常?

她开始分别按照天和小时查看数据的变化,发现更改网站(网站注册会出现中断)时注册量确实有下降,但网站更改完成后注册量仍然在下跌,且进一步分析发现对注册表单样式的更改,使转化率略有上升,因此不是对营销网站的更改导致。

Jody 通过进一步查看数据,发现在总体注册量下降期间,到达注册页面的人数减少了大约 10%,因此,可能是上游问题导致的。

接下来,Jody 考虑假期假设(下跌开始时间是某些地区的公众假期)。但随着时间的推移,各国的注册量都有所下跌,所以该假设排除。

此时,她整理了一下思绪,决定分析点击付费广告投放更改后的数据。发现其中一个广告系列转化率下降了 50%,但这个只占注册量的 1%,所以不是主要原因。

Jody 又通过渠道查看注册率,发现有机搜索(占注册量的 70%)下降了 20%,推测是几周前页面更改引起的页面排名的变化。于是,她开始检查 SEO 数据,发现主要关键字已降低排名,现在位于第二页,这样一来,除了注册量其他方面也会受影响。

最终,Jody 除了解释注册量下降之外,还创建了一个策略来恢复注册,并将分析报告呈现给了产品副总裁和首席执行官。

电子商务示例

电商运营主管 Tyler 想弄清楚为什么购物车到下单的转化率正在降低?

◆ 核心问题:许多潜在客户在购物车结算这一步流失,我们该如何降低其流失率?

◆ 假设:由于......转化率下降

o  放入购物车的人绝对数量增加

o  最近对付费流程的更改

o  季节性(即假期,学校休息等)

o  促销结束导致更多人放弃下单

o  某些商品出现问题,影响下单

Tyler 第一步思考加入购物车的人绝对数量是否增加?如果有大量人开始向购物车添加商品但完成购买的人数保持不变,那么可以判断有一批购物者的转化率降低,他注意到加入购物车的人数略有增加。

然后他开始询问相关团队的人,如有没有促销活动?有没有推出新产品?会不会有季节性影响?付费过程有什么变化吗?价格是否经过调整?(注意:根据业务和产品范围的不同,这可能会有很大差异。)

Tyler 最终得知付费流程发生了一些小变化。现在,他们不仅仅列出购物车中的商品,而是展示每件商品的图片。

为了进一步分析这种变化的影响,他将付费流程分成了不同的步骤,发现用户的浏览数据正常,事实上,更多的人正在进行下一步,所以这似乎不太可能是罪魁祸首。

接下来,Tyler 通过将本周的购物车转化率与前几年的同一周进行比较来寻找任何季节性影响,他还通过快速浏览日历,了解任何可能的线索,但由于会话和电子邮件开放率等相关指标未受影响,季节性因素假设也排除。

Tyler 之前咨询到最近的促销结束了,按照常识,当人们意识到促销已经结束时,他们更有可能放弃下单。Tyler 在购物车转化率下降之前使用促销代码查看付费比例,发现只占 5%,但放弃率的变化是三倍,所以这只能算一个促成因素。

Tyler 又开始思考这是商品库存的原因吗?但所有商品的性能相当一致,这个假设也不成立。

在考虑其他可能的原因时,Tyler 再次审查付费流程。发现商品价格页面中对运费的描述部分大大减少,他回忆起之前对产品页面进行一些外观修改的时间与流失率增加时间完美吻合。

回顾这些变化后,他的新假设是潜在客户放弃下单,是因为他们期望下单时购买的价格是产品页面设定的较低价格,一旦他们看到全价(包括运费),就会放弃下单。

发现这一点后,Tyler 非常有自信的准备使用 A / B 测试来检验假设,如将产品更改恢复到以前的设计,或者尝试使用包含运费的版本。最终,他验证了假设,并调整了页面。

移动应用示例

产品经理 Sofia 想找出所负责的 App 激活率降低的原因。

◆ 核心问题:初始下载后,打开和使用 App 的人数减少了,怎样才能提高激活率?

◆ 假设:由于......激活率下降

o  App 的更改使人们不太愿意激活。

o  一群新的(或不同的)人开始尝试这种产品

她注意到在过去 3 个月中激活(打开并开始使用 App)的比例一直在稳步下降(与下载总数相比)。

Sofia 先查看一些数据来获得更多背景资料。最终她发现下载的绝对数量明显增加,而激活人数仅略有增加。不过两个指标的绝对数字都在增加,让她松了一口气。(注意:根据不同的企业,这可能是也可能不是问题。最终,这取决于是否浪费了额外的注册资金。)

Sofia 后续很快确定应用程序中与激活下降相关的初始体验没有任何变化。

现在,她更密切地关注哪些人正在下载应用程序以及人口统计数据是否发生了变化。因此,她按地区对下载人群进行了分层,发现来自较低激活区域的下载量略有增加,但这远远不足以解释激活率的下降。

接下来,Sofia 分析不同渠道(例如,应用商店搜索,社交广告,推荐等)的下载情况,发现推荐下载渠道的下载量大幅增加,且似乎与她之前提到的增加的下载次数大致相同。深入分析后,她发现通过推荐下载的激活率明显低于其他渠道。

Sofia 通过咨询营销团队,了解到基本是一个高流量文章引起的推荐渠道的下载量增加,而且它没有任何成本,具有很大的潜力待开发。Sofia 和营销经理下一步准备采取行动增加该渠道的激活量。

Sofia 最终通过一些快速的数据分析,使最初的问题变成了一个机会。

看完上面的例子,下一步该你分析了,在分析数据时,请记住要考虑差异的真实性(统计显著性)以及差异的实际意义。

随着业务中的运用数据分析的地方比以往任何时候都多,领导者需要培养一种数据驱动的文化,而不是相信他们的直觉。

—— Ronald van Loon,数据科学家,演讲人,作家和创始人

如何避免数据分析中的坑?

在数据分析的过程中,即使是最有经验的数据分析人员也必须提防数据谬误(Data Fallacies)。以下提示,将帮助你避免一些最常见的数据谬误。

避免数据偏见

在分析数据时受个人偏见和动机的影响,即仅选择支持你声明的数据,同时丢弃不支持声明的部分。“数据偏见”将让数据的客观性荡然无存。

避免这种谬误的方法是在分析数据时,尽可能收集相关数据,并询问他人意见。

一个人应该保持中立并且不要爱上你的假设是绝对必要的。

—— David Douglass,美国物理学家

避免数据疏浚

数据疏浚(Data Dredging)是指未能确认相关性,实际上是偶然的结果。

在寻找问题的原因时,很容易被数据蒙蔽。乍一看,这些数据可能具有统计学意义,但进一步测试(例如,检查趋势是否持续,查看相关指标等)可能会发现只是偶然结果。

避免这种谬误的方法是在分析数据时,从假设开始检查相关指标和观察数据变化趋势。

一个常见的谬误是假设数据集是值得信赖的——直到后来在分析中发现数据是错误的。所以,在开始分析之前,请确保您的数据值得信赖。

—— Tamara Dull ,SAS 研究所新兴技术总监

区分因果关系和相关性

在数据分析时很容易将两个事件同时发生(相关),判断为因果关系。

避免这种谬误的方法是,收集更多数据并查看可能的第三方原因,有时会发现他们的相关关系可能与第三个独立因子相关,而不是彼此相关。

例如,我们发现放弃其在线购物车的潜在客户往往具有较低的总购物车价值(放弃时购物车中物品的总成本)。此时,我们没有足够的数据来确定这是一致的相关性,是偶然结果,还是由其他因素引起的。深入挖掘我们可能会发现运输成本导致购物车到下单的流失率上升,因为免费送货仅适用于超过特定最低购物车价值的订单。

如果你对数据进行足够长时间的折磨,它就会承认任何事情。

—— Ronald Coase 诺贝尔经济学奖

解决问题,做出明智的决定

这个极简数据分析实操指南可以帮助你快速解决问题并做出明智的决策。无论你是领导团队还是向执行官报告,你都可以对有数据支持的观点充满信心。

在任何竞争中,获胜者都将是那些有效利用数据做出明智商业决策的人。

—— Kirk D. Borne,博士,天体物理学家,博思艾伦首席数据科学家

在找到数据支持的结论后,你需要记下一个简短的摘要(包括问题,数据显示的内容以及由此产生的决策 / 行动),这样做有两个目的:

1.将你所分析的数据和结论告知可能涉及或受影响的任何其他团队,为其他人提供有价值的背景信息。

2.这个记录也将使你在将来出现类似情况时更容易参考和以防其他人想要查看数据本身。

最终,问题解决了,也总结了有价值的经验。

下面我们回顾一下整个《极简数据分析实操指南》,当你遇到问题时,你可以随时查看:

  • 评估和定位问题

  • 确定潜在原因

  • 如何分析数据?

  • 数据分析实操指南实例解读

  • 如何避免数据分析中的坑?

  • 解决问题,做出明智的决定

极简数据分析实操指南(下)相关推荐

  1. 极简数据分析实操指南(上)

    "用数据做事情的能力,将在你的工作和生活的方方面面发挥意想不到的作用." 在工作中,我们会遇到各种各样的问题.如: 如果你是一家 SaaS 公司的营销经理,产品副总裁看到注册数量突 ...

  2. 知识付费 知识变现的商业逻辑与实操指南

    知识付费 知识变现的商业逻辑与实操指南 (本文源自公号[跟海哥学知识变现],移步公号和100万小伙伴一起学知识变现,立马获赠[知识变现]电子书一本) 今天给咱们从事知识变现的从业者推荐一本专业书,一本 ...

  3. git原理详解与实操指南_基于dockercompose的Gitlab CI/CD实践amp;排坑指南

    长话短说 经过长时间实操验证,终于完成基于Gitlab的CI/CD实践,本次实践的坑位很多, 实操过程尽量接近最佳实践(不做hack, 不做骚操作),记录下来加深理解. 看过博客园<docker ...

  4. 【mysql进阶】MTS主从同步原理及实操指南(七)

    0.引言 随着业务场景的深入和请求量的剧增,单库实现读写越来越趋近瓶颈,于是我们想到搭建主从库,主库负责写,从库负责读,从而实现读写分离,提高查询效率. 但是主从库之间的数据如何同步呢?很明显我们写入 ...

  5. python数据分析的主要流程-Python数据分析全流程实操指南

    内容全面:借助5大Python工具库,实现数据分析从获取到建模全流程覆盖: 贴合实际:不空讲Python语法,清晰简明地介绍如何用Python来处理.分析数据: 热点案例:覆盖6大热点应用领域,可直接 ...

  6. 全文 40000 字,最强(全) Matplotlib 实操指南

    导读 Matplotlib 是一个 Python 的 2D绘图库,它以各种硬拷贝格式和跨平台的交互式环境生成出版质量级别的图形.通过 Matplotlib,开发者可以仅需要几行代码,便可以生成绘图,直 ...

  7. 干货分享 | 全文 40000 字,最强(全) Matplotlib 实操指南

    导读 Matplotlib 是一个 Python 的 2D绘图库,它以各种硬拷贝格式和跨平台的交互式环境生成出版质量级别的图形.通过 Matplotlib,开发者可以仅需要几行代码,便可以生成绘图,直 ...

  8. 40000字!全网最强Matplotlib实操指南!

    导读 Matplotlib 是一个 Python 的 2D绘图库,它以各种硬拷贝格式和跨平台的交互式环境生成出版质量级别的图形.通过 Matplotlib,开发者可以仅需要几行代码,便可以生成绘图,直 ...

  9. 实操指南 | Resource Queue如何实现对AnalyticDB PostgreSQL的资源管理?

    简介:作者:阿里云数据库OLAP产品部 - 子华 一 背景 AnalyticDB PostgreSQL版(简称ADB PG)是阿里云数据库团队基于PostgreSQL内核(简称PG)打造的一款云原生数 ...

最新文章

  1. Spring Boot学习笔记-实践建言
  2. 《敏捷软件开发》学习笔记 第20章
  3. java taken_java-是否有正确的方法在slf4j中传递参数?
  4. 实验1c语言开发环境使用和数据类型、运算符和表达式
  5. 从setTimeout,onclick传参看js函数作为参数
  6. nginx限制上传大小和超时时间设置说明/php限制上传大小
  7. webpack——文件和图片打包
  8. MySQL是怎么保证主备一致的?
  9. encodeURI() 的用法
  10. SQL中LIMIT子句介绍
  11. 第8集丨流氓皇帝,贬谪之路,险象环生
  12. 2019大数据挑战赛
  13. HTML,CSS中的复合写法总结
  14. Coursera 申请助学金流程和材料
  15. 大数据难学吗?如何学习大数据?(附学习路线)
  16. 求助!微信公众号页面部分手机加载后空白!
  17. 分布式架构、大数据、机器学习、搜索、推荐、广告
  18. 浅谈android手机联系人开发之增删查改
  19. 苹果手机显示无法连接游戏服务器,《Disorder》手游无法连接服务器解决方法 IOS无法连接服务器怎么办...
  20. 输电线路状态监测装置通用技术规范即I1协议

热门文章

  1. 火力发电厂与变电站设计防火规范_2019年《建筑设计防火规范》新版征求意见稿...
  2. 语言时间序列年月日_R语言系列 时间序列分析
  3. 队列表mysql,什么是在mysql中实现消息队列表的最佳方法
  4. initrd.img解压和压缩
  5. 计算机程序中断方式有几种,奥鹏离线作业计算机组成原理一、简答题1、请说明程序查询方式与中断方式各自的特点.2、提高存储器速度可采用哪些措施,请说出...
  6. 大学物理实验试卷1到8_物理实验在绝对的“理论”面前就是“纸老虎”
  7. java 错误日期转正确日期_Java日期格式转换-错误的月份
  8. 在dreamweaver mx中它只能对html文件可以进行编辑,【职称计算机考试网页制作历年试题及答案二】- 环球网校...
  9. AKKA框架持久化入门样例
  10. F2上的8×8可逆矩阵的个数为2的62次幂