撰写数据分析报告6个步骤 数据分析怎么写?


如何撰写一份优秀的数据分析报告?1、分析框架=剥洋葱+拆分

作为一个分析师 , 报告是重要的输出 , 就好比我们是产品经理的话 , 那这份分析报告就是你的产品 , 所以无论是从广度和深度来讲 , 你都要体现出你的思维来 , 这样广深结合 , 才能赢得别人认可和信任 。

2、每页核心指标展示的逻辑——公式思维

当我们做好数据分析后 , 如何在一页PPT展示自己的分析变的更加重要 , 许多分析师在这块不知所措 , 有时候是用户趋势图 , 有时候又是行业规模图 , 其实背后的分析逻辑可能很清晰 , 但你所展示的方式和布局老让别人觉得还是思路混乱 。

一页PPT要描述一个核心 , 而这个核心验证的数据分析过程 , 最好的方式就是公式思维 , 这样你呈现出来的指标才能和此页的主题相呼相应 , 即使有人现场挑战你 , 你也会对答如流 。

3、指标对比的合理性——业务思维

常看到一些报告 , 无论什么产品、什么业务 , 都是几大指标 , 注册用户数、活跃用户数、首次购、重复购 , 复购率、客单价等等 , 可笑的不是指标本身 , 而是拿业务不同的2个指标来对比 , 说自己多优秀!

关于如何撰写一份优秀的数据分析报告的内容 , 青藤小编就和您分享到这里了 。如果您对大数据工程有浓厚的兴趣 , 希望这篇文章可以为您提供帮助 。如果您还想了解更多关于数据分析师、大数据工程师的技巧及素材等内容 , 可以点击本站的其他文章进行学习 。
数据分析报告怎么写?这5个步骤你必须知道到年底 , 写一份好的数据分析报告的重要性不言而喻(只要我写的好 , 年终奖就少不了我)
大家都知道 , 数据分析报告的输出是整个业务分析过程的成果 , 是评定一条业务线的参考依据 , 既然这么重要那当然要写好它了 。
接下来我就分享我写数据分析报告的5个步骤 , 供大家学习参考 。
一、明确分析目的
还是那句老话 , 在做任何事情之前 , 先想清楚做这件事的目的是什么 。写数据分析报告也是 , 如果一开始就没有明确清楚目的 , 盲目开始分析 , 最后的结果很可能就是 , 分析了半天却离目标越来越远 。所以搞明白研究这个事情的目的 , 是开始数据分析的第一步 。
二、拆解指标发现问题
在明确清楚我们的分析目的后 , 就要针对我们的分析目标进行指标拆解 , 通过拆解指标去发现问题 。这么说有点虚 , 举个例子说明一下 。
背景:某制造业公司到年底 , 需要进行销售线的业务复盘 , 因此需要检查各销售线人员的年度目标完成进度 , 并给出建议 。同时 , 通过统计发现 , 今年公司的毛利率有所下降 , 需要数据分析师通过数据去找到影响毛利率下降的原因 。
拆解流程:
①明确分析目标 ②确定问题 ③拆解问题 ④拆解指标&拓展纬度布局
第一步:明确分析目标
通过背景我们可以清楚知道 , 我们有两个目标需要去完成 , 这里我用导图的形式罗列出来
第二步:确定问题
在明确分析目标后 , 就需要确定为了达成该目标 , 提出围绕该目标需要解决的问题 。可以使用思维脑图 , 写出在看到该目标后产生的问题 。
第三步:拆解问题
在确定问题后 , 就需要找到能够数值化衡量这些问题的指标 , 以及它们的计算方式 。
第四步:拓展维度
计算方式确定 , 就可通过分析组成这些计算公式的指标来探究影响其的原因 , 比如销售额=单价*数量 , 那么就可从单价、数量来分析销售额变动 , 以一个指标为定量 , 分析对比其他指标变化 。
同时以计算公式结果为指标 , 拓展维度(比如地区、时间、品类等等)来探究不同维度下的指标差异 。
三、 给出结论
同样的我们给出的结论需要和分析目的紧密相连 , 比如:
目的是了解业务的现状 , 那结论可以是:该业务有问题x关键指标 , 每个指标的数值是xxx , 有什么样的异常;
目的是了解数据到什么情况算好 , 那结论可以是:某指标可以以 xxx 作为判断标准 , 原因是......;
目的是找出业务出现异常的原因 , 那结论可以是:经分析 , 有x各种原因 , 其中重点原因是...... ;
需要注意的是 , 如果是判断业务的状况 , 需要确定一个判断标准:结论=数据+判断标准
在对数据进行拆解分析的过程中 , 我们已经可以察觉到一些数据异常 。但是这些 异常到底是好是坏 , 我们需要通过一个标准来确定 。
比如说十月份销量数据下滑 , 我们可以增加比对去年的数据 。如果去年也下滑了 , 说明是正常的月度下滑 。如果去年没有下滑 , 那么说明今年下滑是个不正常现象 , 需要复盘解决 。
四、结合业务 , 给出建议和方案
如果数据不能驱动业务成长 , 那它毫无用处 。
下了结论以后 , 再结合对业务的理解 , 就可以就分析结果提出建议 , 甚至给出方案:
建议是:能解决业务问题的行动方向 , 是若干个潜在可行的范畴 。
方案是:制定一个具体行动计划 , 方案要满足 5w2h  , 要有具体的执行人、完成时间等等要素 。
五、撰写分析报告
以上准备工作完成 , 如何撰写一份分析报告增加它的可读性呢?
架构清晰:参考经典的金字塔结构 , 结论先行 , 以上 , 先重要后次要 。以上统下的顺序也符合数据分析过程中拆解指标的顺序 , 更容易帮助读者理解你的分析思路;
报告图表化:用图表代替大量堆砌的数字会有助于人们更形象更直观地看清楚问题和结论 , 更容易做到有理有据;
FineBI制作
规范化:整篇文档的图表风格统一、名词统一;
撰写数据分析报告6个步骤 撰写数据分析报告6个步骤
撰写数据分析报告6个步骤 。在职场上 , 有的岗位是需要撰写数据分析报告的 , 想要写好数据分析报告就要知道写它的步骤 。接下来就由我带大家了解下撰写数据分析报告6个步骤的相关内容 。
撰写数据分析报告6个步骤1
1、明确目标
在「 明确数据分析目标的 3 个步骤 」这篇文章中 , 我们说过 , 要正确地定义问题、合理地分解问题、抓住关键的问题 。
当明确目标之后 , 我们需要梳理分析思路 , 搭建分析框架 , 开始思考以下问题:
采用哪些分析指标?
运用哪些分析思维?
使用哪些分析工具?
明确目标 , 是确保数据分析过程有效进行的先决条件 , 可以为后续的步骤提供清晰的方向 。
2、收集数据
收集数据是围绕数据分析目标 , 按照分析思路和框架 , 收集相关数据的过程 , 为后续的步骤提供素材和依据 。
收集的数据包括原始数据和二手数据 , 其中原始数据包括公司内部的数据库、调查得到的数据等;二手数据包括统计局发布的数据、公开出版物中的数据等 。
收集数据的基本要求是:真实性、及时性、同质性、完整性、经济性和针对性 。
3、处理数据
处理数据 , 是从大量杂乱无章的原始数据中 , 抽取对解决问题有价值的数据 , 并进行加工整理 , 形成适合数据分析的样式 , 保证数据的一致性和有效性 , 这是数据分析之前必不可少的阶段 。
数据的处理主要包括数据清洗、数据转化、数据抽取、数据合并、数据计算等过程 , 原始数据一般都需要经过一定的处理 , 才能用于后续的数据分析工作 。
在处理数据的过程中 , 准确性尤为重要 , 如果数据本身存在错误 , 那么即使采用最先进的数据分析方法 , 得到的结果也是错误的 , 不具备任何参考价值 , 甚至还会误导决策 。
具体处理数据的方法 , 可以参考以下文章:
4、分析数据
分析数据 , 是对客观真实的数据 , 运用恰当的方法和工具 , 进行科学有效的分析 。
参考文章:
如何用 Python 分析数据?
5、展现数据
通过数据分析 , 隐藏在数据背后有价值的信息逐渐浮现出现 , 此时需要通过合适的方式展现出来 , 让人一目了然 , 提高信息传递的效率 。
通常情况下 , 展现数据的方式通常是用图表说话 , 即数据可视化 , 常用的数据可视化图表有很多 , 可以参考:
数据可视化话题集锦
6、结论建议
一份好的数据分析报告 , 需要有明确的结论建议 。
如果换位思考 , 站在决策者的角度 , 更想知道的是可行的解决方案 。
如果数据分析报告没有明确的结论建议 , 那么也就失去了报告的灵魂 。
所以 , 要想制作出更有价值的数据分析报告 , 不仅要掌握数据分析的思维和工具 , 而且还要熟悉业务 , 这样才能提出更好的建议 。
小结
数据分析报告的制作过程 , 通常可以分解为明确目标、收集数据、处理数据、分析数据、展现数据、结论建议等 6 个步骤 , 这是对整个数据分析过程的总结 , 为决策者提供科学、严谨的决策依据 , 从而降低企业的经营风险 , 提高企业的核心竞争力 。
如果把数据分析报告比作一个产品 , 制作报告的人就是产品经理 , 看报告的读者就是用户 。
作为「产品经理」 , 同理心很重要 , 通过自我体验来理解他人 , 乔布斯能瞬间把自己变成傻瓜 , 这是同理心的一种表现 。数据分析的思维和工具也很重要 , 它们是数据分析的基础 。想象力是广袤的天空 , 但不是天马行空 , 而是基于同理心的推演 , 运用数据分析的思维和工具 , 让推演更加科学有效 。
在一份数据分析报告的背后 , 有许多枯燥的、基础的准备工作要做 , 例如数据采集、数据仓库、数据治理等等 。
如果没有高质量的数据作为坚实的地基 , 那么数据分析报告的高楼大厦是不稳固的 。如果没有明确数据分析的目标 , 那么后面的工作可能就是胡拼乱凑 , 用一堆图表堆砌的花架子 , 并不能解决实际的问题 。
数据分析报告不要搞形式主义 , 而要有实质的内容 , 还要关注细节 。
撰写数据分析报告6个步骤2
数据分析报告范文
项目数据分析报告是通过对项目数据全方位的科学分析来评估项目的可行性 , 为投资方决策项目提供科学、严谨的依据 , 降低项目投资的风险 。
项目数据分析报告—项目市场化操作的科学依据:
政策背景:随着我国经济体制变革的不断深入发展 , 中国的决策高层已经完全意识到了项目分析的真正意义 , 这一佐证就是《国务院关于投资体制改革的决定》的出台 。决定明确政府不再承担对投资项目的审核评估 , 实行备案制 。而投资方和项目方 , 则对项目的风险承担完全责任 , 完全按照市场经济的模式来实施项目分析评估 。这就正式宣告 , 中国的项目分析 , 将彻底进入市场化的运作模式 。
时代需求:进入二十一世纪信息化时代 , 传统意义上的经济、管理和投资金融等学科和电子信息技术发生了不可分割的交融 。作为先进生产力代表的电子信息技术 , 成为经济、管理和投资金融等领域创新变革的支撑和动力 。“项目数据分析”以专业技术的身份出现在经济、管理和投资金融专业等领域 , 是信息化时代发展的必然结果 。
项目数据分析报告—项目可行性判断的重要依据
任何欣欣向荣的企业 , 都是建立在所开发的优质项目基础上的 。但如何才能确定项目的可行和优质呢?发达国家的做法是对项目的最终决策 , 一切以科学定量分析的项目数据为依据 。在中国 , 随着世界经济一体化进程的加速和全球投资市场的蓬勃发展 , 加上中国投资分析行业正处于发展的起步阶段 , 投资人、企业管理层都迫切需要一个统一的、规范的标准来衡量投资项目的科学性和可行性 , 专业的项目数据分析报告在中国变得炙手可热 。越来越多的投资人也选择项目数据分析报告为他们准备投资的项目做出科学、合理的分析 , 以便正确决策项目;越来越多的风险投资机构把项目数据分析报告作为其判断项目是否可行及是否值得投资的重要依据 。
有关数据分析报告的详细样本 , 建议你到一些权威的数据分析机构去找找 。。。
很多的 , 而且有非常多的数据分析模型和分析数据 , 还有案例
我给你介绍一个国内比较专业的数据分析机构
“开元研究” , 希望你去了解一下 。
透析审计领域的数据分析报告
一、目标定位
内容往往服务于目标 , 目标决定内容 , 因而数据分析报告的目标很大程度上决定其内容 , 我们应首先明确其目标定位 。
构建数据分析报告的目标概念在外延上有所侧重 , 定位于为处于信息时代的审计服务 。因此 , 它需要统一并且服务于审计这个大目标 , 但也具有自身的特点 。根据《审计法》规定 , 我国国家审计的总目标是监督财政财务收支的真实性、合法性和效益性 。在这个大前提下 , 我们认为构建计算机数据分析报告的总体目标是结合业务审计的具体目标 , 通过数据分析 , 实现价值最大化的审计决策 , 从而支撑制订的.审计实施方案 。这个总体目标总是可以划分为具体层次上的目标 。我们认为 , 从属于其总目标 , 构建数据分析报告的具体目标应可以描述为以下3个方面:
1、进行总体分析 。从审计工作需求出发 , 对被审计对象的财务、业务数据进行总量分析 , 把握全局 , 形成对被审计对象财务、业务状况的总体印象 。
2、确定审计重点 , 合理配置审计资源 。在对被审计对象总体掌握的基础上 , 根据被审计对象特点 , 通过具体的趋势分析、对比分析等手段 , 合理的确定审计的重点 , 协助审计人员作为正确的审计决策 , 调整人力物力等资源达到最佳状态 。
3、总结经验 , 建立模型 。通过选取指标 , 针对不同的审计事项建立具体的分析模型 , 将主观的经验固化为客观的分析模型 , 从而指导以后审计实践中的数据分析 。
以上3个具体目标的联系是紧密的 , 不是孤立的 , 只有在进行总体分析的基础上 , 才能进一步的确定审计重点 , 并在对重点内容的分析中得出结果 , 进而实现评价的过程 。如果单单实现其中一个目标 , 最终得出的报告将是不完整的 , 对制订审计实施方案也没有可靠的支撑作用 。
二、适用范围及对象
首先本文所论述的数据 , 是在信息化环境中审计人员开展审计时需处理的电子数据 。为了明确分析对象的范围 , 我们制定了对于数据的三个限制条件:
①来源于信息系统中 , 包括财务、业务、管理等方面;
②能以数据库中二维表的形式存储于计算机中;
③有助于审计分析 。基于这些限制条件 , 数据应包括财务数据、业务数据和补充数据(从被审计单位以外的地方采集与数据分析相关的数据) 。我们可以根据需要分析其中一种或几种数据 。
其次 , 数据分析报告所记录的对象是计算机审计中审前调查阶段所作的数据分析的过程及结果 。在实际审计工作中 , 数据分析报告应在计算机审计审前调查阶段数据分析完成后撰写 , 为制订审计实施方案提供参考 。
三、原则
我们认为 , 编制数据分析报告总体上应当遵循以下原则:
1、规范性原则 。
数据分析报告中所使用的名词术语一定要规范 , 标准统一 , 前后一致 , 基本上要与前人所提出的相一致 , 例如对商业银行的盈利能力进行分析时采用了“税收比率”这个已存在的指标 , 就不能自己重命名为“税收收入比”等其他名称 。
2、重要性原则 。
数据分析报告一定要体现审计的重点 , 例如在真实性、合法性审计中 , 就应该重点选取真实性、合法性指标 , 构建相关模型 , 从数据上进行分析 。并且反映在分析结果中对同一类问题的描述中 , 也要按照问题的重要性来排序 。
3、谨慎性原则 。
数据分析报告的编制过程一定要谨慎 , 体现在基础数据须要真实完整 , 分析过程须要科学合理全面 , 分析结果可靠 , 建议内容实事求是 。
4、鼓励创新原则 。
计算机审计技术是在不断发展进步的 , 必然有创新的方法或模型从实践中摸索总结出来 , 数据分析报告要将这些创新的想法记录下来 , 发扬光大 。
总之 , 一份完整的数据分析报告 , 应当围绕目标 , 确定范围 , 遵循一定的前提和原则 , 系统的反映计算机数据分析的全貌 , 从而推动计算机审计事业的进一步发展 。
数据分析报告怎么写 数据分析报告写法介绍1、分析报告一般都要写一段导语,以此来说明这次情况分析的目的、对象、范围、经过情况、收获、基本经验等,这些方面应有侧重点,不必面面俱到 。或侧重于情况分析的目的、时间、方法、对象、经过的说明,或侧重于主观情况,或侧重于收获、基本经验,或对领导所关注和情况分析所要迫切解决的问题作重点说明 。如果是几个部门共同调查分析的 。
2、还可在导语中写上参加调查分析的单位、人员等 。总之,导语应文字精练,概括性强 。应按情况分析主旨来写,扣住中心内容,使读者对调查分析内容获得总体认识,或提出领导所关注和调查分析所要迫切解决的问题,引人注目,唤起读者重视 。
3、主体是分析报告的主要部分,一般是写调查分析的主要情况、做法、经验或问题 。如果内容多、篇幅长,最好把它分成若干部分,各加上一个小标题 。
4、结尾的写法灵活多样,一般有以下几种:(1)自然结尾 。如果主体部分已把观点阐述清楚,作出了明确结论,就不必再硬加一条尾巴 。(2)总结性结尾 。为加深读者的印象,深化主旨,概括前文,把调查分析后对事物的看法再一次强调,作出结论性的收尾 。(3)启示性结尾 。在写完主要事实和分析结论之后,如果还有些问题或情况需要指出,引起读者的思考和探讨,或为了展示事物发展的趋势,指出努力方向,就可以写一个富有启示性的结尾 。(4)预测性结语 。有的报告在提出调查分析情况和问题之后,又写出作者的预测,说明发展的趋向,指出可能引起的后果和影响 。这是在更广阔的视野上来深化主题 。
如何写好数据分析报告?1、进度性:由于日常数据通报主要反映计划的执行情况 , 因此必须把计划执行的进度与时间的进展结合起来分析 , 观察比较两者是否一致 , 从而判断计划完成的好坏 。为此 , 需要进行一些必要的计算 , 通过一些绝对数和相对数据指标来突出进度 。
2、规范性:日常数据通报基本上成了数据分析部门的例行报告 , 定时向决策者提供 。所以这种分析报告就形成了比较规范的结构形式 。一般包括以下几个基本部分:反映计划执行的基本情况、分析完成或未完成的原因、总结计划执行中的成绩和经验 , 找出存在的问题、提出措施和建议 。这种分析报告的标题也比较规范 , 一般变化不大 , 有时为了保持连续性 , 标题只变动一下时间 , 如《XX月XX日业务发展通报》
3、时效性:由日常数据通报和性质和任务决定 , 它是时效性最强的一种分析报告 。只有及时提供业务发展过程中的各种信息 , 才能帮助决策者掌握企业经验的主动权 , 否则将会丧失良机 , 贻误工作 。对大多数公司而言 , 这些报告主要通过微软Office中的Word、Excel和PowerPoint系列软件来表现 。
如何写数据分析报告相信很多数据分析师在写数据分析报告的时候也会遇到一些困惑 , 因为我最近也在写一个报告 , 在这里就梳理一下如何写数据分析报告
数据分析报告是数据分析师常见的工具 , 写好一份数据分析报告 , 不但能够清楚描述问题 , 洞察数据并且提出一些有思考的举措 , 也很能反映出一个数据分析师的思维和用数据讲故事的能力 , 网上虽然也有很多关于写好数据分析报告的文章 , 但是大部分都是偏重于理论 , 具体实践的很少 , 我就在这里做一个汇总 , 希望能帮助一些朋友 , 以期抛砖引玉
--------分割线--------正式开始--------
一份好的数据分析报告离不开两部分:数据部分和分析部分 。巧妇难为无米之炊 , 数据之于数据分析师就好像食材之于巧妇 , 数据的重要性可见一斑 , 分析部分是数据分析师将数据做成报告的最重要一步 , 是最体现一个数据分析师功底的部分 , 也是拉开差距的部分 , 下面就针对两部分分别进行阐述
一. 数据部分
数据部分最重要的就是数据质量 , 数据质量的好坏直接决定一份数据分析报告的好坏 , 如果报告中某一个数据被质疑 , 会直接影响这份数据分析报告的可信度 , 本章说一说跟数据有关的一些内容
1.数据的质量
1.1数据类型
数据类型比较好理解 , 就是数据以什么样的类型存储的 , 不同的数据类型有不同的使用方法 , 因此在处理数据之前 , 必须要先了解数据类型 , 常见的数据类型有(这里只说一些常见的数据类型):
整数型
int :用于存储整数 , 存储从-2的31次方到2的31次方之间的所有正负整数 , 每个INT类型的数据按4 个字节存储
bigint :用于存储大整数 , 存储从-2的63次方到2的63次方之间的所有正负整数 , 每个BIGINT 类型的数据占用8个字节的存储空间
smallint :用于存储小整数 , 存储从-2的15次方到2的15次方之间的所有正负整数 。每个SMALLINT 类型的数据占用2 个字节的存储空间
浮点型
real :存储的数据可精确到第7 位小数 , 其范围为从-3.40E -38 到3.40E +38 。每个REAL类型的数据占用4 个字节的存储空间
float :存储的数据可精确到第15位小数 , 其范围为从-1.79E -308 到1.79E +308 。每个FLOAT 类型的数据占用8 个字节的存储空间 。FLOAT数据类型可写为FLOAT[ n ]的形式 。n 指定FLOAT 数据的精度 。n 为1到15 之间的整数值 。当n 取1 到7时 , 实际上是定义了一个REAL 类型的数据 , 系统用4 个字节存储它;当n 取8 到15 时 , 系统认为其是FLOAT 类型 , 用8 个字节存储它
字符型
char : 数据类型的定义形式为CHAR[ (n) ] , n 表示所有字符所占的存储空间 , n的取值为1 到8000 ,  即可容纳8000 个ANSI 字符 。若不指定n 值 , 则系统默认值为1 。若输入数据的字符数小于n , 则系统自动在其后添加空格来填满设定好的空间 。若输入的数据过长 , 将会截掉其超出部分
nchar : 它与CHAR 类型相似 。不同的是NCHAR数据类型n 的取值为1 到4000 。因为NCHAR 类型采用UNICODE标准字符集(CharacterSet) 。UNICODE 标准规定每个字符占用两个字节的存储空间 , 所以它比非UNICODE标准的数据类型多占用一倍的存储空间 。使用UNICODE标准的好处是因其使用两个字节做存储单位 , 其一个存储单位的容纳量就大大增加了 , 可以将全世界的语言文字都囊括在内 , 在一个数据列中就可以同时出现中文、英文、法文、德文等 , 而不会出现编码冲突
varchar :VARCHAR数据类型的定义形式为VARCHAR[ (n) ] 。它与CHAR 类型相似 , n 的取值也为1 到8000 , 若输入的数据过长 , 将会截掉其超出部分 。不同的是 , VARCHAR数据类型具有变动长度的特性 , 因为VARCHAR数据类型的存储长度为实际数值长度 , 若输入数据的字符数小于n , 则系统不会在其后添加空格来填满设定好的空间 。一般情况下 , 由于CHAR 数据类型长度固定 , 因此它比VARCHAR 类型的处理速度快
时间和日期型
date :‘2018-01-17’
time :‘10:14:00’
timestamp :‘2018-01-17 10:14:00.45’
以上就是常用的数据类型 , 如果有其他的数据类型没有说到 , 可以去网上搜一下 , 都比较好理解
1.2噪音数据
因为网上有非常多的关于噪音数据的解释 , 都非常专业 , 我就不在这里做过多的详细解释了 , 我们只探讨从sql取出数据的时候有一些异常值的处理办法:
null
一般跑过sql的朋友肯定会发现 , 在跑出来的数据中会有null的情况 , 这个时候需要对null进行替换 , 如果是计算用 , 就把null替换成0 , 这个步骤可以在sql里面完成 , 也可以在excel里面完成
极大值
极大值会影响数据的计算结果 , 一般会进行处理 , 要么替换成除极大值以外的最大值 , 要么直接弃用
作为分母的0
如果0作为分母 , 在excel里会出现#DIV/0,这个时候可以直接把结果替换 , 或者在sql里面直接进行替换 , 用case……when……就可以替换
1.3数据的口径
数据的口径很重要 , 根据经验看 , 大部分的数据出现问题是口径造成的 , 数据的口径一定要跟业务的口径一致 , 拿留存率举例:
留存率是周期比率型指标 , 一般在计算留存率的时候需要确定 留存周期 和 活跃判定的口径
留存周期:留存周期通俗来讲就是指用户在多长时间范围内活跃 , 并在下一个周期内仍然活跃 , 这里的多长时间就是指留存周期
活跃判定:指怎么判定一个用户活跃 , 可以是启动App , 可以是登陆 , 也可以是完成了一次其他特定行为 , 这个主要依照业务需求而定
实际计算:
周留存率的计算
分子:本周活跃 且 上周也活跃的用户数
分母:上周活跃的用户数
2.可能会用到的工具
在处理数据的过程中可以用很多工具 , 在这里就介绍一些比较常见的工具 , 大家耳熟能详 , 学起来也不是特变难
2.1提取数据
mysql
hivesql
两者的查询语句有相似的地方也有不同的地方 , 主要看自己所在公司的数据存储情况
2.2数据处理
python:一般写个脚本做一些机械的操作(我目前是这么用) , 也可以用来做计算
mysql:在查询的时候可以进行处理
excel:数据量比较小的时候 , 可以在excel上简单处理
2.3数据可视化
python:可以用来做一些词云图
Tableau:可视化一些图表 , 可以和sql结合着用
excel:做一些简单的图表 , 实际上数据处理的好的话 , 一般用excel就足够了
二. 分析部分
在处理了数据以后就要开始进行报告的撰写 , 写报告会涉及到几个部分的工作 , 这里分别进行介绍一下:
1.报告结构
一篇数据分析报告的结构是十分重要的 , 一个好的结构能够将他人带入到你的报告中 , 让他人更好的明白你的意图 , 减少信息传递之间的丢失 , 同时你的思维也主要展现在结构上 , 这就意味着在写数据分析报告前 , 一定好想清楚数据分析报告的结构 , 当然这里说的报告结构即包括整个报告的结构 , 也包括每一个章节的结构 , 这里就放到一起说了
1.1 总 - 分 - 总(多用在整体结构)
我们在读一本书的时候 , 打开目录 , 会发现整部书的结构一般包括:
前言
第一篇
第二篇
……
第n篇
结尾
这就是典型的总 - 分 - 总结构 , 是最常见的结构 , 如果是对一个专题进行分析 , 用这种形式是非常好的 , 举个例子:
某电商App近一个月内的销售额出现下滑 , 让你针对这个问题进行一次专题分析
分析思路:拿到这个问题 , 我们很容易想到的是 , 销售额出现下滑出现的原因有两个 , 一个是付费用户数减少了 , 另一个是付费用户的人均付费金额减少了 , 这两个原因属于并列的原因 , 不存在递进关系 , 也就是说付费用户数减少了与人均付费金额减少并不存在因果关系 , 没有什么相关性 , 因此需要对两个原因共同分析 , 最后输出结论和提升建议 , 分析完以后 , 会发现总
- 分 - 总结构很适合这样的分析 , 所以列出以下提纲
问题描述
销售额近一个月下降多少?绝对值 , 环比 , 同比数据
原因假设:付费用户数下降/人均付费金额下降
付费用户数下降分析
付费用户数降幅是多少?绝对值 , 环比 , 同比数据
定位下降人群:是整体下降还是某一群体用户数下降
这里就涉及到用户分群 , 用户分群的方法有很多 , 涉及到用户价值的分群常见的就是RFM模型 , 将分完群的用户进行数据对比 , 看看上个月付费用户的结构占比跟本月有什么不同 , 当然用户分群的方法也不止这一个 , 还有按照会员等级分群(主要用会员等级进行用户分群) , 按照活跃程度(新用户/留存用户/回流用户) , 按照消费习惯(一般用户表里面都会有用户的标签 , 标识这个用户的消费习惯 , 表示这个用户更喜欢购买哪一类的商品) , 不管用什么分群方法 , 都需要纵向对比 , 也就是这个月和上个月付费人群的对比
原因分析:
如果是付费用户整体下降(这种是大家都不想看到的现象 , 欣慰大盘数据的驱动需要投入大量的资源 , 也有可能是自然波动) , 考虑可能的原因主要有:用户整体流失 , 比如用户流失到竟对;或者本月有什么特殊情况 , 影响到了整体的用户活跃;或者是从活动维度去观察 , 是不是活动的力度减小 , 影响了用户付费的欲望
如果是某一个用户群体下降:考虑的原因可能有商品品类的影响 , 是不是某一类商品在平台没有上架 , 或者某一类商品涨价;或者这一类用户受到了哪些影响 , 一般可以从属性和行为角度去分析
提出策略:
针对分析出的原因提出可落地的策略(策略一定要落地 , 要具体 , 比如如果你提出一条策略是:提升新注册用户数 , 那么等于没说 , 老板多数会diss你 , 但是你如果说 , 通过减少注册时填写的非必要字段 , 如年龄/职业 , 来简化注册流程 , 挺升注册转化率 , 进而提升新注册用户数 , 那感觉是不一样的)
人均付费金额下降分析
人均付费金额的降幅是多少?绝对值 , 环比 , 同比数据
定位原因
人均付费金额下降可能的原因主要有:订单数量下降;每个订单包含的商品数的下降/某一个品类购买数下降
提出策略:针对分析出的原因提出可落地的策略
总结问题
明确造成销售额下降的原因到底是什么(定性以后 , 记得一定要量化 , 不量化会被diss)
提出有针对性的建议
如何预防再次发生
1.2递进(可用于整体结构和章节内部结构)
这种结构适合对一个问题进行探索 , 就像上一个例子中 , 我们针对每一个可能原因进行分析的时候 , 就是采用的这种分析方法 , 这种分析结构特别适合对一个小问题进行深入的探索分析 , 层层递进 , 深挖原因 , 这里在举一个例子:
某一个App的新注册用户数环比上个月减少 , 需要你做一个深入的分析 , 找到原因 , 提供改进策略
分析思路:新注册用户数的的影响因素是一个典型的漏斗结构 , 也是一个典型的单向性用户旅程 , 画一张图就能说明白:
如图所示 , 影响注册用户数的原因全部标注在漏斗里面 , 但是注册全流程这个漏斗只能看个大概流失 , 所以我们会对某一步进行细化 , 这张图上 , 我们对用户从启动到注册成功进行细化 , 细化到用户行为 , 这样能够提出一些产品上的改进意见 , 这个时候 , 如果想要提升新注册用户数 , 只需要针对每一步流失原因进行分析 , 找到提升策略就可以了 , 基本上是所见即所得的分析
比如:我们想对提交注册信息到注册成功这一步进行优化 , 那么首先我们要找到用户注册失败的原因有什么 , 一般有:
用户已注册
密码格式不合规
系统错误
未勾选《隐私协议》
在提出建议的时候 , 只要针对以上原因提出具体改进意见就可以了
1.3并列结构(多用于整体结构)
这种结构一般遇到的情况不多 , 常见的有对不同的校区进行经营分析/对不同品类的商品进行售卖分析 , 基本都是以描述型分析为主 , 因为分析的主体是并列关系 , 所以只需要每个主体就行单独分析就好 , 基本采用的分析思路是一样的
1.4因果结构(多用于章节内部结构)
这种结构一般用在复盘分析报告中 , 复盘是常见的数据分析报告类型之一 , 也是很多公司比较重视的一个报告 , 比如双十一复盘/新手活动复盘等等 ,  以电商某一次大促复盘为例  , 这里直接写结构:
总体描述:
本次大促整体数据表现 , 整体活动节奏的介绍;销售额是多少 , 同比提升多少;利润情况;参与用户有多少 , 同比提升多少;卖出商品有多少 , 同比提升多少;各个子活动的贡献是多少
子活动1的效果分析
子活动1的简介 , 作用 , 发力点
子活动1的贡献是什么 , 对于直接提升结果指标或者间接提升指标有哪些贡献
子活动1的成本是什么?投入产出比是多少?
子活动2的效果分析
子活动x的效果分析
最后汇总 , 提出优化建议
2.分析方法
讲完了整体结构 , 我们就该进入到具体分析的过程里面 , 这里的分析方法 , 主要想说说怎么去针对不同的数据进行分析 , 也就是说怎么通过数据看出问题 , 这里介绍常用的5种分析方法 , 但是有一句话非常重要 , 想写这节的最前面: 数据分析师一定要懂业务 , 在分析之前最好能把问题定位个大概 , 再去捞数 , 再去分析 , 否则每天会沉浸在漫无目的取数中 , 我认为一个数据分析师最重要的能力是要懂业务 , 从数据的角度看业务 , 才能驱动业务
2.1 对比分析
横向对比
横向对比就是把一个指标按照不同维度拆分 , 去对比不同维度的变化 , 举个简单的例子来说就是:
昨天的DAU增长了30% , 那么把DAU进行拆分 , 可以拆分成以下三种方式:
DAU=新注册用户数+留存用户数+回流用户数
DAU=北京活跃用户数+河北活跃用户数+山东活跃用户数+……
DAU=北京活跃用户数+河北的活跃用户数+……
=北京的新增用户数+北京的留存用户数+北京的回流用户数+河北的新增用户数+河北的留存用户数+河北的回流用户数+……
这里留一个疑问 , 怎么去选择优先下钻的维度?想明白以后分析的效率就会有很大提升
纵向对比
在进行完横向对比以后 , 就要开始进行纵向对比 , 纵向对比主要是在时间维度上 , 还拿上一个例子来说 , 我们按照第一种方式进行横向对比以后 , 就要纵向对比 , 见下表:
2.2分布分析
分布分析一般是应用的场景比如用累计消费金额去分组/按照用户一个月活跃天数去分组 , 这些场景都有两个共性的特征:
属性值都是数值类型 , 或者日期类型
属性值非常多 , 比如累计消费金额可能从1-90000中间任意一个数字 , 也就是属性值非常多 , 没办法用每一个属性值去单独分析 , 因此需要分组
还是上图说明:
2.3交叉分析
交叉分析一般指多维度交叉 , 或者不同指标之间的交叉
多维度交叉其实有点类似对比分析的第三类分类方法 , 这里不在赘述了 , 还是那个图 , 但是在实际分析中的作用其实很是强大 , 具体如何应用就需要大家举一反三啦 , 仔细看看这张图 , 可以换成哪些分析场景下的哪些场景的交叉分析:
不同指标交叉一般用在分析变化趋势中 , 或者寻找相关因素的时候 , 上图:
这样既能看绝对值的变化 , 又能一目了然的看出变化趋势 , 如果不同指标之间呈现一定的相关性 , 那就是相当完美了
2.4漏斗分析
漏斗分析模型比较好理解了 , 一般在行为分析中常用到 , 直接上图吧:
是不是有点眼熟?漏斗分析一般分析应用在分析用户使用某项业务时 , 经过一系列步骤转化的效果 , 因为用户会沿着产品设计的路径到达最终目标事件 , 在分析每一步转化的时候会用到这个模型
2.5矩阵分析
矩阵分析是一个不错的分析模型 , 主要用在分类上面 , 常见的有用户分类、产品分类等 , 比如像常见的RFM模型是一个三维矩阵 , 有八个象限 , 上两个图看看:
矩阵分析其实不难理解 , 但是涉及到一个比较关键的问题 , 就是临界点怎么选择 , 通俗来说就是第一象限和第二象限的临界值是多少 , 有的是0 , 有的不是0 , 举个例子:
我想用活跃度和累计消费金额对1万个用户进行分群 , 使用矩阵分析
我建好了这个二维矩阵 , 我第一件事就是先要确定原点的坐标值 , 也就是说用户的累计消费金额大于x , 就会出现在第一/四象限 , 如果小于x , 就会出现在第二/三象限 , 想确定这个值需要一定的方法 , 会用到一些分类算法 , 这个可以去网上查一些关于分类的教程 , 有很多 , 后续我会写一盘文章来介绍分类 , 这里就不细讲了
以上就是数据分析最重要的两个模块 , 当然在实际操作中还有很多需要思考的地方 , 太细节的东西不太能够面面俱到 , 这里留给大家去思考的空间 , 比如:
数据分析报告怎么讲成一个故事 , 比如背景-现状-原因-策略-预期结果-复盘结果?
每一页PPT怎么排版会让你的数据分析报告可读性更高?
如果你的数据分析报告不采用上述的结构 , 还能用哪些结构?
怎么让你的数据分析报告显得更高大上?
可以留言交流哦
【撰写数据分析报告6个步骤 数据分析怎么写?】关于数据分析怎么写和数据分析怎么写?的内容就分享到这儿!更多实用知识经验 , 尽在 www.hubeilong.com