Attribution Analysis 归因分析模型解析神策分析软件 _经验分享

神策数据-用户行为分析
行为分析三步骤：
1）. 提出业务问题
2）. 定位问题的分析对象，具体是哪几个行为
3）. 对行为进行统计和分析
其中2到3 涉及到数据的采集，后期逐步学习
what：以字段的方式记录用户所做的事件的具体内容。不同的事件需要记录的信息不同，下面给出一些典型的例子：
对于一个“购买”类型的事件，则可能需要记录的字段有：商品名称、商品类型、购买数量、购买金额、付款方式等；
对于一个“搜索”类型的事件，则可能需要记录的字段有：搜索关键词、搜索类型等；
对于一个“点击”类型的事件，则可能需要记录的字段有：点击 URL、点击 title、点击位置等；
对于一个“用户注册”类型的事件，则可能需要记录的字段有：注册渠道、注册邀请码等；
对于一个“用户投诉”类型的事件，则可能需要记录的字段有：投诉内容、投诉对象、投诉渠道、投诉方式等；
对于一个“申请退货”类型的事件，则可能需要记录的字段有：退货金额、退货原因、退货方式等。
描述事件的任意一个字段，都是一个事件属性。应该采集哪些事件，以及每个事件采集哪些事件属性，完全取决于产品形态以及分析需求。
后续章节将针对”神策如何采集用户行为“进行解答。
常见的数据分析软件有哪些？
好的数据分析工具可以让数据分析事半功倍，更容易处理数据。分析一下市面上流行的四款大数据分析软件:
一、Excel
Excel使用人群众多是新手入门级数据分析工具，也是最基本的数据分析工具之一。Excel主要学习使用常用函数、快捷键操作、基本图表制作、数据透视表等。Excel具有多种强大的功能，可以满足大多数数据分析工作的需要。而且Excel提供了相当友好的操作界面，对于有基本统计理论的用户来说更容易上手。
二、SQL软件
SQL是一种数据库语言，它具有数据操作和数据定义功能，交互性强，能给用户带来很大方便。SQL专注于Select、聚合函数和条件查询。关联库是目前应用较广的数据库管理系统，技术较为成熟。这类数据库包括mysql.SQLServer.Oracle.Sybase.DB2等等。
SQL作为一种操作命令集，以其丰富的功能受到业界的广泛欢迎，成为提高数据库运行效率的保证。SQLServer数据库的应用可以有效提高数据请求和返回速度，有效处理复杂任务，是提高工作效率的关键。
三、Python软件
Python提供了能够简单有效地对对象进行编程的高级数据结构。Python语法和动态类型，以及解释性语言的本质，使它成为大多数平台上写脚本和快速开发应用的编程语言，并可用于可定制软件中的扩展程序语言。丰富的Python标准库提供了源代码或机器代码，适用于各种主要系统平台。Python有极其简单的解释文档，所以更容易上手。
四、BI工具
BI工具是商业智能(Busines Inteligence)分析工具的英文缩写。它是一个完整的大数据分析解决方案，可以有效地整合企业中现有的数据，快速准确地提供报表和帮助领导作出决策的数据依据，帮助企业做出明智的业务决策。BI工具是根据数据分析过程设计的。首先是数据处理，数据清理，然后是数据建模，最后是数据可视化，用图表识别问题，影响决策。
在思迈特软件Smartbi的例子中，Smartbi以工作流的形式为库表提取数据模型的语义，通过可视化工具来处理数据，使其成为具有语义一致性和完整性的数据模型；它也增强了自助式数据集建立数据模型的能力。该系统支持的数据预处理方法有：采样、分解、过滤与映射、列选择、空值处理、合并列、合并行、元数据编辑、线选择、重复值清除、排序等等。
它能通过表格填写实现数据采集和补录，并能对数据源进行预先整合和处理，通过简单的拖放产生各种可视图。同时，提供了丰富的图标组件，可实时显示相关信息，便于利益相关者对整个企业进行评估。
目前市场上的大数据分析软件很多，如何选择取决于企业自身的需求。因此，企业在购买数据分析软件之前，首先要了解企业数据分析的目的是什么。假如你是数据分析的新手，对需求了解不多，不妨多试试BI工具，BI工具在新手数据分析方面还是比较有优势的。
手机上什么软件可以做交叉分析
智能数据分析软件——神策分析＜br>神策分析的产品有完整的使用文档，每个模块都有详细的使用说明以及示例，降低了用户的学习成本。而且支持私有部署、任意维度的交叉分析，并帮助客户搭建专属的数据库。目前提供事件分析、漏斗分析、留存分析、数据管理等功能，未来预计会增加用户分群、用户人群分析、推送和异常维度组合挖掘等，工具需要付费使用。

归因分析(Attribution Analysis)模型解析
在复杂的数据时代，我们每天都会面临产生产生的大量的数据以及用户复杂的消费行为路径，特别是在互联网广告行业，在广告投放的效果评估上，往往会产生一系列的问题：
· 哪些营销渠道促成了销售？
· 他们的贡献率分别是多少？
· 而这些贡献的背后，是源自于怎样的用户行为路径而产生的？
· 如何使用归因分析得到的结论，指导我们选择转化率更高的渠道组合？
你可能第一反应就是：当然是我点了哪个广告，然后进去商品详情页产生了购买以后，这个功劳就全部归功于这个广告呀！没有错，这也是当今最流行的分析方法，最简单粗暴的单渠道归因模型------这种方法通常将销售转化归功于消费者第一次 (首次互动模型，First Model) 或者最后一次接触 (末次互动模型，Last Model) 的渠道。但是显然，这是一个不够严谨和准确的分析方法。
我们发现，现实情况往往是很复杂的多渠道投放，在衡量其贡献价值以及做组合渠道投放力度的分配时，只依靠单渠道归因分析得到的结果和指导是不科学的，于是引入了多渠道归因分析的方法。当然，多渠道归因分析也不是万能的，使用怎样的分析模型最终还是取决于业务本身的特性以及考虑投入其中的成本。
也称，最后点击模型-----最后一次互动的渠道获得100%的功劳，这是最简单、直接，也是应用最为广泛的归因模型。
优点：首先它是最容易测量的归因模型，在分析计方面不容易发生错误。另外由于大部分追踪的cookie存活期只有30-90天（淘宝广告的计算周期最长只有15天)，对于顾客的行为路径、周期比较长的场景，在做归因分析的时候可能就会发生数据的丢失，而对于末次互动模型，这个数据跟踪周期就不是那么特别重要了。
弊端：这种模型的弊端也是比较明显，比如客户是从收藏夹进入商品详情页然后形成了成交的，按照末次归因模型就会把100%的功劳都归功于收藏夹（直接流量）。但是真实的用户行为路径更接近于产生兴趣、信任、购买意向、信息对比等各种环节，这些都是其他渠道的功劳，在这个模型中则无法统计进来，而末次渠道的功劳评估会被大幅高估。
适用于：转化路径少、周期短的业务，或者就是起临门一脚作用的广告，为了吸引客户购买，点击直接落地到商品详情页。
上面讲到的末次互动模型的弊端是数据分析的准确性受到了大量的"直接流量"所误导，所以对于末次非直接点击模型，在排除掉直接流量后会得到稍微准确一点的分析结果。
从上面的案例中，我们可以想象，用户是从淘宝收藏夹里点了一个商品然后进行了购买，但是实际上他可能是点了淘宝直通车后把这个商品加入到收藏夹的，那么在末次非直接点击互动模型里，我们就可以把这个功劳归功于淘宝直通车。
适用于：如果你的公司认为，你们业务的直接流量大部分都被来自于被其他渠道吸引的客户，需要排除掉直接流量，那么这种模型会很适合你们。
末次渠道互动模型会将100%的功劳归于客户在转化前，最后一次点击的广告渠道。需要注意这里的"末次互动"是指任何你要测量的转化目标之前的最后一次互动，转化目标可能是销售线索、销售机会建立或者其他你可以自定义的目标。
优点：这种模式的优点是通常跟各渠道的标准一致，如Facebook Insight使用末次Facebook互动模型，谷歌广告分析用的是末次谷歌广告互动模型等等。
弊端：很明显当你在多渠道同时投放的时候，会发生一个客户在第一天点了Facebook的广告，然后在第二天又点击了谷歌广告，最后并发生了转化，那么在末次渠道模型中，Facebook和谷歌都会把这次转化的100%功劳分别归到自己的渠道上。这就导致各个部门的数据都看起来挺好的，各个渠道都高估了自己影响力，而实际效果则可能是折半，如果单独使用这些归因模型并且把他们整合到一个报告中，你可能会得到"翻倍甚至三倍"的转化数据。
适用于：单一渠道，或者已知某个渠道的价值特别大
首次互动的渠道获得100%的功劳。
换句话说，首次互动模型更加强调的是驱动用户认知的、位于转化漏斗最顶端的渠道。
优点：是一种容易实施的单触点模型
弊端：受限于数据跟踪周期，对于用户路径长、周期长的用户行为可能无法采集真正的首次互动。
适用于：这种模型适用于没什么品牌知名度的公司，关注能给他们带来客户的最初的渠道，对于扩展市场很有帮助的渠道。
对于路径上所有的渠道，平等地分配他们的贡献权重。
线性归因是多触点归因模型中的一种，也是最简单的一种，他将功劳平均分配给用户路径中的每一个触点。
优点：他是一个多触点归因模型，可以将功劳划分给转化漏斗中每个不同阶段的营销渠道。另外，他的计算方法比较简单，计算过程中的价值系数调整也比较方便。
弊端：很明显，线性平均划分的方法不适用于某些渠道价值特别突出的业务。比如，一个客户在线下某处看到了你的广告，然后回家再用百度搜索，连续三天都通过百度进入了官网（真实用户场景也许就是用户懒得记录或者收藏官网地址），并在第四天成交。那么按照线性归因模型，百度会分配到75%的权重，而线下某处的广告得到了25%的权重，这很显然并没有给到线下广告足够的权重。
适用于：根据线性归因模型的特点，他更适用于企业期望在整个销售周期内保持与客户的联系，并维持品牌认知度的公司。在这种情况下，各个渠道在客户的考虑过程中，都起到相同的促进作用。
对于路径上的渠道，距离转化的时间越短的渠道，可以获得越多的功劳权重。
时间衰减归因模型基于一种假设，他认为触点越接近转化，对转化的影响力就越大。这种模型基于一个指数衰减的概念，一般默认周期是7天。也就是说，以转化当天相比，转化前7天的渠道，能分配50%权重，前14天的渠道分25%的权重，以此类推...
优点：相比线性归因模型的平均分权重的方式，时间衰减模型让不同渠道得到了不同的权重分配，当然前提是基于 "触点离转化越近，对转化影响力就越大" 的前提是准确的情况下，这种模型是相对较合理的。
弊端：这种假设的问题就是，在漏洞顶部的营销渠道永远不会得到一个公平的分数，因为它们总是距离转化最远的那个。
适用于：客户决策周期短、销售周期短的情况。比如，做短期的促销，就打了两天的广告，那么这两天的广告理应获得较高的权重。
基于位置的归因模型，也叫U型归因模型，它其实是混合使用了首次互动归因和末次互动归因的结果。
U型归因模型也是一种多触点归因模型，实质上是一种重视最初带来线索和最终促成成交渠道的模型，一般它会给首次和末次互动渠道各分配40%的权重，给中间的渠道分配20%的权重，也可以根据实际情况来调整这里的比例。
U型归因模型非常适合那些十分重视线索来源和促成销售渠道的公司。该模型的缺点则是它不会考虑线索转化之后的触点的营销效果，而这也使得它成为销售线索报告或者只有销售线索阶段目标的营销组织的理想归因模型。
以下，我们通过神策数据提供的归因模式，做一次计算原理的演绎：
下图是通过神策分析所得到某电商用户行为序列图示。在图示中，各字母代表的含义是 D-广告位、Q-商品详情页、D-推荐位、M-购买商品。目标转化事件是“购买商品”，为了更好地“配对”，运营人员将 M1（目标转化事件——购买商品1）与 Q1（前项关联事件——商品 1 详情）设置了属性关联，同样将 M2 与 Q2 进行关联。
该场景中，发生了两次购买行为，神策分析进行归因时会进行两轮计算，产生计算结果。
（一）第一轮计算：
第一步，从 M1 开始向前遍历寻找 Q1 以及离 Q1 最近发生的广告浏览。
如图所示，不难得到结果 M1=[Dc，Dc，Da] 。
第二步，我们带入分析模型中，进行功劳的分配。运营人员选择 “位置归因” 的分析模型，根据“位置归因”的计算逻辑，第一个“待归因事件”和最后一个“待归因事件”各占 40%，中间平分 20% 。
第一轮我们得到结果：Dc=0.4；Dc=0.2；Da=0.4
（二）第二轮计算
从 M2 开始向前遍历寻找 Q2 以及离 Q2 最近发生的广告浏览。
这里值得强调的是，即使第一轮中计算过该广告，在本轮计算时依然会参与到计算中，因为经常会出现一个广告位同时推荐多个商品的情况。
我们不难得到结论，M2=[Dc，Db] 。基于这个结论，我们通过“位置归因” 得到结果：Dc=0.5；Db=0.5 （不足 3 个时会有特殊处理）。
经过两轮计算，我们得出结论：Dc=1.1；Da=0.4；Db=0.5，则广告位 c 的贡献最大、广告位 b 贡献次之，广告位 a 的贡献最小。
马尔科夫链思时间、状态都是离散的马尔科夫过程，是将来发生的事情，和过去的经理没有任何关系（只和当前有关系）。通俗的讲：今天的事情只取决于昨天，而明天的事情只取决于今天。
回到归因模型上，马尔科夫链模型实质就是：访客下一次访问某个渠道的概率，取决于这次访问的渠道。
归因模型的选择，很大程度上决定转化率计算结果，像前面讲的首次互动、末次互动等模型，实际上需要人工来分配规则的算法，显然它并不是一种“智能化”的模型选择。而且因为各个推广渠道的属性和目的不同，我们也无法脱离用户整个的转化路径来单独进行计算。因此，马尔科夫链归因模型实质上是一种以数据驱动的(Data-Driven)、更准确的归因算法。
马尔科夫链归因模型适用于渠道多、数量大、有建模分析能力的公司。
那么具体马尔科夫链怎么玩？（请自备图论知识）
如果将各推广渠道视为系统状态，推广渠道之间的转化视为系统状态之间的转化，可以用马尔科夫链表示用户转化路径。
马尔科夫链表示系统在t+1时间的状态只与系统在t时间的状态有关系，与系统在t-1,t-2,...,t0时间的状态无关，平稳马尔科夫链的转化矩阵可以用最大似然估计，也就是统计各状态之间的转化概率计算得到。用马尔科夫链图定义渠道推广归因模型：
1、状态集合，定义为 banner,text,keyword,link,video,mobile,unknown 7种推广类型加上start,null,conversion 3种系统状态
2、稳定状态下的转化矩阵，通过某公司web网站20天的原始click数据计算的得到如下状态转化矩阵
3、利用该转化矩阵来构造有向图（Directed Graph），通过计算从节点start到节点conversion的所有非重复路径（Simple Path）的累乘权重系数之和来计算移除效应系数
4、通过移除效应系数，计算各个状态的转化贡献值
什么是移除效应？
我们可以把上面的案例简化一下，尝试具体计算下移除效应和各渠道的转化贡献值：
在以上系统中，总体的转化率 = （0.667*0.5*1*0.5+0.333*1*0.5）=33.3%
移除节点C1后，整体转化率 = 0.333*0.1*0.5 = 16.7%，所以C1节点的移除效应系数 = 1-0.167/0.333=0.5
同理可计算节点C2和C3的移除效应分别是1和1
通过移除效应系数计算得到转化贡献值：
C1 : 0.5 / (0.5+1+1) = 0.2
C2 : 1 / (0.5+1+1) = 0.4
C3 : 1 / (0.5+1+1) = 0.4
如果你对马尔科夫链有疑惑，可以点击这里了解下
从上面这么多种归因模型来看，我们大概可以把他们分成2类：
（1）基于规则的：预先为渠道设置了固定的权重值，他的好处是计算简单、数据容易合并、渠道之间互不影响，当然你也可以根据实际需要去调整他们的权重配比
（2）基于算法的：每个渠道的权重值不一样，会根据算法和时间，不同渠道的权重值会发生变化（数据驱动）
在选择用何种归因模型之前，我们应该先想清楚业务模式！
如果是新品牌、新产品推广，企业应该给予能给我们带来更多新用户的渠道足够的权重，那么我们应该选择首次互动模型；
如果是投放了单一的竞价渠道，那么我们应该选取末次互动归因模型或者渠道互动归因模型；
如果公司很在乎线索来源和促成销售渠道，那么我们应该选择U型归因模型；
如果公司的渠道多、数据量大，并且由永久用户标识，基于算法的归因模型能够为营销分析提供巨大的帮助；
....
总的来说，没有完美的归因模型。任何模型都存在他的局限性和不足，如何有效地结合客观数据与主观推测，是用好归因模型的重要能力前提。
这里抛出一个有趣的问题，大家可以通过思考他背后的分析逻辑，尝试一下如何应用到归因模型中
哈尔滨国际行情分析软件是什么
哈尔滨国际行情分析软件是神策分析云。
神策分析云析云是神策数据旗下产品，主要功能。
整合广告投放、用户行为、业务经营等多种数据源，覆盖全场景的业务分析与用户（群）洞察。
为企业中的不同角色提供实时、多维度的数据分析和智能决策方案。
大数据分析系统平台方案有哪些？
大数据分析系统平台方案有很多，其中就有广州思迈特软件Smartbi的大数据分析系统平台方案。大数据分析系统平台方案深度洞察用户数据,帮企业用数据驱动产品改进及运营监控，思迈特软件Smartbi是企业级商业智能和大数据分析品牌，经过多年持续自主研发，凝聚大量商业智能最佳实践经验，整合了各行业的数据分析和决策支持的功能需求。满足最终用户在企业级报表、数据可视化分析、自助探索分析、数据挖掘建模、AI智能分析等大数据分析需求。
Smartbi产品功能设计全面，涵盖数据提取、数据管理、数据分析、数据共享四个环节，帮助客户从数据的角度描述业务现状，分析业务原因，预测业务趋势，推动业务变革。
思迈特软件Smartbi是国家认定的“高新技术企业”，广东省认定的“大数据培育企业”，广州市认定的“两高四新企业”，获得了来自国家、地方政府、国内外权威分析机构、行业组织、知名媒体的高度关注和认可，斩获“大数据百强企业”、“中国十佳商业智能方案商”、“中国科技创新企业100强”等100+荣誉奖项！
凭借NLP和数据挖掘功能入选Gartner“中国AI创业公司代表厂商（2020）”，凭借思迈特软件Smartbi入选“Gartner?增强分析2020代表厂商” 。

【Attribution Analysis 归因分析模型解析神策分析软件】关于神策分析和神策分析软件的内容就分享到这儿！更多实用知识经验，尽在 www.hubeilong.com

Attribution Analysis 归因分析模型解析 神策分析软件

Attribution Analysis 归因分析模型解析神策分析软件