移动互联网数据模型分析方法-5W1H1R

在上次思考了《到底什么是数据模型和数据建模》后,继续胡思乱想,最近思路有点改变,不再想希望能集合一群人(有点类似咨询团队,这也许比较适合于运营商吧)来讨论设计能出一个比较理想的数据模型,转而分点突破,比如考虑用户行为中的下载或者付费,由点及面或者现阶段更合适些。

在和同事讨论下载行为的过程中,对于如何来提炼用户行为的数据模型,借鉴一下5W+1H方法,整理了下图,我把它称之为”5W1H1R”分析方法。

5W1H1R

看看图很简单,而且貌似不同的行业、不同的系统也许都一样,但这里还是有移动互联网所独特的地方,并且要想真正回答清楚这些问题,其实也不是一件容易的事情。

1. Who

Who是主题,谁产生的行为?也就是用户。看似很简单,但如何来标识一个用户,是个很实际的问题?从终端上传的信息看可能会有手机号码、IMSI、IMEI,如果是一个注册系统,则往往会带有系统内部的一个ID。而一个用户可能会存在换手机、换号码、换SIM卡等各种行为,注册账号又可能有马甲小号,那么各个用户行为(比如下载、登录、消费 )记录之间的关联我们以什么标识将是至关重要的。

没有标准答案,还是会因不同系统不同设计而不同,不过不建议以IMEI来标识,Who的主题应该还是人,IMEI更应该归属与Which代表的终端设备中。对于注册系统,内部ID相比手机号和IMSI来说或者是更理想的一个选择,但往往很多系统注册都不会是强制要求的,此时需要注意不同ID之间的关联处理。

2. When

When是行为的产生时间,一般考虑开始和结束就可以了,不过特别需要注意的是当你考虑不同的业务记录需要串接起来时,时间的一致性会是个让你头疼不已的问题。

3. Where

Where是行为的发生地点,地域信息,这里移动的特性对于判断准确性会有所影响。

4. What

What是用户行为所针对的主体,比如在下载业务中,会有APP、内容、插件,需要做好业务的分类归属,这部分基础数据的完整性和定义将是后续分析最重要的基础。

5. Which

Which是行为采用哪一种基础方式,会因不同的业务行为有多种,而在移动互联网中最独特的两项就是网络和终端,也是整个用户行为体验中的基础环节。网络涉及什么运营商,2G还是3G的网络或者WIFI,终端的信息则更多,厂商机型、什么平台、屏幕大小、内存大小、CPU的处理能力等等。

6. How

How是针对用户行为来说,是考虑其怎么实现的?比如对于下载,由于移动互联网网络的特性,下载速率不高,失败的可能也会比较大。很多时候我们需要采用断点续传的方式,或者把应用进行分包拆小了做处理。

7. Result

Result是整个用户行为最终的结果,也就是行为所代表的业务记录,最后的结果是否成功等。同时在这里我们也需要考虑特定业务它所不同的特性,比如下载我们可能需要考虑来源。

先出这个初稿,后续有进展再慢慢完善吧。