数据分析的工作流程
在数据分析的世界里,掌握软件工具固然重要,但数据分析的工作流程同样占据重要地位,令人好奇。本文将与大家分享我参与的真实数据分析工作,带领大家一探究竟。
介绍一下背景。我从事的工作主要涉及数字营销。浏览网站时,广告的出现再熟悉不过了。当广告吸引你点击,页面跳转至银行界面,填写申请信息后提交,背后是银行后台核实信息的过程。这一过程被称为Application Adjudication(申请审核)。
这就是典型的数字营销过程。数字媒体公司(简称A公司)承包各大网站广告位,我们银行(简称B公司)的数字市场部门向A公司购买广告位。计费方式通常基于展现量(impressions)或销售数量。
A公司内部利用软件平台记录展现量和点击量等数据。谷歌的Campaign Manager和Analytics等产品是常用工具。我们称之为Media File。而当用户点击广告进入B公司页面,B公司的软件平台(多为谷歌产品)也会记录流量走向,我们内部称为Floodlight file。
我的工作是为数字市场部门制作报告,展示展现量、点击、申请及销售数量等信息。
工作周期以周为单位。每周一早上,我会从A公司网站下载上周的Media File,从我们的流量记录平台下载Floodlight File。这些文件以CSV格式保存,可用Excel打开。这个过程可能需要一上午的时间,如遇系统故障,可能需要一整天。因为A公司的广告渠道众多,包括社交媒体、经销商网站及搜索引擎等。
接下来,我将这些CSV文件数据转移到SAS环境中,通过匹配条件将Media和Floodlight文件合并。这是数据分析中的关键步骤,称为表格联接(joining tables),实际工作中多使用SQL语句完成。还需访问B公司的数据库,获取审核数据(包括批准、拒绝和待处理状态)。
合并表格后,根据市场部门的需求,创建新变量或进行计算。例如,点击率是点击数除以展现量,通过率则是卖出数除以申请数等。我们的工作主要是通过编写程序(主要是SQL语句)来实现业务部门提出的指标要求。这部分工作大约占据70%的时间和精力。
整合这些数据后,将其展示在Excel上或其他报告工具中。根据指标特点选择合适的图表展示方式。通常周三下午前完成这些工作,并与市场部门讨论数据和报告中的变化。市场部门的需求经常变动,一旦指标或计算方式调整,我们在SAS中的程序也要相应更改。随着市场策略的变化,这些程序可能需要调整。因此周四和周五主要根据市场策略更新程序。
部分程序可能无法在短期内完成,因此我们会在截止日期前使用旧策略。完成代码更改后还需进行质量检测与测试(QA),确保无误后才应用到日常工作中。