宠文网

成为数据分析师:6步练就数据思维

宠文网 > 哲学心理 > 成为数据分析师:6步练就数据思维

步骤5 数据分析步骤

书籍名:《成为数据分析师:6步练就数据思维》    作者:托马斯.达文波特
    《成为数据分析师:6步练就数据思维》章节:步骤5 数据分析步骤,宠文网网友提供全文无弹窗免费在线阅读。!



既然数据本身并不会告诉我们任何信息,那么我们就需要分析它,以破译出它的意义和暗含的关系。数据分析需要找到恒定的模式;换言之,就是蕴含在数据中的变量之间的关系。当你看到模式浮现出来时,解释数字就会变得更加容易。当你从变量中提炼出这些模式时,解决问题就会变得更加容易。比如,假设我们正在对一个为总统候选人投票的选民样本进行电话调查,并通过这种方式来收集数据。然后,通过分析收集到的数据,我们设法找出不同区域、受教育程度、收入、性别、年龄和党派的人士可能支持任意特定候选人的模式。通过数据来找出模式可以采用各种方法,从基础的分析如图表、百分比和均值分析到更加精密的统计方法都可以。数据的特征和复杂性决定了具体应该采用哪些方法。

回想一下我们在第1章中描述的分析案例的不同类型。如果你正在讲述一个“情况是这样的”的案例,那么你会做出的唯一的分析类型很可能是某种形式的报告;也就是说,你会撰写一个报告或描绘一系列图表来说明在你的数据中发现了多少归于同类的事情。你最多不过报告对核心趋势的一些测量,比如均值或中值。采用这种方法你需要主要聚焦于报告的软件。仪表盘、积分卡以及警报器都是报告的方式。在“针对不同分析类型的主要软件供应商”中,我们列出了一些主要的报告软件供应商。

人人都是分析师

针对不同分析类型的主要软件供应商

(按字母顺序排序)

报告软件:

BOARD  International;

IBM  Cognos;

Information  Builders  WebFOCUS;

甲骨文商业智能(Oracle  Business  Intelligence,包括Hyperion);

Microsoft  Excel/SQL  Server/SharePoint;

微策略(Microstrategy);

全景(Panorama);

SAP商务智能解决方案(SAP  BusinessObjects)。

交互式可视化分析软件:

QlikTech  QlikView;

Tableau;

TIBCOSpotfire。

定量或统计建模软件:

IBM  SPSS;

R(一个开源软件包);

SAS。

虽然所有列出的报告软件供应商同样有图形展示的能力,但是其中一些供应商特别关注交互式可视化分析,或者数据和报告的视觉呈现的利用情况。这些工具常常被简单地运用于图形数据和数据发现,后者用于理解数据的分布,识别两个变量间的异常值(不可预料的数据点)和视觉关系。因此,我们把这些软件供应商列为一个单独的种类。

我们也为其他分析种类列出了核心的软件供应商,我们将这些种类称为定量或统计建模。在这些种类中,你会设法使用统计学来理解变量之间的关系,以及通过你设定的样本来推断更大的人口范围内的情况。预测分析、随机检验以及各种形式的回归分析都是建模类型。这种数据类型的软件供应商往往与报告软件供应商不同,虽然随着时间的推进,这两种类型的软件供应商会有一些融合。

例如,微软Excel可能是世界上使用得最为广泛的分析软件工具(虽然大多数人将它视为一个电子表格工具),它可以和报告一样进行统计分析(以及视觉分析),但是如果你有大量的数据或者需要建立复杂的统计模型,那么Excel并非最强大的统计软件,这就是它之所以没有被列在上面表单中的原因。在企业环境下,使用Excel进行分析常常是和微软的其他产品强强联手,包括SQL  Server(主要是一个数据库工具,但是带有一些分析功能)和SharePoint(主要是一个协作工具,但是带有一些分析功能)。