什么是数据科学?

数据科学基础的初学者指南

2021年6月2日
10分钟阅读
数据科学指南

在这个技术驱动的世界里,数据让企业以前所未有的速度增长。这就是为什么数据科学是一项至关重要的实践在每一个行业,因为它通过评估大量的可用数据,帮助组织做出更明智的决策和预测。

但问题是:除非您熟悉数据科学及其应用,否则就无法充分利用可用数据的潜力。因此,你的企业可能会错过增长和扩大商业收入的宝贵机会。

我们把这份指南放在一起,告诉你你需要知道的关于数据科学的一切,包括它与类似的研究领域有什么不同,它的用途是什么,它的各种应用,以及为什么它应该对你的业务很重要。

数据科学101

1.什么是数据科学?

数据科学是一个多学科领域,它将统计学、数据分析为了理解和探索结构化和非结构化数据中的现象。它与以下领域密切相关:

  • 数据挖掘

  • 大数据

  • 机器学习

数据科学还使用借鉴自其他几个领域的实践和概念,涉及:

  • 数学

  • 统计数据

  • 计算机科学

  • 信息科学

  • 领域知识

“数据科学”这个词从20世纪60年代就出现了,但在过去,它也被用来表示“计算机科学”。“然而,作为一个研究领域,数据科学被认为是年轻的。它是从统计分析和数据挖掘的学科发展而来的。

数据科学杂志于2002年发布,到2008年,数据科学家的头衔被创造出来,该领域迅速崛起。

结构化和非结构化数据:有什么区别?

正如我们所提到的,数据科学在很大程度上依赖于检查结构化和非结构化数据来获得见解。

结构化数据是量化数据,这意味着它是数字和值的形式。它具有高度的组织性,并且在以传统表格格式管理数据的数据库中易于搜索。结构化数据的常见例子包括:

  • 的名字

  • 日期

  • 地址

  • 产品标识号

  • 用户ID号码

非组织性数据,另一方面,没有预先确定的格式或组织,这使得收集、处理和检查更加困难。它被称为定性数据,这意味着它由文本文件、音频文件和视频文件形式的数据组成。

非结构化数据的其他常见例子包括:

  • 社交媒体帖子

  • 卫星图像

  • 监控图像

  • 传感器

大部分数据是非结构化的,并且是从电子邮件消息、文字处理文档、PDF文件等来源的。寻找隐藏在非结构化数据中的有用信息是一项困难的操作,需要高级的分析技能和技术专门知识。

2.数据科学vs.数据挖掘vs.机器学习vs.大数据

数据科学与数据挖掘、机器学习和大数据等领域密切相关,但指出这些领域之间的差异以避免混淆是很重要的。

数据科学vs.数据挖掘

数据挖掘是一个过程这需要在大量计算机数据中搜索,以发现有用的模式或趋势。它也被称为数据考古学、信息收集、信息发现或知识提取。

数据挖掘是一种技术,而数据科学是使用这种技术的研究领域。此外,数据挖掘主要处理结构化数据,但数据科学必须利用所有类型的数据,包括结构化、非结构化和半结构化。

数据科学vs.机器学习

机器学习是人工智能的一个子集.它指的是计算机算法的研究和发展,能够通过经验和从数据模式中做出判断自动学习和适应。

机器学习为我们今天使用的许多服务提供了动力,比如Netflix、YouTube、谷歌、Facebook等等。这些平台收集了大量关于你的数据,比如你喜欢看的类型和你参与的链接。然后,他们使用机器学习对你接下来可能想要的东西做出高度知情的猜测。

因此,机器学习是指数据科学家使用的一组让计算机从数据中学习的技术。尽管数据科学包括机器学习,但它仍然只是这一广阔研究领域的一小部分。

数据科学vs.大数据

大数据是指非常大的数据集合需要专门的技术和技巧来有效地利用数据。这些不同的数据类型由多个来源生成,包括所有类型和格式的数据。

另一方面,数据科学是一个涉及处理大数据的科学编程工具、模型和技术的专门领域。作为一个研究领域,数据科学提供了从大型数据集中提取见解和信息的技术,然后用于支持组织做出更明智的决策。

3.为什么数据科学对商业很重要

随着企业对技术的依赖程度越来越高,他们也更加重视技术数据科学所扮演的角色在他们的组织内部。以下是数据科学为任何业务增加价值的8种方式。

1.数据科学家帮助管理层做出更明智的决策

数据科学家的部分职责是测量、跟踪和记录性能指标和其他信息,以改进整个公司的决策实践。此外,他们利用这些数据确保所有员工都能最大限度地发挥他们的能力。数据科学家被视为管理岗位上值得信赖的顾问,他们的工作为组织的整体成功提供了巨大的价值。

2.他们帮助确定组织的目标

数据科学家与公司的数据密切合作,并使用这些非常有价值但又神秘的信息提出具体的行动,以提高业务表现、客户参与度和留存率,并最终导致利润增加。

3.他们鼓励员工解决关键的业务挑战

数据科学家还必须确保公司的员工理解并熟悉公司的分析产品。他们必须展示如何成功地使用该系统来获取见解和推动行动。这使得员工不仅可以理解产品的能力,还可以将他们的注意力转移到解决这些关键的业务障碍上。

4.数据科学家发现机遇

数据科学家的角色要求他们不断改进和增加组织数据产生的效益。要做到这一点,他们必须质疑当前的过程,以发展进一步的方法和分析算法。

5.它们消除了高风险的潜在风险

由于数据科学家从多个来源收集和分析数据,他们能够使用这些现有数据创建模型,模拟各种可能的行动。由于这一点,组织可以了解哪些决策将产生最好的可能结果,从而消除许多潜在的风险。

6.他们衡量决策的成功与否

虽然数据科学家使用组织的数据为他们提供关于最佳决策的建议,但他们也使用数据来衡量关键指标,并确定结果最终是否成功。他们检查新的变化如何影响组织,并计算其成功程度。

7.数据科学家对目标受众进行了更精确的识别

数据科学家利用现有的一维客户数据,并将其与其他形式的数据结合起来,生成更全面的关于一个公司的受众和目标客户

这种深入的知识使公司能够更成功地将其产品或服务定位于目标消费者,从而产生更大的利润。

8.他们可以利用数据找到合适的求职者

数据科学家实际上可以利用潜在求职者的现有数据——通过社交媒体、企业数据库和求职网站——找到最符合公司要求的人。

数据科学家可以进一步利用数据来处理应用程序,并创建数据驱动的能力倾向测试和游戏。这将导致更快、更精确的招聘选择,并进一步提高公司成功的潜力。

4.数据科学的用途是什么?

数据科学的核心是通过评估数据来做出更明智的决策和预测。该研究领域通过4种不同的方法来实现这一点:

  • 预测因果分析

  • 规范的分析

  • 机器学习进行预测

  • 用于模式发现的机器学习

1.预测因果分析

预测因果分析是一种用于预测未来发生某一事件的可能性的方法。它可以用于公司的许多方面,从预测客户行为和购买模式到检测销售活动的趋势。预测因果分析例如,它也被金融公司用来确定客户的信用评分,以及他们是否能够还款的可能性。

2.规范的分析

说明性分析是一个相对较新的过程,主要是提供建议。它试图计算未来决策的影响,以便在决策实际做出之前就可能的结果提出建议。规范性分析的一个很好的例子是谷歌的自动驾驶汽车。这是一个极其复杂的完善过程,需要混合使用技术和工具,如业务规则、算法、机器学习和计算建模过程。

3.机器学习进行预测

机器学习算法有时在协助进行预测方面更有利。这一过程被称为监督学习,它涉及使用你已有的数据,然后用这些数据来训练机器。一个例子可能包括使用过去营销活动的数据集来确定当前营销活动的下一个最佳行动。

4.用于模式发现的机器学习

机器学习也非常有用当您没有进行精确预测所需的参数时,因为它可以用于查找数据集中的隐藏模式。这就是所谓的无监督学习。

5.数据科学应用和示例

数据科学的应用几乎改变了你能想到的所有行业,谢天谢地,这并不是一个正在放缓的领域。例如,在医学领域,数据科学可以帮助识别疾病并预测患者的副作用。在约会领域,它使用算法帮助人们找到自己的完美伴侣,在我们的日常生活中,数据科学被用于GPS应用程序,根据实时交通状况提供优化的路线建议。

然而,在本节中,我们将关注数据科学在电子商务和定向广告中的不同用例,并研究这些行业中的两个关键示例。

数据科学在定向广告中的应用

1.聪明的投标。智能竞价也被称为“拍卖时竞价”,它是谷歌Ads的一种数字广告工具,在每次拍卖中使用机器学习优化广告的转换或特定的转换价值。它使用机器学习、活动数据和用户数据来优化用户的广告活动,帮助他们获得最佳的投资回报(ROI)。

2.程序化的广告。程序化广告使营销人员能够在最理想的情况下,在最理想的时间向正确的人传递有针对性的信息。例如,网络横幅和数字广告牌等广告方法使用数据科学算法来确定它们应该在哪里、何时以及向谁展示。

3.视觉营销。店面平面图和3D显示器也利用数据科学来确定它们的位置,以实现销售额的最大化。视觉营销旨在吸引、参与和激励客户购买产品或服务,但依赖于相关的客户数据来获得成功。

4.谷歌的广告。谷歌也使用机器学习PPC广告,这使广告商能够确定他们的广告活动在不同渠道上的影响,并据此作出相应调整,以达到最佳效果。通过AdWords、谷歌分析和DoubleClick搜索等功能,用户可以从他们所有的营销渠道收集数据。

案例研究:Opera Pay (O-Pay)。O-Pay是一个移动支付平台,是非洲规模增长最快的公司之一。在非洲,超过60%的人仍然没有银行账户,无法获得最基本的金融服务。然而,O-Pay允许用户使用手机通过O-Pay App为商品和服务进行电子支付。除了移动支付和转账,用户还可以使用拼车和外卖。

O-Pay就是一个利用数据和定向广告为目标市场在正确的时间提供正确机会的公司。

数据科学在电子商务

1.推荐引擎。推荐引擎使用机器学习和深度学习算法,旨在跟踪顾客的个人行为包括他们的消费模式。利用这些数据,他们会提出有针对性的建议。Netflix和亚马逊只是使用这种模式的两家主要公司。

2.市场篮子分析。零售商多年来一直在使用这种传统的数据分析工具。它通过分析现有数据来预测顾客购买商品的可能性和购买商品的种类。例如,如果一个顾客购买了三部小说系列中的一部小说,那么他或多或少都有可能购买该系列中的其他小说。

3.保证分析。保修分析帮助零售商和制造商监控他们的产品的潜在寿命、问题、退货和可能的欺诈活动。分析这些数据不仅有助于降低保修成本,还可以提高客户满意度。

4.价格优化。机器学习还可以用于确定产品的最优价格,考虑到所有相关方,包括客户、制造商和竞争对手。该算法分析了价格灵活性、客户人口统计、单个客户的购买态度和竞争对手的定价等因素的数据,以确定这个数字。

5.库存管理。为了增加销售额,确认及时发货,管理库存,零售商还可以利用机器学习算法分析相应的数据,并制定成功的策略。

6.新店的位置。在一个企业决定在哪里开设他们的商店之前,他们必须依靠通过数据分析的位置分析。相关数据包括邮政编码人口统计以及竞争对手的位置。通过机器学习算法,分析师可以确定市场的潜力。

7.客户情绪分析。最终,这涉及到监控社交媒体和处理消费者对一个品牌使用的语言。这种语言与消费者对品牌的态度是积极还是消极密切相关。机器学习算法帮助简化和自动化这个过程,而不是手动执行这个分析,同时给出准确的结果。

8.销售。使用机器学习算法,公司还可以确定成功推广其产品和增加销售的策略。诸如对客户购买习惯的洞察以及帐户季节性、相关性和趋势等数据被用于制定这一点。

9.寿命价值预测。通过从客户偏好、消费、最近购买和行为中获取数据,可以得出两种重要的客户寿命预测方法:历史的和预测的。可以确定现有和潜在客户的可能价值,以及客户的特征和他们的选择之间的任何关系。

案例研究:Airbnb

Airbnb是电子商务公司利用数据科学促进业务发展的一个很好的例子。具体来说,该公司使用数据来改进其搜索功能,并确保它是用户数据驱动的。他们使用了一个包含客人和主人互动的丰富数据集,并建立了一个模型,在给定搜索地点的情况下,预测预订地点的条件概率。

Airbnb还使用数据根据人口统计来调整搜索体验。例如,一些亚洲国家的用户会看到中国、日本、韩国和新加坡的热门旅游目的地,而不是典型的“邻里”链接。根据数据,Airbnb发现来自这些国家的用户转化率提高了10%。

6.为什么数据科学很重要?

到目前为止,您可能已经开始理解数据科学在全球范围内所扮演的重要角色。让我们来看看为什么数据科学如此重要的其他一些原因。

1.加深与客户的联系。数据科学通过对可用数据的分析,使公司能够在比以往更深入、更有意义的层面上与客户建立联系。这些数据描绘了公司目标客户的更全面的图景,这种了解对产品或服务的成功起着至关重要的作用。

2.更强大的营销。它还通过提供组织更有力地讲述其品牌故事所需的数据,创建更好的产品连接。数据科学可以回答关于公司目标受众的无数问题,因此允许他们调整营销信息和品牌识别相应的行动。

3.适用于所有行业。数据科学及其结果可以应用于任何行业,无论是教育、旅游、医疗保健等。在数据科学家的帮助下,每个领域都可以使用数据为客户做出更明智的决策,并更成功地应对挑战。

4.数据是一种无限的资源。全球范围内数据的可用性正以秒为单位增加,因此这是一种永远不会受到限制的资源。当数据科学家正确地利用这些数据并充分发挥其潜力时,它就掌握了无限潜力和增长的关键。

5.每个部门都使用。数据科学也可以应用于组织的各个部门,这意味着它有可能帮助每个团队。从人力资源和IT到资源管理和客户服务,数据科学不仅仅是一个帮助高级领导角色的研究领域。每个人都有可能受益。

6.可以降低现有成本。除了帮助公司通过提高销售额赚更多的钱外,数据科学还可以揭示公司如何通过削减现有成本来省钱。数据科学家可以使用数据来量化当前程序、工具或技术的成功程度。利用这些数据,他们还可以建议更成功的替代方法,但也是最具成本效益的。

7.数据科学模型

数据科学模型组织数据元素并规范数据元素之间的关系。简单地说,数据模型代表现实,因为它的数据元素记录了人和地点、事件、动作以及与现实生活相关的几乎所有其他事情。

以你早上的通勤为例。在一遍又一遍沿着同一条路线开车去上班之后,你就会开始调整自己的驾驶行为,以优化你的旅程,无论是找到最快的车道,还是稍微提前一点出发以避免交通堵塞。

与科学家的数据模型相比,你作为司机的经验等于数据,你的大脑发展更好的驾驶模式就像计算机一样。因此,数据模型是影响工作所需时间的数据输入方程。

如何构建数据科学模型

构建数据模型涉及6个关键步骤。这些包括:

1.数据提取

开始收集与您将要解决的业务问题相关的数据。你可以利用很多在线数据仓库,包括:

  • Kaggle,用于数据科学项目

  • UCI ML知识库,一个机器学习存档

  • 数据集搜索引擎,基于谷歌的数据集搜索

  • NCBI,生物技术的学术研究平台

2.数据清理

数据清理可以消除可能对数据模型产生负面影响的错误。这些可能包括:

  • 重复的条目

  • 输入数据不准确

  • 修改、更新或删除的数据项

  • 缺失值

你可以通过以下方法有效地消除这些错误:

  • 通过引用公共id过滤重复项

  • 注意数据更新的日期

  • 用平均值填入任何缺少的项

3.分析所涉及的基本模式

构建一个交互式仪表板,以查看您的数据如何反映重要见解。这将允许您分析是什么在指导您的业务的可变特性,例如增加或减少。

你可以使用两个有用的工具来完成这一步:

  • 微策略

4.识别关键特征

最终确定一个合适的机器学习算法的先决条件是识别跨越两类的关键特征:

  • 不变的特征不太可能随时间而改变

  • 变量特征,其值周期性波动

这一步被称为特征工程,需要数据科学家在构建数据模型时决定测试哪些因素,并最终包括或排除这些因素。

5.利用机器学习算法

机器学习算法将帮助您建立一个有效的数据模型。算法就是提供给计算机系统执行特定任务的一组指令。有多种机器学习算法可供选择,包括:

  • 监督式学习该算法使用线性回归、随机森林和支持向量机等算法

  • 无监督学习,该算法使用的算法称为k-means和apriori算法

  • 强化学习该系统使用的算法包括Q学习、状态-行动-奖励-状态-行动(SARSA)和深度Q网络

6.评估和部署模型

您需要对算法进行身份验证,以检查它是否为您的业务生成了所需的结果。交叉验证或ROC(受试者工作特征)曲线等技术可能是有帮助的。

如果模型运行正常,那么您可以继续执行它。但是,如果出现问题,请修改前面的步骤,以确定哪里出了问题。

8.什么是数据科学家?

数据科学家检查、处理和建模数据,然后解释调查结果,为组织创建可执行的计划.他们必须处理来自多个来源的大型数据集——结构化和非结构化数据集,包括社交媒体提要、移动设备、电子邮件等。

通常情况下,这些数据可能很复杂,不能完全放入典型的数据库中。因此,他们必须利用他们在计算机科学、统计学和数学等领域的知识,同时利用他们在技术和社会科学方面的技能,在数据中发现趋势,并发现成功的解决业务挑战的方案。

数据科学家与组织内的其他部门协作工作,如营销、客户成功和运营。

除了做出数据驱动的组织决策,数据科学家还必须能够沟通复杂的想法,作为领导者和团队成员工作,并成为高水平的分析思考者。

通常,数据科学家的职责可能包括:

  • 通过无方向的研究和确定开放式的行业问题来解决业务挑战

  • 从关系数据库中提取大量结构化和非结构化数据,以及通过web抓取、api和调查提取非结构化数据

  • 通过复杂的分析方法、机器学习和统计方法组织用于预测和规定性建模的数据

  • 清理数据,为预处理和建模做准备

  • 建立如何管理缺失数据并在数据集中寻找趋势和/或机会

  • 发现新的算法来帮助自动化重复性工作和解决其他业务问题

  • 创建数据可视化和报告,并与管理人员和其他部门沟通预测和结果

  • 对公司现有的程序和策略提出具有成本效益和节省时间的改变

数据科学家vs.数据分析师vs.数据工程师

数据科学家的角色经常与其他学科混淆,包括数据分析师和数据工程师。虽然每一种立场都有许多相似之处,但它们也有许多不同之处。让我们在下面逐一探讨这些问题。

数据分析师

很容易理解为什么数据科学家和数据分析师有时会被误认为彼此。数据分析师不仅具有相似的教育背景,而且他们的职责也重叠,包括以下内容:

  • 访问并执行一系列简单到复杂的数据库查询

  • 解析或删除数据集中不正确的、损坏的、格式不正确的、重复的或不完整的数据

  • 总结数据

  • 理解并运用相关的统计和数学技巧

  • 准备数据可视化和报告

数据分析师也不同于数据科学家然而,在以下几个方面:

  • 数据分析师通常不负责数据科学过程中涉及的一些任务,如统计建模和机器学习。

  • 数据分析师使用不同的工具,包括Microsoft Excel、Tableau、SAS、SAP、Qlik、IBM SPSS Modeler、Rapid Miner和KNIME。另一方面,数据科学家利用诸如R和Python之类的工具来履行他们的职责。

  • 数据分析师经常从管理层得到问题和目标,执行分析,然后向管理层报告他们的发现。然而,数据科学家自己提出问题,他们知道哪些业务目标是最重要的,以及如何使用数据来实现这些特定的目标。

  • 与数据分析师相比,数据科学家通常使用更高级的统计、分析和建模技术

数据工程师

数据工程师和数据科学家在技能和职责方面有一些重叠之处。这些包括:

  • 共同的计算机科学背景

  • 中级至高级数据分析技能

  • 有编程经验和知识

  • 具有处理大数据和非结构化数据集的天赋

  • 有些工具、语言和软件是重叠的,比如Scala、Java和c#

尽管数据工程师经常与数据科学家混淆,但这两个职业也有一些不同之处。

  • 数据工程师更关心数据架构、计算和数据存储基础设施以及数据流,而不是数据科学家专注的领域,如统计、分析和建模。

  • 数据工程师的重点还在于创建用于生成数据的基础设施和体系结构。另一方面,数据科学家则专注于对生成的数据使用高等数学和统计分析。

  • 数据工程师负责将数据移动并转换为数据科学家的通道。然后,数据科学家必须分析、测试、收集和优化数据,并将其提交给公司。

  • 数据工程师的工具包与数据科学家的工具包也有很大不同。例如,数据工程师主要使用SQL、MySQL、NoSQL、Cassandra和其他数据组织服务,而数据科学家将大量使用复杂的分析工具,如R、SPSS、Hadoop和高级统计建模。

9.数据科学生命周期的过程

数据科学项目的生命周期很长,可能需要几个月才能完成。这就是为什么对于数据科学家来说,每个步骤都必须遵循一个推荐的结构。该过程被称为数据挖掘的跨行业标准过程(或简称为CRISP-DM框架),概述如下。

1.业务的理解

确定业务目标。数据科学项目生命周期的第一步是从业务角度理解目标和需求。客户真正想要完成的是什么?然后,您可以基于此信息定义项目成功标准。

评估情况。确定哪些资源是可用的,项目的需求,确定可能的风险或障碍,并执行成本效益分析。

定义数据挖掘目标。从技术数据挖掘的角度来看,成功是什么样子的?除了确定项目的业务目标外,从数据挖掘的角度考虑手头的任务也很重要。

创建一个项目计划。确定需要使用的技术和工具,然后为项目的每个阶段制定详细的计划。这些基础工作是至关重要的,它将确保您在整个数据科学项目的生命周期内保持正确的轨道。

2.数据的理解

收集初步数据。为这个项目获取必要的数据,如果需要,将其加载到您的分析工具中开始工作。

描述数据。分析数据并记录已获得的数据,包括数据的格式、数据的数量、字段的标识以及任何其他重要元素。评估所获得的数据是否满足项目的要求。

探索数据。进一步深入研究数据,并使用查询、可视化和报告等技术解决数据挖掘问题。

验证数据质量。回答以下重要问题:

  • 数据是否完整?

  • 数据是正确的,还是包含错误?

  • 如果数据中有错误,如果有,它们有多普遍?

  • 数据中是否缺少值?如果有,它们发生在哪里,有多常见?

3.数据准备

选择数据。决定将使用哪些数据集,并写下包含或排除某些数据的理由。

干净的数据。使用适当的分析技术,清理数据以纠正、分配或删除不准确的值。这可能是一个漫长的任务,但对于成功的结果是必要的。

构建数据。创建派生属性。这些是由同一记录中的一个或多个现有属性构造的新属性。一个例子是使用身高和体重字段来确定一个人的身体质量指数。

集成数据。结合来自多个不同来源的数据来创建新的数据集。

格式的数据。以任何必要的方式重新格式化数据。例如,这可能包括从逗号分隔的数据文件的文本字段中删除逗号,或将所有值修改为最多32个字符。

4.探索性数据分析

定义的因素。在构建实际模型之前,检查解决方案和影响数据的因素。

数据可视化。使用数据可视化技术来探索数据的特征,例如柱状图、散点图和热图。

5.数据建模

选择建模技术。决定您将使用哪些算法,并记录将要使用的特定建模技术。

完成测试设计。创建一个过程或机制来测试模型的质量和有效性。

构建模型。在准备好的数据集上运行建模工具以创建一个或多个模型。

评估模型。利用领域知识、数据挖掘成功标准和所需的测试设计,评估模型的成功。

6.模型评价

根据业务目标评估结果。确定:

  • 模型是否满足业务成功的标准?

  • 这种模式不令人满意有什么商业原因吗?

  • 哪一个(几个)应该被批准进行业务?

审查过程。评估到目前为止完成的工作,并审查质量保证问题。确定是否有重要的因素或任务被忽略了。问:

  • 我们建立的模型正确吗?

  • 所有步骤都正确执行了吗?

  • 我们是否只使用了我们被允许使用的属性?这些属性是否可用于未来的分析?

改正你发现的任何问题。

确定下一步的步骤。根据您在审查期间的发现,您必须决定流程中的下一个逻辑步骤应该是什么:继续部署、进一步检查流程或开始新项目。

7.模型部署

部署计划。制定部署策略,包括所需的步骤以及如何执行这些步骤。

计划监控和维护。制定详细的监视和维护计划,以避免在模型的操作阶段或项目后阶段出现问题。

制作最终报告。科学数据项目团队必须编写项目总结,包括其经验,其中还可能包括数据挖掘结果的最后和深入介绍。

审查项目。科学数据项目生命周期的最后一步是回顾项目并确定:

  • 什么是正确的?

  • 哪里出了问题?

  • 什么做得好?

  • 需要改进的是什么?

结论

数据科学可能是一个相对较新的研究领域,但它已迅速成为商业世界的一个重要领域。它不仅在全球范围内的每个行业都得到了应用,而且它还提供了克服许多业务问题和获得前所未有的成功的关键。

通过了解什么是数据科学、为什么它对企业很重要,以及该领域的各种应用程序和示例,您现在已经掌握了全面的知识,可以开始在自己的企业中拥抱数据科学及其好处。