敏捷数据科学 - 数据科学过程

在本章中,我们将了解理解过程所需的数据科学过程和术语.

"数据科学是数据接口,算法开发和技术的结合,以便解决分析复杂问题".

数据科学过程

数据科学是一个跨学科的领域,包括科学方法,过程和系统,其中包括与传统研究相关的机器学习,数学和统计知识.它还包括黑客技能和实质性专业知识的组合.数据科学从数学,统计学,信息科学和计算机科学,数据挖掘和预测分析中汲取原则.

下面提到了构成数据科学团队一部分的不同角色;/p>

客户

客户是使用该产品的人.他们的兴趣决定了项目的成功与否,他们的反馈在数据科学中非常有价值.

业务发展

这个数据科学团队在早期客户中签约,无论是第一手还是通过创建登陆页面和促销活动.业务开发团队提供产品价值.

产品经理

产品经理重视创造最佳产品,这在市场上很有价值.

交互设计师

他们专注于数据模型周围的设计交互,以便用户找到合适的价值.

数据科学家

数据科学家以新的方式探索和转换数据,以创建和发布新功能.这些科学家还结合来自不同来源的数据来创造新的价值.他们在与研究人员,工程师和网络开发人员一起创建可视化方面发挥着重要作用.

研究人员

正如名称所示,研究人员参与研究活动.它们解决了数据科学家无法做到的复杂问题.这些问题涉及机器学习和统计模块的强烈关注和时间.

适应变化

数据科学的所有团队成员都需要适应根据要求进行新的变革和工作.应采用敏捷方法和数据科学进行一些修改,如下所示&减;

  • 选择专家的通才.

  • 小团队对大型团队的偏好.

  • 使用高级工具和平台.

  • 连续和迭代地共享中间工作.

注意

在敏捷数据科学团队中,一个由通才组成的小团队使用可扩展的
的高级工具,并通过迭代细化数据进入越来越高的价值状态.

考虑以下与数据科学团队成员工作相关的例子 :

  • 设计师提供CSS.

  • Web开发人员构建整个应用程序,了解用户体验和界面设计.

  • 数据科学家应该研究和研究构建Web服务,包括Web应用程序.

  • 研究人员在代码库中工作,该代码库显示解释中间结果的结果.

  • 产品经理尝试识别并理解所有相关领域的缺陷.