过各种课程了解这些领域,并进行将这些领域与数据科学相结合的练习。此外,黑客技术也未被排除在外,尽管这体现了积极的意义,因为它是数据科学的一门贡献学科,然而,它并没有被作为一门课程来教授。一位训练有素的数据科学家应该精通所有相关学科,学习每个学科,并将它们结合起来解决问题。
如今,数据科学被认为是云计算/大数据领域和复杂性科学的产物,这意味着它是一门高级学科,需要具备并行处理、PB 级 NoSQL 数 决策者电子邮件列表 据库、Map-Reduce 计算、高级统计学、复杂性科学和机器学习方面的扎实知识。因此,数据科学在硕士和博士阶段也可以得到很好的学习。然而,人们认为数据科学更关乎思维方式,就像它涵盖了工具的熟练使用一样。因此,学生们在职业生涯的早期阶段就参与其中,是为了让他们对数据科学有更全面的思考。
多种学科的结合
数据科学导论涵盖了构成数据科 在过去的十年中,欧洲搜索奖表彰了搜索 学的八个学科,它们构成了数据科学家在解决问题时需要思考的问题。数据科学家通常精通其中一两个学科,并精通其他五六个学科。这就要求数据科学的实践需要团队合作,团队成员应具备跨学科的专业知识。
下面讨论了数据科学入门时的各个学科:
1.) 数据工程
数据工程涵盖数据的获取、提 邮寄线索取、转换、存储和检索。它还包括向数据添加元数据。由于所有这些活动相互关联,数据工程师应该将这些问题作为一个整体来处理。例如,我们需要知道如何存储和检索数据,从而营造良好的数据提取氛围。为了制定合理的数据获取和管理计划,我们需要充分理解待解决的数据科学问题的本质。制定好计划后,数据工程师就可以将其应用于数据管理系统。