数据科学第一章·纯考点必背(无年份/纯记忆人名)
只留必考核心概念、特征、分类、流程,直接背就能拿分
一、填空必背(直接默写)
- 大数据5V:大量性、多样性、高速性、真实性、价值性
- DIKW模型:数据→信息→知识→智慧
- 数据类型:结构化数据、非结构化数据
- 数据科学三要素:黑客技能、数学统计学知识、实质性专业知识
- 第四范式:数据密集型科学发现
- 医疗大数据4P:预测性、预防性、个体化、参与性
- HACE定理:异构、自治、复杂、演化
- 数据科学流程:提出问题→收集数据→处理数据→清洗数据→分析数据→数据可视化→做出决策→构建数据产品
二、简答必背(极简答案,直接背)
- 大数据的5V特征
答:大量性、多样性、高速性、真实性、价值性。 - 数据科学的定义
答:融合统计学、计算机科学、机器学习等的交叉学科,核心是从数据中提取信息、知识与规律。 - 数据科学三要素
答:黑客技能、数学统计学知识、实质性专业知识。 - 结构化与非结构化数据的区别
答:结构化是数字、字符、日期等规则数据;非结构化是文字、图片、音视频等无固定格式数据。 - 身边大数据/数据科学例子
答:电商精准推荐、短视频算法推送、共享单车调度、外卖路径规划、健康码行程数据。 - 数据科学家需具备的技能
答:通用技能:数据分析、数学统计、机器学习、沟通;技术技能:Python、R、SQL、Hadoop、Spark。
转载请注明来源,欢迎对文章中的引用来源进行考证,欢迎指出任何有错误或不够清晰的表达。可以在下面评论区评论,也可以邮件至 kipleyarch@gmail.com