2026-05-28 1.1 数据科学复习--第一章重点

  1. 数据科学第一章·纯考点必背(无年份/纯记忆人名)
    1. 一、填空必背(直接默写)
    2. 二、简答必背(极简答案,直接背)

数据科学第一章·纯考点必背(无年份/纯记忆人名)

只留必考核心概念、特征、分类、流程,直接背就能拿分

一、填空必背(直接默写)

  1. 大数据5V:大量性、多样性、高速性、真实性、价值性
  2. DIKW模型:数据→信息→知识→智慧
  3. 数据类型:结构化数据、非结构化数据
  4. 数据科学三要素:黑客技能、数学统计学知识、实质性专业知识
  5. 第四范式:数据密集型科学发现
  6. 医疗大数据4P:预测性、预防性、个体化、参与性
  7. HACE定理:异构、自治、复杂、演化
  8. 数据科学流程:提出问题→收集数据→处理数据→清洗数据→分析数据→数据可视化→做出决策→构建数据产品

二、简答必背(极简答案,直接背)

  1. 大数据的5V特征
    答:大量性、多样性、高速性、真实性、价值性。
  2. 数据科学的定义
    答:融合统计学、计算机科学、机器学习等的交叉学科,核心是从数据中提取信息、知识与规律。
  3. 数据科学三要素
    答:黑客技能、数学统计学知识、实质性专业知识。
  4. 结构化与非结构化数据的区别
    答:结构化是数字、字符、日期等规则数据;非结构化是文字、图片、音视频等无固定格式数据。
  5. 身边大数据/数据科学例子
    答:电商精准推荐、短视频算法推送、共享单车调度、外卖路径规划、健康码行程数据。
  6. 数据科学家需具备的技能
    答:通用技能:数据分析、数学统计、机器学习、沟通;技术技能:Python、R、SQL、Hadoop、Spark。

转载请注明来源,欢迎对文章中的引用来源进行考证,欢迎指出任何有错误或不够清晰的表达。可以在下面评论区评论,也可以邮件至 kipleyarch@gmail.com
Archive PDF预览 PPTX Obsidian