data_mining_class_1

  1. 数据挖掘模型:CRISP-DM模型
    • 业务理解
      • 确定业务目标
      • 项目可行性分析
      • 确定数据挖掘目标
      • 初步项目计划
    • 数据理解
      • 收集原始数据
      • 描述数据
        • 表格基本信息
          • 记录数,行列信息
          • 缺失值个数
          • 不一致,重复,异常,相应处理
        • 描述统计信息
          • 离散:个数,分布(如取值:百分比,直方图),方差,众数,中位数,平均值...
          • 连续:
        • 数据质量信息
      • 探索数据
      • 检查数据质量
    • 数据准备
      • 数据选择
      • 数据清洁
        • 去除噪声
        • 估计缺失值
      • 数据创建
      • 数据合并
      • 数据格式化
    • 建立模型
      • 选择建模技术
      • 测试方案设计
      • 模型训练
      • 模型测试评估
    • 模型评估
      • 结果评估
        • 商业
      • 过程回顾
      • 确定下一步工作
    • 部署
      • 部署计划
      • 最终报告
  2. 用户画像