- 数据挖掘模型:CRISP-DM模型
- 业务理解
- 确定业务目标
- 项目可行性分析
- 确定数据挖掘目标
- 初步项目计划
- 数据理解
- 收集原始数据
- 描述数据
- 表格基本信息
- 记录数,行列信息
- 缺失值个数
- 不一致,重复,异常,相应处理
- 描述统计信息
- 离散:个数,分布(如取值:百分比,直方图),方差,众数,中位数,平均值...
- 连续:
- 数据质量信息
- 表格基本信息
- 探索数据
- 检查数据质量
- 数据准备
- 数据选择
- 数据清洁
- 去除噪声
- 估计缺失值
- 数据创建
- 数据合并
- 数据格式化
- 建立模型
- 选择建模技术
- 测试方案设计
- 模型训练
- 模型测试评估
- 模型评估
- 结果评估
- 商业
- 过程回顾
- 确定下一步工作
- 结果评估
- 部署
- 部署计划
- 最终报告
- 业务理解
- 用户画像