第一章引言

第一章引言

1.1 学习问题的标准描述

1.2 设计学习系统

1.2.1 选择训练经验

  1. 选择训练经验的类型
    • 关键属性:训练经验能否为系统的决策提供直接或间接的反馈
      • 直接
      • 间接
        • 例如:通过过去对弈序列和最终结局推测走法
        • 信用分配问题(credit assignment)
  2. 学习器可以在多大程度上控制训练样例序列
    1. 训练经验以超乎学习器控制的随机过程提供
      • 实验还未考虑过的全新棋局
    2. 学习器可以向施教者提出不同类型的查询
      • 自己提出特别困惑的棋局
      • 依赖施教者选取
    3. 学习其通过自动探索环境来搜集训练样例
      • 在目前发现的最有效的路线上采用微小变化
  3. 训练样例的分布能多好的表示实力分布
    • 学习样例通常与最终系统被评估时的样例有一定差异,学习器必须能够从中进行学习

1.2.2 选择目标函数

1.2.3 选择目标函数的表示

1.2.4 选择函数逼近算法

最小均方法(least mean squares) LMS训练法则

  1. 对每个使用当前的权计算
  2. 对每个权值wi,做如下更新
    • 使得只有在训练样例的棋局中确实出现的特征的权值才能被更新

1.2.5 最终设计

    • 执行系统(Performance System) 用学会的目标函数来解决指定任务
    • 鉴定器(Critic) 使用对弈路线作为记录,产生训练样例的序偶
    • 泛化器(Generalizer) 以训练样例为输入,产生输出假设如,作为对目标函数的估计
    • 实验生成器(Experiment Generator) 以当前假设为输入,输出新的问题供执行系统探索.
    • 最近邻算法
    • 相互比赛,遗传算法

    1.3 机器学习的一些观点和问题

    1. 机器学习经常归结于搜索问题,即对非常大的假设空间进行搜索,以确定最佳拟合观察到的数据和学习器已有知识的假设
    2. 迭代调整权值的方法对于连续的参数化的潜在假设空间很有效

    机器学习的一些问题

    1. 存在什么样的算法能从特定的训练数据中学习一般的目标函数呢?如果提供了充足的训练数据,什么养的条件下会使特定的算法收敛到期望的函数?哪个算法对哪些问题和表示的性能最好.
    2. 多少训练数据是充足的?怎样找到学习到的假设的置信度与训练数据数量及提供给学习器的假设空间特性之间的一般关系?
    3. 学习器拥有的先验知识是怎样引导样例进行泛化的过程的?当先验知识仅仅是近似正确时,它们会有帮助吗?
    4. 关于选择有效的后续训练经验,什么样的策略最好?这个策略的选择会如何影响学习问题的复杂性?
    5. 怎样把学习任务简化为一个或多个函数逼近问题?换一种方式,系统该试图学习哪些函数?这个过程本身能够自动化吗?
    6. 学习器怎样自动地改变表示法来提高表示和学习目标函数的能力?

    1.5 小结

    1. 应用领域
    2. 数据挖掘
    3. 困难领域
    4. 计算机动态适应变化
    5. 一个完整定义的学习问题 T 任务 P评估标准 E训练经验
    6. 设计过程包含很多选择,如选择经验类型,学习的目标函数,目标函数的表示形式,从训练样例中学习目标函数的算法