何谓机器学习
机器学习
简单的来说,机器学习就是把无序的数据转换为有用的信息。
机器学习的组要任务及相关算法
监督学习的用途 | |
---|---|
k-近邻算法 | 线性回归 |
朴素贝叶斯和算法 | 局部加权线性回归 |
支持向量机 | Ridge 回归 |
决策树 | Lasso 最小回归系数估计 |
无监督学习的用途 | |
---|---|
K-均值 | 最大期望算法 |
DBSCAN | Parzen 窗设计 |
开发机器学习应用程序的步骤
- 收集数据。可以使用公开可用的数据源。
- 准备输入数据。确保数据符合算法要求。
- 分析输入数据。人工分析前两步得到的数据,检查数据是否有效、是否存在异常值,通过图形化展示数据。
- 训练算法。将前两步得到的格式化数据输入到算法,从中抽取数据和知识;将得到的知识存储为计算机可以处理的格式,方便后续步骤使用。
如果使用无监督学习算法,由于不存在目标变量值,故而也不需要训练算法,所有与算法相关的内容都集中在第5步。
- 测试算法。这一步将实际使用第4步得到的知识信息。为了评估算法,必须测试算法工作的效果。
对于监督学习,必须已知用于评估算法的目标变量值;
对于无监督学习,与必须用其他评测手段来检验算法的成功率。 - 使用算法。将机器学习算法转换为应用程序,执行实际任务,以检测上述步骤是否可以在实际环境中正常工作。