非CS背景入门机器学习

把机器学习作为一种工具,而不是去搭建机器学习本身需要的代码。Matlab, Python skilearn直接调用相关机器学习的模型即可。

我认为用于解决业务问题的机器学习(甚至深度学习,加强学习)应用的核心问题

商业认知:

  1. 识别业务问题,写出从输入的数据到推出结果的逻辑轨迹(即特征如何得到结果?)
  2. 把实际的具体问题抽象为数学问题(即找到目标函数是什么?)

技术操作:

  1. 完成目标函数需要什么模型?
  2. 现有数据是什么样的,如何挖掘特征值(如是否需要PCA?)
  3. 机器学习模型调用
  4. 模型评价
  5. 调优,再回到4直到满意

机器学习核心还是回归与分类,核心思想是概率统计,核心解决方案是矩阵算法。

  • “多数据优于好模型
  • 好数据优于多数据
  • 二八原则”