非CS专业背景入门机器学习
非CS背景入门机器学习
把机器学习作为一种工具,而不是去搭建机器学习本身需要的代码。Matlab, Python skilearn直接调用相关机器学习的模型即可。
我认为用于解决业务问题的机器学习(甚至深度学习,加强学习)应用的核心问题
商业认知:
- 识别业务问题,写出从输入的数据到推出结果的逻辑轨迹(即特征如何得到结果?)
- 把实际的具体问题抽象为数学问题(即找到目标函数是什么?)
技术操作:
- 完成目标函数需要什么模型?
- 现有数据是什么样的,如何挖掘特征值(如是否需要PCA?)
- 机器学习模型调用
- 模型评价
- 调优,再回到4直到满意
机器学习核心还是回归与分类,核心思想是概率统计,核心解决方案是矩阵算法。
- “多数据优于好模型
- 好数据优于多数据
- 二八原则”