- 线性回归:2005年,上海某银行,分析信贷风险,模型准确率达到80%。
- 决策树:2012年,北京某电商,用于推荐商品,用户点击率提升20%。
- 随机森林:2017年,深圳某科技公司,预测用户行为,预测准确率95%。
回归模型分析常见的就是线性回归、逻辑回归和决策树回归。其实很简单,这三者各有所长,用在不同的场景。
先说最重要的,线性回归是最基础的,它适用于连续值的预测,比如“去年的销售额”。去年我们跑的那个项目,用了线性回归,预测的结果大概3000量级,效果还不错。
另外一点,逻辑回归则更偏向于分类问题,比如预测一个用户是否会购买某商品。我一开始也以为逻辑回归只能做二分类,后来发现不对,它可以处理多分类问题,这个点很多人没注意。
还有个细节挺关键的,决策树回归适用于非线性的数据分布,它不像线性回归那样需要数据线性可分。等等,还有个事,决策树可以自动进行特征选择,这在很多项目中是个大优势。
说实话挺坑的一个点是,选择模型时不能只看理论,还要考虑数据的特点和实际需求。我觉得值得试试的是,先根据业务需求选择基础模型,再结合实际数据进行调整。
- 决策树模型:某电商公司在2021年针对用户行为分析,决策树模型准确率高达90%。
- 支持向量机:2019年金融风控领域,支持向量机模型降低了20%的欺诈交易率。
- 神经网络:2020年图像识别比赛中,深度神经网络模型识别准确率达到99.5%。
线性回归、逻辑回归、支持向量机。