随机森林属于集成学习(ensemble learning)中的bagging算法,在集成算法中主要分为bagging算法与boosting算法, Bagging算法(套袋发) bagging的算法过程如下: 从原始样本集中使用Bootstraping 方法随机抽取n个训练样本,共进行k轮抽取,得到k个训练集(k个训练集之间相互独立,元素可以有重复). 对于n个训练集,我们训练k个模型,(这个模型可根据具体的情况而定,可以是决策树,knn等) 对于分类问题:由投票表决产生的分类结果:对于回归问题,