集成学习基础知识总结-Bagging-Boosting

在概率近似正确(（probably approximately correct)学习框架下。一个概念是强可学习的充分必要条件是这个概念是弱可学习(仅比随机猜测稍好)。

个体学习器要好而不同。好-要不随机猜测强，不同--多样性。

通过bootstrap采样形成N个数据集(样本扰动来保证多样性)，每个数据集训练一个模型，最终预测结果由投票法决定。

特点：

随机森林的特点：

stacking:带权重的bagging

先从初始训练集训练出一个基学习器，再根据基学习器的表现对训练样本分布进行调整，使得先前基学习器做错的训练样本在后续受到更多关注，然后基于调整后的样本分布来训练下一个基学习器如此重复进行，直至基学习器数目达到事先指定的值T ，最终将这T 个基学习器进行加权结合.

特点：

提高那些被前一轮弱分类器错误分类样本的权值，降低那些被正确分类样本的权值(训练样本分布调整方式)。
加权多数表决，加大分类误差率小的弱分类器的权值，使其在表决中起较大的作用，减小分类误差率大的弱分类器的权值，使其在表决中起较小的作用。(加权结合方式).

特点：

巴特西