search_k serach_k越大,越准确,但是要在时间和准确率之间取个trade off During the query it will inspect up to search_k nodes which defaults to n_trees * n build on memory or disk build on disk disk上build的时候,树的node个数是所有样本个数的大约2倍,(作者说无法获得多少颗树,困== build on memory 指定颗的树数(5) 差别
DBSCAN(Density-Based Spatial Clustering of Applications with Noise,具有噪声的基于密度的聚类方法)是一种很典型的密度聚类算法,和K-Means,BIRCH这些一般只适用于凸样本集的聚类相比,DBSCAN既可以适用于凸样本集,也可以适用于非凸样本集.下面我们就对DBSCAN算法的原理做一个总结. 1. 密度聚类原理 DBSCAN是一种基于密度的聚类算法,这类密度聚类算法一般假定类别可以通过样本分布的紧密程度决定.同一类别的样本,他们