nlp算法
2024-08-26 19:37:20
人工智能算法大体上来说可以分类两类:基于统计的机器学习算法(Machine Learning)和深度学习算法(Deep Learning)
总的来说,在sklearn中机器学习算法大概的分类如下:
1. 纯算法类
(1).回归算法
(2).分类算法
(3).聚类算法
(4)降维算法
(5)概率图模型算法
(6)文本挖掘算法
(7)优化算法
(8)深度学习算法
2.建模方面
(1).模型优化
(2).数据预处理
二、详细算法
1.分类算法
(1).LR (Logistic Regression,逻辑回归又叫逻辑分类)
(2).SVM (Support Vector Machine,支持向量机)
(3).NB (Naive Bayes,朴素贝叶斯)
(4).DT (Decision Tree,决策树)
- 1).C4.5
- 2).ID3
- 3).CART
(5).集成算法
- 1).Bagging
- 2).Random Forest (随机森林)
- 3).GB(梯度提升,Gradient boosting)
- 4).GBDT (Gradient Boosting Decision Tree)
- 5).AdaBoost
- 6).Xgboost
(6).最大熵模型
2.回归算法
(1).LR (Linear Regression,线性回归)
(2).SVR (支持向量机回归)
(3). RR (Ridge Regression,岭回归)
3.聚类算法
(1).Knn
(2).Kmeans 算法
(3).层次聚类
(4).密度聚类
4.降维算法
(1).SGD (随机梯度下降)
5.概率图模型算法
(1).贝叶斯网络
(2).HMM
(3).CRF (条件随机场)
6.文本挖掘算法
(1).模型
- 1).LDA (主题生成模型,Latent Dirichlet Allocation)
- 2).最大熵模型
(2).关键词提取
- 1).tf-idf
- 2).bm25
- 3).textrank
- 4).pagerank
- 5).左右熵 :左右熵高的作为关键词
- 6).互信息:
(3).词法分析
- 1).分词
– ①HMM (因马尔科夫)
– ②CRF (条件随机场) - 2).词性标注
- 3).命名实体识别
(4).句法分析
- 1).句法结构分析
- 2).依存句法分析
(5).文本向量化
- 1).tf-idf
- 2).word2vec
- 3).doc2vec
- 4).cw2vec
(6).距离计算
- 1).欧氏距离
- 2).相似度计算
7.优化算法
(1).正则化
- 1).L1正则化
- 2).L2正则化
8.深度学习算法
(1).BP
(2).CNN
(3).DNN
(3).RNN
(4).LSTM
三、建模方面
1.模型优化·
- (1).特征选择
- (2).梯度下降
- (3).交叉验证
- (4).参数调优
- (5).模型评估:准确率、召回率、F1、AUC、ROC、损失函数
2.数据预处理
- (1).标准化
- (2).异常值处理
- (3).二值化
- (4).缺失值填充: 支持均值、中位数、特定值补差、多重插补
最新文章
- Two Sum Leetcode Java
- 【Python】 Subprocess module
- PowerMock使用遇到的问题——2
- linux上tomcat安装
- Bug疑难杂症 - java.lang.NoSuchFieldError: udhLen
- Servlet线程安全
- JQuery的Select操作集合
- mysql中国的内容php网页乱码问题
- Centos小白学习
- 201621123031 《Java程序设计》第10周学习总结
- 宝宝巴士-自动化团队-纵世科技-Wiger-原创分享-QQ:18630195
- vue+uwsgi+nginx部署路飞学城
- Java自动内存管理机制学习(一):Java内存区域与内存溢出异常
- hibernate配置二级缓存
- webdriver +浏览器驱动
- luogu P1344 [USACO4.4]追查坏牛奶Pollutant Control
- Gym - 101628F Find the Inn dijkstra,读边时计算新权值
- yii2框架-yii2局部关闭(开启)csrf的验证
- 在执行一行代码之前CLR做的68件事[The 68 things the CLR does before executing a single line of your code]
- sql server 测试delete后数据空间情况
热门文章
- AspNetCore3.0 和 JWT
- avalon在公共页面里面写的功能,怎么让某些页面不引用到这个方法和html?
- web 安全登录算法
- 覆盖elementui样式
- Type-C转接头 还是别用了,影响速率啊
- Windows上安装nodejs版本管理器nvm 安装成功之后重启终端失效
- [转][osg]探索未知种族之osg类生物【目录】
- shell编程系列8--文本处理三剑客之grep和egrep
- python学习:python打包成exe
- js Date.parse()时区问题