Pullword 分词工具
2024-10-12 02:12:00
def get_response(self, txt):
""" 热词工具 """
datas = []
request_lists = []
# 筛选文本
with open(txt,'r', encoding='utf8') as f:
for line in f:
data_one = line.strip()
if data_one:
datas.append(data_one)
url = 'http://www.pullword.com/process.php'
headers = {
"Connection": "keep-alive",
"User-Agent": "Mozilla/5.0 (Windows NT 6.1; Win64; x64; rv:64.0) Gecko/20100101 Firefox/64.0"
}
for data in datas:
FromData = {
'source': data,
'param1': 1,
'param2': 0
}
try:
response = requests.post(url, headers=headers, data=FromData)
except:
print("热词 {} 请求有误...".format(data))
else:
content = response.text
content = (content.split('SAMEORIGIN')[1]).strip() # 去除空格
contents = content.split('\r\n') # 获取单词list
request_lists.extend(contents) # 将其合并
return request_lists # 返回list
最新文章
- 分布式学习系列【dubbo入门实践】
- flask-uploads扩展的使用笔记
- SURF算法与源码分析、上
- linux jdk+mysql+tomcat+nginx 项目部署步骤
- Ubuntu14.04LTS安装记录(办公室联想台式机)
- Hbase 0.98集群搭建的详细步骤
- jar包中的类如何读取包内和包外的配置文件
- Codeforces 4A-Watermelon(意甲冠军)
- (转)迎接 Entity Framework 7
- NET中解决KafKa多线程发送多主题的问题
- YAML - 简介
- Git入门—创建项目
- lock 单例模式
- ERC20数字货币ProxyOverflow存在漏洞
- Bootstrap 3的box-sizing样式导致UMeditor控件的图片无法正常缩放
- Vue延迟点击
- DAX2012 R3安装
- (转)Oracle 使用 DBLINK详解
- 一、vue:如何新建一个vue项目
- 菜鸟运维笔记:小记编译安装Nginx所遇到的坑