过滤爬虫爬取下来的关键字

v1,来不及了,先上车

content = ['哈士奇', '二哈', '哈士奇图片','哈士奇图片', '哈士奇美丽价格', '哈士奇是个大傻逼', '猫咪图片', '猫咪价格', '波斯猫', '折耳猫', '折耳猫动漫', '狗狗漫展', '狗狗色情']
print(content)
filter_word = ['色情', '漫展', '图片', '傻逼']

# 找出content违规词
weigui_word=[]
for i in content:
    for j in filter_word:
        if j in i:
            # print(i)
            weigui_word.append(i)
# 净化conent
for i in weigui_word:
    content.remove(i)
print(content)

v2: 改进循环

content = ['哈士奇', '二哈', '哈士奇图片', '哈士奇图片', '哈士奇美丽价格', '哈士奇是个大傻逼', '猫咪图片', '猫咪价格', '波斯猫', '折耳猫', '折耳猫动漫', '狗狗漫展', '狗狗色情']
print(content)
filter_word = ['色情', '漫展', '图片', '傻逼']

# 合规填充天空到这个列表
hegui_word = []

for i in content:
    # 如果 关键字不在 content某项,则计数
    count = 0
    for j in filter_word:
        if j not in i:
            count += 1
    if count == len(filter_word):
        hegui_word.append(i)

print(hegui_word)

v3: 简化代码,for else

for else:   顺利循环完说明not in 才执行else,  一旦in 即break,不执行else

keywords = ['哈士奇', '二哈', '哈士奇图片', '哈士奇图片', '哈士奇美丽价格', '哈士奇是个大傻逼', '猫咪图片', '猫咪价格', '波斯猫', '折耳猫', '折耳猫动漫', '狗狗漫展', '狗狗色情']
bad_keys = ['色情', '漫展', '图片', '傻逼']

res=[]
for key in keywords:
    for bkey in bad_keys:
        if bkey in key:
            break
    else:
        res.append(key)
print(res)

最新文章

  1. CSS3 Border-image
  2. JDBC增删改查和查唯一的完整代码
  3. mac搭建mamp环境
  4. JavaScript常见问题整合
  5. PeCheck
  6. python问题:IndentationError:expected an indented block错误解决
  7. JAVA判断当前时间是上午am还是下午pm
  8. centos6 下安装xfce+vnc
  9. 升级时出现:请先升级 UCenter 到 1.6.0 以上版本。
  10. unity中数据的持久化存储
  11. hihoCoder 1388 Periodic Signal(FFT)
  12. linux网络编程之网络函数详解
  13. Python 参数传递
  14. Logstash利用GeoIP库显示地图以及通过useragent显示浏览器(四)
  15. LinuxIP地址、网卡相关、克隆、VM
  16. Nodejs package.json文件介绍
  17. KVM虚拟化环境准备
  18. Flask 构建微电影视频网站(八)
  19. ASP.NET没有魔法——ASP.NET MVC IoC代码篇
  20. 解读Scrapy框架

热门文章

  1. 利用NtQuerySystemInformation函数遍历进程,遍历线程,获取线程挂起或运行状态
  2. 用图形数据库Neo4j 设计权限模块
  3. 解决VMware安装Ubuntu的过程中窗口过小无法看到按钮的问题
  4. C++的函数重载和main函数之外的工作
  5. Egret中的三种单例写法
  6. DXP 内电层分割
  7. TX失败策略2
  8. Windows Mysql binlog 数据恢复
  9. 万事开头难 && 实践出真知
  10. [CentOS_7.4]Linux安装与网络配置