一、摘要

随着社交媒体的快速发展,假新闻已经成为一个重大的社会问题,它无法通过人工调查及时解决。这激发了大量关于自动假新闻检测的研究。

大多数研究探索了基于新闻记录中不同模态信息(如文本、图像和传播网络)的有监督模型来识别假新闻。然而,如果新闻记录来自不同的领域(如政治、娱乐),特别是在训练时未见过的或很少见过的领域,这些方法的效果通常会下降。

本文经过探索性数据分析发现,来自不同领域的新闻记录具有显著不同的单词使用模式和传播模式。此外,由于未加标签的新闻记录数量庞大,选择新闻记录进行人工加标签,从而使加标签数据集的域覆盖最大化具有挑战性。因此,本工作:

  • 提出了一种新的框架,在新闻记录中联合保存特定领域和跨领域的知识,以检测来自不同领域的假新闻;
  • 设计了一种选择一组未标记的Informative新闻记录进行人工标签的无监督方法,其结果可用于训练一个假新闻检测模型,训练好的模型在许多领域表现良好,同时最小化标签成本。

实验表明,所提出的假新闻模型和选择性标注方法在跨领域新闻数据集上取得了最先进的性能,同时对新闻数据集中很少出现的领域有了显著的改进。

二、内容

**本文的创新是在跨领域假新闻检测问题上,从文本和传播网络的多模态数据中联合提取领域不变和领域特定的,来缓解跨领域检测问题。同时,在假设标注预算有限的情况下,设计了一种基于网络社区的无监督领域划分和有用标注样本选取方法

下图为论文PPT总结。

最新文章

  1. MFC2016.6.8
  2. 谁占了我的端口 for Windows
  3. sharepoint 修改AD密码
  4. ocanvas 画板
  5. [dpdk] 读官方文档(3)
  6. c# List<int> 转 string 以及 string [] 转 List<int>
  7. JAVADOC时候乱码-编码 GBK 的不可映射字符
  8. asp.net web api内部培训资料
  9. .net转php laraval框架学习系列(四) 项目实战---View
  10. php 原理相关
  11. jQuery插件之-瀑布流插件
  12. java.lnag.Throwable详细解读
  13. rabbitMQ之AMQP协议
  14. js-将文本复制到剪切板
  15. pythonのsimple_tag
  16. CSS3奇特的渐变示例
  17. vim 学习笔记系列(前言)
  18. Spring整合ActiveMQ及多个Queue消息监听的配置
  19. vue学习笔记——组件的优化
  20. 如何在Angular优雅编写HTTP请求

热门文章

  1. JavaScript中的代码执行顺序
  2. 25.自定义mixin和基类
  3. Netty学习记录-入门篇
  4. Windows7下驱动开发与调试体系构建——0.概述
  5. 微信小程序——悬浮按钮
  6. Go实现常用软件设计模式三:生成器模式
  7. Java-ArrayList常用方法
  8. 【云原生 · Kubernetes】部署kube-apiserver集群
  9. Destination folder must be accessible
  10. springboot接收前端传参的几种方式