Loading...

热门

斯坦福｜基于因果引导解缠的跨平台仇恨言论检测

大模型2年前 (2023)发布智源社区

670 0 0

Causality Guided Disentanglement for Cross-Platform Hate Speech Detection

Paras Sheth, Tharindu Kumarage, Raha Moraffah, Aman Chadha, Huan Liu
[Arizona State University & Stanford University]

基于因果引导解缠的跨平台仇恨言论检测

动机：社交媒体平台在推动公开讨论的同时，也经常被用来传播有害内容。当前用于检测这些有害内容的深度学习和自然语言处理模型过于依赖特定领域的术语，影响了它们适应通用的仇恨言论检测的能力。此外，当平台缺乏高质量的标注数据进行训练时，也会出现重大挑战。因此，本文提出一种跨平台的仇恨言论检测模型，该模型能在一个平台的数据上进行训练，并泛化到多个未见过的平台。
方法：为了在各个平台上实现良好的泛化性，提出一种方法，即将输入表示解缠为不变的和平台依赖的特征。本文还提出，学习因果关系(在各种环境中保持不变)可以显著帮助理解仇恨言论中的不变表示。通过将输入解缠为平台依赖的特征(用于预测仇恨目标)和平台独立的特征(用于预测仇恨的存在)，学习了对分布迁移具有抵抗性的不变表示。然后，这些特征被用来预测未见过的平台上的仇恨言论。
优势：通过在四个平台上进行的广泛实验，证明了所提出模型在检测通用仇恨言论方面比现有的最先进方法更有效。

提出了一种新的跨平台仇恨言论检测模型，通过学习因果关系和解缠输入表示，实现了对仇恨言论的有效检测和泛化。

https://arxiv.org/abs/2308.02080

斯坦福｜基于因果引导解缠的跨平台仇恨言论检测

# 大模型 # 智源社区 # 大模型

© 版权声明

文章版权归作者所有，未经允许请勿转载。

相关文章

思想复制：通过模仿人类思维学习在行动中思考

智源社区

678

《西游记》把大模型给难倒了

智源社区

714

哥伦比亚大学｜使用 Transformers 预测大脑活动

智源社区

597

Ocean-1：世界上第一个联络中心基金会模型

智源社区

535

评估ChatGPT的信息提取能力：性能、可解释性、校准和忠实度的评估

智源社区

985

LLM 系列 | 05：ChatGPT Prompt的迭代优化

智源社区

747

暂无评论

暂无评论...

这是一个专注于人工智能产品的导航站。

关于我们友情链接

Copyright © 2025 Ai导航鄂ICP备2023001728号