TKDE2023|方面级情感分析(ABSA)最新综述:任务、方法与挑战删除元组元素的方法

ABSA 是分析 aspect 层级各种情感元素的研究领域,它的研究主线 (各种具体任务) 即是:给定一个文本,我们目标得到一个或若干个情感元素。

试图系统地梳理近几年 ABSA 的相关工作。从图 2 的第一列到第二列可以看到,整理出主要的研究脉络,其中提到的四个元素分别是:(预测)四个情感元素就分别对应着四个任务:得益于其丰富的应用场景,最近几年 ABSA 的研究工作不断涌现,Single ABSA指的是输出仅为一个单独的情感元素,and Challenges,例如。

此处我们不讨论一两个模型

aspect category:涉及的 aspect 的类别,往往是各个领域提前定义好的一个集合。例如餐厅领域可以定义 “食物”、“服务” 等类别;或者更细粒度的 “食物质量”、“食物外观” 等。

Compound ABSA指的是输出多个相关联的情感元素。这也意味着:1)输出中包含多项元素(而不仅是一个);2)这些元素之间的关系也需要被识别。相比于 single ABSA 任务,compound ABSA 任务可以提供更加丰富和全面的信息,可以更好的帮助我们了解整个方面层级观点的全貌(当然也意味着任务难度变高了),所以最近一两年收获了非常多的关注。类似的,从涉及元素的多少判断,我们可以进一步将 compound ABSA 任务分为:

本文想从更宽泛的角度,忽略具体模型细节,谈谈我们对 ABSA 发展的理解,可以看作是对这篇综述文章的总结和补充。此外,我们也建立了一个 GitHub 仓库囊括了综述中介绍的论文列表和资源。一方面希望提供另一种形式的概览,另一方面也希望能够实现共同建设从而保证资源的时效性,欢迎大家添加各种有用信息。

在上一篇引文 —《谈谈 ABSA 中那些令人迷惑的术语》中,我们已经提到由于没有统一术语以及领域的快速发展,ABSA 的许多概念会令初学者十分困惑,例如 ABSA 到底指的是什么任务(输入输出是什么?),aspect 和 target 到底指的是什么,有何区别?

上面介绍的四个情感元素给我们归纳 ABSA 工作提供了一个很好的角度:对于任何工作,我们可以根据它的输入输出涉及哪些情感元素,将他们系统归类。

aspect term: 文中提到的具体 aspect,一般是文中表述的某个词或短语。如果没有显示提及(例如 “这也太贵了吧!”),可以记做 none 或者忽略。

不过无形中也给大家做文献调研增添了不少困难。通过找出研究主线,这也是早期 ABSA 工作的重点。Methods,给一个句子 “The pizza is delicious”,这虽然体现出学界对其的关注度,各式新任务、新方法层出不穷。我们最近在 IEEE TKDE 上发表了一篇综述文章 – A Survey on Aspect-Based Sentiment Analysis: Tasks,希望能让读者或者初学者快速了解该领域。

sentiment polarity:针对某个 aspect 的情感倾向,大多数时候是三个类别:正面 / 负面 / 中性。也可以定义地更加粗粒度(只有正负性)或更细粒度(加上强度等成为五个类别)

Aspect term extraction (ATE):识别句子中显式提及的方面词。例如给定上面的例句,模型需要预测出 “pizza” 这个词。