发布时间:2023-11-03
近日,实验室的论文“Improving Few-shot Relation Extraction Through Semantics-guided Learning”在国际学术期刊 Neural Networks 上发表(https://doi.org/10.1016/j.neunet.2023.10.053)。本文由我实验室2019级博士生武惠,2020级硕士生何育婷,陈毅东副教授和史晓东教授(通讯作者)等共同完成。
该论文针对少样本关系抽取任务中存在的离散样本预测错误和相似类别样本预测混淆等现象,提出了一种语义引导式表征学习方法(Semantics-Guided Learning, SemGL),充分利用关系信息来提高少样本关系抽取的性能。首先,该方法利用提示编码器对实例样本和关系信息进行编码,通过语言模型的提示增强获得更精确的语义表示,如实例表示、实例原型和概念原型。然后,引入一种关系图学习技术,利用概念原型将同类实例聚类在一起,强调具体实例的关系特征。同时,利用基于实例原型和实例之间的对比学习来区分类内实例和类间实例,以促进类内实例之间的共享特征。此外,利用概念原型和实例原型之间的对比学习将概念原型的关系特征和实例原型的共享特征拉近。最后,整合概念原型和实例原型构建新关系原型进行预测。在四种不同N-way-K-shot设置下的实验表明,该方法在数据集Fewrel 1.0和Fewrel 2.0都取得了显著的性能提升,特别是在领域适配少样本关系抽取任务中效果更加显著。