ACL(The Association for ComputationalLinguistics)是自然语言处理与计算语言学领域最具影响力、最具活力的级别学术会议,由计算语言学协会主办,每年一届。
ACL 2017 公布了录用的论文,其中包含生物医学、认知建模与心理语言学、交互式对话系统、机器翻译等各研究领域的 194 篇长篇论文、107篇短篇论文、21 个软件演示以及 21 篇在由 TACL (Transactions of the Association for Computational Linguistics)接收出版并将在 ACL 2017 上进行主题演讲报告的论文。
本文阅读的论文是:
Automatically Labeled Data Generation for Large Scale Event Extraction
- 作者:Yubo Chen, Kang Liu and Jun Zhao
- 幻灯片地址:http://t.cn/RXm3vz0
- 论文地址:https://www.aclweb.org/anthology/P17-1038
这篇文章关注对event extraction提供标注数据的方法。传统的hand-labeled的训练数据非常昂贵,并且event覆盖的非常有限。这使得一些supervised的方法很难去抽取大规模的event来进行KBP(knowledge base population)。为了解决数据标注的问题,作者提出了一个利用world knowledge和linguistic knowledge来自动标注event extraction所需要的数据的方法。这个方法能够探测到每一个event type的key argument和trigger word,然后用它们来从文本中标注event。实验结果显示大规模自动标注的数据与精心设计的人工标注的数据效果相当。所提出的自动标注的数据能够与人工标注的数据结合用来提高利用这些数据训练的模型的性能。