Unified Linguistic Annotation Text Collection数据集介绍,官网编号LDC2009T07

Unified Linguistic Annotation Text Collection数据集介绍,官网编号LDC2009T07 LDC2009T07Unified Linguistic Annotation Text Collection是 LDC 于 2009 年 3 月 17 日发布的多语言统一语言标注文本集合核心为整合语义、话语、时间等多层标注包含两个子语料库适用于语义理解、实体翻译等研究。以下是详细介绍基础信息项目详情发布机构Linguistic Data ConsortiumLDC发布日期2009 年 3 月 17 日包含子库Language Understanding Annotation CorpusLDC2009T10、REFLEX Entity Translation Training/DevTestLDC2009T11语种英语、标准阿拉伯语、阿拉伯语、普通话应用场景信息检索、问答系统、自动摘要、社会语言学、心理语言学、语用学研究版权信息含多家新闻机构与机构版权需遵循 LDC 用户协议