内容标签和关系标签相结合的汉语篇章标注

上传人:仙*** 文档编号:231992934 上传时间:2023-09-12 格式:PPT 页数:15 大小:485.01KB
收藏 版权申诉 举报 下载
内容标签和关系标签相结合的汉语篇章标注_第1页
第1页 / 共15页
内容标签和关系标签相结合的汉语篇章标注_第2页
第2页 / 共15页
内容标签和关系标签相结合的汉语篇章标注_第3页
第3页 / 共15页
资源描述:

《内容标签和关系标签相结合的汉语篇章标注》由会员分享,可在线阅读,更多相关《内容标签和关系标签相结合的汉语篇章标注(15页珍藏版)》请在装配图网上搜索。

1、内容标签和关系标签相结合的汉语篇章标注李素建,王荀,王宇昕北京大学计算语言学研究所 北京 100871lisujian,xunwang,本文的框架篇章标注及相关工作内容标签和结构标签相结合的标注规范标注样例和工具总结篇章关系篇章关系是指文本的组成部分之间的语义关联。一般只标注相邻部分之间的关系最小单位是句子、小句,也有使用短语的。树状结构或者图模型来描述标注结果篇章关系理论和语料库基于RST理论的RST-Discoures Treebank(Carlson等,2001)385篇Wall Street Journal文章PDTB-v2(Prasad等,2008)语义关系分为三层一百万字规模的Wa

2、ll Street Journal文章FrameNetGraphbank中文语料库:乐明/娄开阳/李毅篇章关系理论和语料库RST-DT和GraphBank是将整个文本作为一个整体进行理解和标注PDTB和FrameNet主要用来描述文本片段。篇章关系标注的目的:不同层次的文本标注统一到一个框架更好地服务于自然语言处理任务的需要内容标签和关系标签相结合的篇章标注体系标注的基本原则分层的原则句-段-篇-章简单的原则关系标签内容标签异质的原则不同的层面使用不同的标签分层的原则篇:由关系比较单调和松散的章组成章:由一个或者几个意义段组成意义段:由意义段或者自然段组成自然段:由句子组成句子:由句内基本单位

3、组成每一层的单元彼此之间以及相邻的层次之间存在着关系,从而构成了整个篇章。简单的原则关系标签:两个相邻的成分之间的关系。内容标签:单个的成分本身的内容所具有的意义特征。内容标签的设计比较灵活,而关系标签的数目和种类则是比较固定。这样可以兼顾标签体系灵活性和稳定性的需要。关系标签是必须的,内容标签是可选的,内容标签可以是对关系标签的一个补充。异质的原则(关系标签)内容标签以医学文本为例病理病理数据数据预后预后防治防治病因病因死亡情况死亡情况症状症状病理解剖病理解剖预防预防定义定义诊断诊断病理生理病理生理治疗治疗诱因诱因体征体征检查检查临床表现临床表现分类分类描述描述功能功能篇章关系标注散文为例关系标签标注结果标注辅助工具总结在新闻语料和医学文本上进行了标注同时标注篇章的语义关系和重要内容内容和语义关系分开保证了标注体系的理论上完备性保证了重要信息可以被标识出来对文本整体和片段都有较强的描述能力。之后我们将对更多的文本进行标注,并在实际中不断完善这套体系。多谢!

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!