全网唯一标准王
文库搜索
切换导航
文件分类
频道
文件分类
批量下载
山西省地方标准 DB14/T3443—2025 人工智能汉语框架语义技术标注规范 第2部分:句子语义标注 2025-05-07发布 2025-08-07实施 山西省市场监督管理局 发布ICS35.240 CCSL60 14DB14/T3443—2025 I目次 前言........................................................................................................................................................................II 1范围...................................................................................................................................................................1 2规范性引用文件...............................................................................................................................................1 3术语和定义.......................................................................................................................................................1 4标注内容...........................................................................................................................................................1 5标注格式...........................................................................................................................................................2 6标注流程...........................................................................................................................................................2 7标注方法...........................................................................................................................................................3 附录A(资料性)框架信息示例.....................................................................................................................4DB14/T3443—2025 II前言 本文件按照GB/T1.1—2020《标准化工作导则第1部分:标准化文件的结构和起草规则》的规定 起草。 本文件由山西省工业和信息化厅提出、组织实施和监督检查。 山西省市场监督管理局对本文件的组织实施情况进行监督检查。 本文件由山西省物联网和人工智能标准化技术委员会(SXS/TC22)归口。 请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别专利的责任。 本文件起草单位:山西大学、太原科技大学、山西同方知网数字出版技术有限公司、山西六新产业 技术研究院有限公司、山西省数字政府服务中心、太原如是达科技有限公司。 本文件主要起草人:李茹、梁吉业、赵红燕、郭少茹、王长征、薛义飞、柴清华、苏雪峰、王智强、 谭红叶、张虎、马志红、吕国英、高俊杰、闫智超、李俊材、王俞智、胡志伟、刘全明、王灵梅。 DB14/T3443—2025 1人工智能汉语框架语义技术标注规范 第2部分:句子语义标注 1范围 本文件规定了汉语框架句子语义标注的术语和定义、标注内容、标注格式、标注要求和标注方法等 要求。 本文件适用于汉语框架句子语义标注的数据标注方开展训练数据标注活动。汉语框架句子语义数据 需求方对于数据标注进行检查、验收或第三方机构对数据标注进行安全性评估的活动可参照执行。 2规范性引用文件 下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文件, 仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本 文件。 DB14/T3442—2025人工智能汉语框架语义技术标注规范第1部分:框架构建 3术语和定义 DB14/T3442—2025界定的以及下列术语和定义适用于本文件。 3.1 句子语义标注 依据框架语义对句子中词或短语的语义角色进行标记的过程。 3.2 短语 语义和语法上都能搭配的两个或更多的词的组合。 3.3 连谓结构 谓词或谓词结构连用的格式。 4标注内容 句子语义标注的内容应包括目标词所激起的框架,与目标词语义相关的句子成分及其对应的框架元 DB14/T3443—2025 2素(语义角色)。标注示意图见图1。 注:对于目标词相关的语言成分,其语义角色为目标词所激起框架下的框架元素。 主语 宾语 其他语言成分 ...... 谓语 不标注成分句子内容标注内容 目标词框架 框架元素1 框架元素2 目标词支配 的语言成分激活语义角色语义角色 ...... 图1句子语义标注内容示意图 5标注格式 5.1标注句子时分别标注目标词以及目标词相关的句子成分,标注格式如下: ——目标词:<tgt=框架名称目标词>; ——句子成分:<框架元素缩写标注成分>。 示例:<owner每个人>都<tgt=拥有怀着><possio自己的梦想>,这些梦想都是他们努力前行的动力。 注:【拥有】框架信息见附录A中表A.1~表A.3。 5.2标注格式应满足: a)目标词激起的框架用“tgt=”标记; b)每个被标注成分和对应标注的元素使用“<>”(尖括弧)括起; c)框架元素用其缩写表示; d)框架元素缩写和被标注成分之间空一格; e)框架和目标词之间空一格; f)“<”与左边原文文字之间空一格; g)“>”与左右原文文字之间各空一格。 6标注流程 6.1汉语框架下的句子语义标注流程应按照图2所示实行。开始标注时,对于给定的句子,应先确定 待标注的目标词,随后根据上下文语义确定其激起的框架,最后根据框架标注句子中的语义角色并结束 标注。当句子中出现多个目标词时,应分别对每一个目标词进行标注。 开始 结束 确定目标词 确定框架 标注语义角色 句子 图2句子语义标注流程图 6.2流程中以下环节应符合的具体要求为: ——确定句子中的目标词。应根据已有的框架,确定句子中所有能够激起这些框架的目标词; ——确定目标词激起的框架。应根据目标词的图式化场景,选定与其一致的框架;DB14/T3443—2025 3——标注语义角色。应根据目标词所激起的框架,为句子中目标词相关的语言成分标注其对应的 语义角色。 7标注方法 7.1标注范围 与目标词语义相关的所有句子成分都应标注。 7.2特殊标注情况 在连谓结构中,标注不同谓词时应考虑谓词之间的语义关系并给定特定的语义角色。具体包括但不 限于以下情况: ——在连谓结构中,若该结构中的动词有先后关系,且后者是前者的目的,当前者做目标词时, 后者应标注为“目的”; ——在连谓结构中,若该结构中存在两个动词互为伴随动作,当其中一个动词做目标词时,另一 个应标注为“并行事件”; ——在连谓结构中,若存在动词v1为“领、带、带领、陪同、陪”等表示携带、陪同类动词,当 其后面存在动词v2且v2做目标词时,动词v1及其宾语应标注为“伴随者”; ——在包含两个谓词的连谓结构中,当第一个动词是“来/去”,且“来/去”做目标词时,第二个 动词应标注为“目的”; ——在包含两个谓词的连谓结构中,若第一个动词为“有”且宾语为表示抽象事物的名词,如: 办法、权利等,当第二个动词做目标词时,前者及其宾语应标注为“根据”。 7.3无需标注情况 如遇词汇无实际意义或框架无法表示的情况不应标注。具体包括但不限于以下情况: a)连谓结构中,出现超过两个谓语时; b)当以“去”为目标词,且其在句子中无实际意义时; 示例:值得注意的是,知识分子只会批评,但又不开机看,而电视台一向以收视率为依据,要他们主动<tgt=去> 改变这种状况几乎是不可能的。 c)连词、关联副词、语气词; d)单纯表示否定的副词; e)在包含两个谓词的连谓结构中,若第一个谓语动词为“领、带、带领、陪同、陪”等表示携带、 陪同类动词,其做目标词时,其他的谓语结构不标注; f)在包含两个谓词的连谓结构中,若第一个谓语动词为“有”且宾语为表示抽象事物的
DB14-T 3443-2025 人工智能 汉语框架语义技术标注规范 第2部分 句子语义标注 山西省
文档预览
中文文档
8 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2元下载(无需注册)
温馨提示:本文档共8页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2元下载
本文档由 人生无常 于
2025-07-26 01:07:52
上传分享
举报
下载
原文档
(6.6 MB)
分享
友情链接
ISO 4942 2016 Steels and irons — Determination of vanadium content — N-BPHA spectrophotometric method.pdf
ISO 15355 1999 Steel and iron Determination of chromium content Indirect titration method.pdf
ISO IEC 30162 2022 Internet of Things (IoT) — Compatibility requirements and model f.pdf
ISO-ASTM 52910 2018 Additive manufacturing Design Requirements guidelines and recommendations.pdf
ISO TS 8392 2023 Genomics informatics — Description rules for genomic data for genetic detection products and services.pdf
ISO 9928-1 2015 Cranes — Crane operating manual — Part 1 General.pdf
ISO IEC 24775-2 2021 Information technology — Storage management — Part 2 Common Architecture.pdf
ISO 17854 2013 Space data and information transfer systems — Flexible advanced coding and modulation scheme for high rate telemetry applications.pdf
ISO 4620 1986 Cadmium pigments — Specifications and methods of test.pdf
ISO 17458-1 2013 Road vehicles — FlexRay communications system — Part 1 General information and use case definition.pdf
GB-T 18849-2023 机动工业车辆 制动器性能和零件强度.pdf
GB-T 24422-2009 信息与文献 档案纸 耐久性和耐用性要求.pdf
GB-T 17617-2018 耐火原料抽样检验规则.pdf
GB 4706.88-2008 家用和类似用途电器的安全 工业和商用带动力刷的湿或干吸尘器的特殊要求.pdf
GB-T 24232-2009 锰矿石和铬矿石 校核取样和制样偏差的试验方法.pdf
GB-T 197-2018 普通螺纹 公差.pdf
GB-T 36614-2018 集成电路 存储器引出端排列.pdf
GB-T 14479-1993 传感器图用图形符号.pdf
GB-T 9405-1995 34368kbit-s 正码速调整三次群数字复用设备技术要求和测试方法.pdf
GB-T 17704.1-1999 信息技术 信息交换用130 mm一次写入盒式光盘 第1部分 未记录盒式光盘.pdf
1
/
3
8
评价文档
赞助2元 点击下载(6.6 MB)
回到顶部
×
微信扫码支付
2
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。