全网唯一标准王
山西省地方标准 DB14/T3442—2025 人工智能汉语框架语义技术标注规范 第1部分:框架构建 2025-05-07发布 2025-08-07实施 山西省市场监督管理局  发布ICS35.240 CCSL60 14DB14/T3442—2025 I目次 前言..................................................................................II 1范围................................................................................1 2规范性引用文件......................................................................1 3术语和定义..........................................................................1 4框架结构............................................................................2 5框架分类............................................................................3 6框架构建流程........................................................................4 附录A(资料性)词性定义及示例........................................................5 附录B(资料性)框架分类示例..........................................................6 附录C(资料性)框架构建流程示例......................................................9DB14/T3442—2025 II前言 本文件按照GB/T1.1—2020《标准化工作导则第1部分:标准化文件的结构和起草规则》的规 定起草。 本文件由山西省工业和信息化厅提出、组织实施和监督检查。 山西省市场监督管理局对本文件的组织实施情况进行监督检查。 本文件由山西省物联网和人工智能标准化技术委员会(SXS/TC22)归口。 请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别专利的责任。 本文件起草单位:山西大学、太原科技大学、山西同方知网数字出版技术有限公司、山西六新产业 技术研究院有限公司、山西省数字政府服务中心、太原如是达科技有限公司。 本文件主要起草人:李茹、梁吉业、赵红燕、郭少茹、王长征、薛义飞、柴清华、苏雪峰、王智强、 谭红叶、张虎、马志红、吕国英、高俊杰、闫智超、李俊材、王俞智、胡志伟、刘全明、王灵梅。 DB14/T3442—2025 1人工智能汉语框架语义技术标注规范 第1部分:框架构建 1范围 本文件规定了汉语框架的术语和定义、框架结构、框架分类以及框架构建流程。 本文件适用于汉语框架数据构建方开展框架创建活动。汉语框架数据需求方对框架数据进行检查、 验收或第三方机构对框架数据进行评估的活动可参照执行。 2规范性引用文件 本文件没有规范性引用文件。 3术语和定义 下列术语和定义适用于本文件。 3.1 图式化场景 人类认识或理解客观世界的认知结构。 3.2 框架 对概念结构、实践经验、信仰习俗等的图式化表示。 3.3 框架语义 以框架为形式的语言意义。 3.4 义项 词的某种特定意义。 3.5 目标词 具体句子中能够激起框架的词。 3.6 DB14/T3442—2025 2语义角色 目标词和其他语言成分间的语义关系的标签。 3.7 框架元素 框架语义场景中的参与者、工具等要素,包括核心框架元素与非核心框架元素。 3.8 核心框架元素 框架语义场景中在概念和逻辑上必不可少的语义角色,如谓词的主语、宾语。 3.9 非核心框架元素 框架语义场景中在概念和逻辑上非必要的外围语义角色,如时间、空间、环境条件、原因、目的等。 3.10 词元 词形与特定义项的组合对,即具有特定意义的词。 注:每个词语可激起一个或者多个框架,但在具体的句子语境中,词元只能激起某个特定的框架。 4框架结构 4.1基本要素 汉语框架的基本要素分为框架、框架元素及词元三部分,结构如图1所示。其中,框架包含框架中 文名称、框架英文名称以及场景定义;框架元素包括中文名称、英文名称、缩写、类型以及定义;词元 信息包括词、词性和例句。在一个汉语框架中,可能包含一个框架元素、一个词元,也可能包含多个框 架元素、多个词元。 图1汉语框架结构 4.2框架名称 应对框架语义场景进行简洁、准确的描述,并同时具备中文名称和英文名称: ——框架中文名称命名原则:DB14/T3442—2025 3名称应准确指称图示化场景; 字符长度应适宜。 ——框架英文名称命名原则: 应遵循框架中文名称命名原则; 首字母应大写。 4.3场景定义 应采用简洁准确的文字描述抽象的图式化场景,对框架场景中的语义角色及其关系进行整体描述, 可提供例句以帮助理解所定义框架。 4.4框架元素 4.4.1中文名称 应采用简洁准确的文字,概括命名图示化场景中的语义角色。 4.4.2英文名称 应采用框架元素中文名称的对等词来命名。英文名称的首字母须大写。 4.4.3缩写 可采用缩写对较长的框架元素英文名称进一步简化,无需简化则与英文名称一致。框架元素缩写的 英文字母应全部小写。 4.4.4类型 应从概念和逻辑角度,根据其在语义场景中的必要性判断是否属于“核心框架元素”或“非核心框 架元素”。 4.4.5定义 应采用简洁明确的文字,概括描述框架场景中的语义角色。 4.5词元 应是能激起框架的语言成分。词元的词性应是动词、名词、形容词等12种词性之一,词性定义与 示例见附录A。 5框架分类 5.1事件类框架 用于描述在特定时间发生的、包括行为、活动及状态变化的框架,应有助于分析事件发生的相关参 与者、时间、地点及可能的后果,框架示例见附录B的表B.1~表B.3。 5.2关系类框架 用于描述不同实体间的相互依存、联接或互动关系的框架,应强调它们之间的相关性,框架示例见 附录B的表B.4~表B.6。 5.3状态类框架 DB14/T3442—2025 4用于描述实体在特定时间点的特定属性、条件或特征的框架,应着重于描述实体的瞬时情况和相关 属性,框架示例见附录B的表B.7~表B.9。 5.4实体类框架 用于描述具体的实体,包括这些实体名称、特征、类别、用途或相关属性等信息,应有助于系统性 地组织和理解各种实体的本质和特点,框架示例见附录B的表B.10~表B.12。 6框架构建流程 框架创建应按照图2所示流程进行实行,详细示例见附录C的图C.1: a)收集语料:确立目标词并收集包含目标词的句子语料,应尽可能多的收集数据; b)分析语料:对句子语料进行句法分析,应理解目标词的主语、宾语、定语、状语等句法成分; c)归纳图示场景:对句法成分进行语义层面分析并确立目标词语义的图式化表示; d)确认框架信息:通过图式化场景中各个参与者/工具之间的静态/动态关系以及前/背景关系, 确定框架名称、场景定义和框架元素; e)扩充词元:收集归纳能激起该框架的其他词语,扩充语义框架的词元。 图2框架创建流程图

.pdf文档 DB14-T 3442-2025 人工智能 汉语框架语义技术标注规范 第1部分 框架构建 山西省

文档预览
中文文档 13 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共13页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
DB14-T 3442-2025 人工智能 汉语框架语义技术标注规范 第1部分 框架构建 山西省 第 1 页 DB14-T 3442-2025 人工智能 汉语框架语义技术标注规范 第1部分 框架构建 山西省 第 2 页 DB14-T 3442-2025 人工智能 汉语框架语义技术标注规范 第1部分 框架构建 山西省 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2025-07-26 01:07:26上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。