(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210064117.0
(22)申请日 2022.01.20
(71)申请人 上海贝业斯健康科技有限公司
地址 200000 上海市松江区鼎源路618弄 1
号16幢5楼5 03室
(72)发明人 祁利斌 李志平 陈占春
(74)专利代理 机构 江苏智天知识产权代理有限
公司 325 50
专利代理师 何源
(51)Int.Cl.
G06F 16/35(2019.01)
G06F 40/30(2020.01)
G06N 3/04(2006.01)
G06N 3/08(2006.01)
G16H 50/70(2018.01)
(54)发明名称
中医症候分类方法、 系统及智能终端
(57)摘要
本发明公开了一种中医症 候分类方法、 系统
及智能终端, 针对目前利用症状数据对中医症候
分类精度低的问题进行改进, 方案包括提取中医
症状数据中的症 状语句, 利用BERT模型提取症状
语句中的文本特征, 且利用金字塔池化对文本特
征进行多尺度提取, 按照特征维度进行重新整
合, 并进行信息影响力修正; 然后利用修正后的
文本特征搭建中医症候分类模型; 利用训练集对
中医症候分类模 型进行训练, 直至分类正确率达
到预设值, 利用训练达标的中医症 候分类模型对
待分类的症状数据进行类别划分, 得到分类结
果。 通过BERT模型以及空间金字塔池化与信息增
强的处理机制, 使用便捷、 高效, 文本特征提取充
分, 信息利用率高, 改善泛化性, 从而有效提高分
类的准确率。
权利要求书1页 说明书4页 附图2页
CN 114491031 A
2022.05.13
CN 114491031 A
1.一种中 医症候分类方法, 其特 征在于: 包括
获得中医症状数据, 并提取中 医症状数据中的症状 语句;
利用BERT模型提取症状语句中的文本特征, 且利用金字塔池化对文本特征进行多尺度
提取, 并对文本特 征的多尺度语义按照特 征维度进行重新整合;
针对整合后的文本特征进行信 息影响力修正, 包括增大有 效特征的影响和抑制无效特
征的影响;
利用信息影响力修 正后的文本特 征, 搭建中 医症候分类模型;
利用训练集对搭建的中医症候分类模型进行训练, 并对训练进行测试, 判断分类结果
是否正确, 直至分类正确率达 到预设值, 模型训练完成;
获取待分类的症状数据, 利用训练达标的中医症候分类模型对待分类的症状数据进行
类别划分, 得到分类结果。
2.根据权利要求1所述的中医症候分类方法, 其特征在于: 对文本特征的多尺度语义按
照特征维度进行重新整合包括
将文本特 征按照不同池化距离的得到的向量进行拼接得到新向量。
3.根据权利要求1所述的中医症候分类方法, 其特征在于: 对文本特征进行信 息影响力
修正, 包括
计算文本特征的权重值, 之后对比各文本特征对应的权重与预设值的大小关系, 对权
重大于预设值的文本特 征进行增强, 对权 重小于预设值的文本特 征进行抑制。
4.根据权利要求3所述的中 医症候分类方法, 其特 征在于: 计算文本特 征的权重值包括
设置输入数据维度为[B,S,H*2], 其中, B表示数据批量, S表示文本长度, H表示LSTM隐
层神经元数; 初始化一个可学习的权重矩阵w, w维度为[H*2,1]; 对LSTM的输出[B,S,H*2]维
数据进行非线性激活后, 与w进行矩阵相乘, 并经过Softmax归一化, 得到每时刻的分值, 维
度为[B,S,1], 分值的矩阵代 表文本中每 个文字的权 重。
5.根据权利要求4所述的中医症候分类方法, 其特征在于: 利用训练集对搭建的中医症
候分类模型进行训练时,
将LSTM的每一时刻的隐层状态[B ,S ,H*2]维数据乘对应的分值[B ,S ,1]维矩阵后
求和, 得到加权平均后的最终隐层值, 维度为[B ,H*2]; 对最终隐层值[B ,H*2]维数据进行
非线性激活后送入全连接层, 全连接层共2层, 神经元数分别为B和N, N为预测的类别 数; 通
过Softmax归一化, 将N的个数中最大的数对应的类别作为最终预测 ,得到最终的输出结
果, 维度为[B ,1]。
6.根据权利要求5所述的中 医症候分类方法, 其特 征在于: 搭建中 医症候分类模型包括
按照特征重要度对每个文字的特征进行增强或抑制, 对所有文字的特征按重要度进行
增强或抑制; 根据信息增强处 理后的文本特 征, 搭建中 医症候分类模型。
7.一种中医症候分类系统, 其特征在于: 包括第一处理器(1)与第一存储器(2), 所述第
一存储器(2)存储有指令集供所述第一处理器(1)调用以实现如权利要求1至6任一项所述
的中医症候分类方法。
8.一种用于 中医症候分类的智能终端, 其特征在于: 包括第 二处理器(3)与第 二存储器
(2), 所述第二存储器(2)存储有指令集供所述第二处理器(3)调用以实现如权利要求1至6
任一项所述的中 医症候分类方法。权 利 要 求 书 1/1 页
2
CN 114491031 A
2中医症候分类方 法、 系统及智能终端
技术领域
[0001]本发明涉及数据分析领域, 更具体地说, 它涉及一种中医症候分类方法、 系统及智
能终端。
背景技术
[0002]中医证候分类研究是指将疾病过程中具有内在联系的一组症状和体征 (如发热、
头痛、 身痛 等) 总结分类为某一证候 (如风寒表实) 的过程。 作为中医辨证施治研究 的核心问
题之一, 它有着广泛的应用背景和研究价 值, 有大量的研究围绕着证候分类进行。
[0003]计算机技术作为一种人工智能技术, 已经融入到人们生活和工作中的各个领域
中, 但是在中医药领域中的证候分类还 是以人工手段为主, 医生通过对病人症状、 体征等资
料的综合分析, 再结合中医学的理论指导, 最 终确定病人的中医证候类型。 我国中医诊断学
主要讲的是“整体观”及其相关因素, 受到现代对于整体数据 处理技术水平的影响, 我国中
医智能化研究起 步较晚, 使用人工智能方法对中 医症候分类的研究较少。
[0004]现有技术主要采用传统的机器学习方法对中医症候进行识别与分类, 郝婷等利用
人工神经网络算法对临床症状进行中医证候分类研究, 以慢性阻塞性肺疾病为例, 使用C#
建立了中医症候辩证系统; 许立辉等开展了基于关联规则的中医证候分类模型应用研究,
以高血压病例为例, 通过将关联规则挖掘算法应用于证候分类, 挖掘出 的结果表明不同的
证候间、 证候与处方间的关联关系 可以为中医的诊断提供有效的辅助手段。 陈菊萍等则利
用支持向量机对中医症候进行了分类, 实现了症候二分类方法。 现有的研究方法受 限于样
本数据的缺 乏以及研究方法本身的缺陷, 可以解决中医症候在局部疾病中的辩证 问题, 且
精度较低, 无法实现大规模中 医症候机器分类的临床实用。
发明内容
[0005]针对现有技术存在的不足, 本发明的第一目的在于提供一种中医症候分类方法,
具有利用症状数据对中 医症候分类精确的优点。
[0006]为实现上述目的, 本发明提供了如下技 术方案:
一种中医症候分类方法, 包括
获得中医症状数据, 并提取中 医症状数据中的症状 语句;
利用BERT模型提取症状语句中的文本特征, 且利用金字塔池化对文本特征进行多
尺度提取, 并对文本特 征的多尺度语义按照特 征维度进行重新整合;
针对整合后的文本特征进行信息影响力修正, 包括增大有效特征的影响和抑制无
效特征的影响;
利用信息影响力修 正后的文本特 征, 搭建中 医症候分类模型;
利用训练集对搭建的中医症候分类模型进行训练, 并对训练进行测试, 判断分类
结果是否正确, 直至分类正确率达 到预设值, 模型训练完成;
获取待分类的症状数据, 利用训练达标的中医症候分类模型对待分类的症状数据说 明 书 1/4 页
3
CN 114491031 A
3
专利 中医症候分类方法、系统及智能终端
文档预览
中文文档
8 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共8页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-18 22:33:49上传分享