专利中医症候分类方法、系统及智能终端

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210064117.0 (22)申请日 2022.01.20 (71)申请人上海贝业斯健康科技有限公司地址 200000 上海市松江区鼎源路618弄 1 号16幢5楼5 03室 (72)发明人祁利斌　李志平　陈占春　 (74)专利代理机构江苏智天知识产权代理有限公司 325 50 专利代理师何源 (51)Int.Cl. G06F 16/35(2019.01) G06F 40/30(2020.01) G06N 3/04(2006.01) G06N 3/08(2006.01) G16H 50/70(2018.01) (54)发明名称中医症候分类方法、系统及智能终端 (57)摘要本发明公开了一种中医症候分类方法、系统及智能终端，针对目前利用症状数据对中医症候分类精度低的问题进行改进，方案包括提取中医症状数据中的症状语句，利用BERT模型提取症状语句中的文本特征，且利用金字塔池化对文本特征进行多尺度提取，按照特征维度进行重新整合，并进行信息影响力修正；然后利用修正后的文本特征搭建中医症候分类模型；利用训练集对中医症候分类模型进行训练，直至分类正确率达到预设值，利用训练达标的中医症候分类模型对待分类的症状数据进行类别划分，得到分类结果。通过BERT模型以及空间金字塔池化与信息增强的处理机制，使用便捷、高效，文本特征提取充分，信息利用率高，改善泛化性，从而有效提高分类的准确率。权利要求书1页说明书4页附图2页 CN 114491031 A 2022.05.13 CN 114491031 A 1.一种中医症候分类方法，其特征在于：包括获得中医症状数据，并提取中医症状数据中的症状语句；利用BERT模型提取症状语句中的文本特征，且利用金字塔池化对文本特征进行多尺度提取，并对文本特征的多尺度语义按照特征维度进行重新整合；针对整合后的文本特征进行信息影响力修正，包括增大有效特征的影响和抑制无效特征的影响；利用信息影响力修正后的文本特征，搭建中医症候分类模型；利用训练集对搭建的中医症候分类模型进行训练，并对训练进行测试，判断分类结果是否正确，直至分类正确率达到预设值，模型训练完成；获取待分类的症状数据，利用训练达标的中医症候分类模型对待分类的症状数据进行类别划分，得到分类结果。 2.根据权利要求1所述的中医症候分类方法，其特征在于：对文本特征的多尺度语义按照特征维度进行重新整合包括将文本特征按照不同池化距离的得到的向量进行拼接得到新向量。 3.根据权利要求1所述的中医症候分类方法，其特征在于：对文本特征进行信息影响力修正，包括计算文本特征的权重值，之后对比各文本特征对应的权重与预设值的大小关系，对权重大于预设值的文本特征进行增强，对权重小于预设值的文本特征进行抑制。 4.根据权利要求3所述的中医症候分类方法，其特征在于：计算文本特征的权重值包括设置输入数据维度为[B,S,H*2]，其中， B表示数据批量， S表示文本长度， H表示LSTM隐层神经元数；初始化一个可学习的权重矩阵w， w维度为[H*2,1]；对LSTM的输出[B,S,H*2]维数据进行非线性激活后，与w进行矩阵相乘，并经过Softmax归一化，得到每时刻的分值，维度为[B,S,1]，分值的矩阵代表文本中每个文字的权重。 5.根据权利要求4所述的中医症候分类方法，其特征在于：利用训练集对搭建的中医症候分类模型进行训练时，将LSTM的每一时刻的隐层状态[B ,S ,H*2]维数据乘对应的分值[B ,S ,1]维矩阵后求和，得到加权平均后的最终隐层值，维度为[B ,H*2]；对最终隐层值[B ,H*2]维数据进行非线性激活后送入全连接层，全连接层共2层，神经元数分别为B和N， N为预测的类别数；通过Softmax归一化，将N的个数中最大的数对应的类别作为最终预测 ,得到最终的输出结果，维度为[B ,1]。 6.根据权利要求5所述的中医症候分类方法，其特征在于：搭建中医症候分类模型包括按照特征重要度对每个文字的特征进行增强或抑制，对所有文字的特征按重要度进行增强或抑制；根据信息增强处理后的文本特征，搭建中医症候分类模型。 7.一种中医症候分类系统，其特征在于：包括第一处理器(1)与第一存储器(2)，所述第一存储器(2)存储有指令集供所述第一处理器(1)调用以实现如权利要求1至6任一项所述的中医症候分类方法。 8.一种用于中医症候分类的智能终端，其特征在于：包括第二处理器(3)与第二存储器 (2)，所述第二存储器(2)存储有指令集供所述第二处理器(3)调用以实现如权利要求1至6 任一项所述的中医症候分类方法。权　利　要　求　书 1/1 页 2 CN 114491031 A 2中医症候分类方法、系统及智能终端技术领域 [0001]本发明涉及数据分析领域，更具体地说，它涉及一种中医症候分类方法、系统及智能终端。背景技术 [0002]中医证候分类研究是指将疾病过程中具有内在联系的一组症状和体征（如发热、头痛、身痛等）总结分类为某一证候（如风寒表实）的过程。作为中医辨证施治研究的核心问题之一，它有着广泛的应用背景和研究价值，有大量的研究围绕着证候分类进行。 [0003]计算机技术作为一种人工智能技术，已经融入到人们生活和工作中的各个领域中，但是在中医药领域中的证候分类还是以人工手段为主，医生通过对病人症状、体征等资料的综合分析，再结合中医学的理论指导，最终确定病人的中医证候类型。我国中医诊断学主要讲的是“整体观”及其相关因素，受到现代对于整体数据处理技术水平的影响，我国中医智能化研究起步较晚，使用人工智能方法对中医症候分类的研究较少。 [0004]现有技术主要采用传统的机器学习方法对中医症候进行识别与分类，郝婷等利用人工神经网络算法对临床症状进行中医证候分类研究，以慢性阻塞性肺疾病为例，使用C# 建立了中医症候辩证系统；许立辉等开展了基于关联规则的中医证候分类模型应用研究，以高血压病例为例，通过将关联规则挖掘算法应用于证候分类，挖掘出的结果表明不同的证候间、证候与处方间的关联关系可以为中医的诊断提供有效的辅助手段。陈菊萍等则利用支持向量机对中医症候进行了分类，实现了症候二分类方法。现有的研究方法受限于样本数据的缺乏以及研究方法本身的缺陷，可以解决中医症候在局部疾病中的辩证问题，且精度较低，无法实现大规模中医症候机器分类的临床实用。发明内容 [0005]针对现有技术存在的不足，本发明的第一目的在于提供一种中医症候分类方法，具有利用症状数据对中医症候分类精确的优点。 [0006]为实现上述目的，本发明提供了如下技术方案：一种中医症候分类方法，包括获得中医症状数据，并提取中医症状数据中的症状语句；利用BERT模型提取症状语句中的文本特征，且利用金字塔池化对文本特征进行多尺度提取，并对文本特征的多尺度语义按照特征维度进行重新整合；针对整合后的文本特征进行信息影响力修正，包括增大有效特征的影响和抑制无效特征的影响；利用信息影响力修正后的文本特征，搭建中医症候分类模型；利用训练集对搭建的中医症候分类模型进行训练，并对训练进行测试，判断分类结果是否正确，直至分类正确率达到预设值，模型训练完成；获取待分类的症状数据，利用训练达标的中医症候分类模型对待分类的症状数据说　明　书 1/4 页 3 CN 114491031 A 3

专利 中医症候分类方法、系统及智能终端

专利中医症候分类方法、系统及智能终端