“天人合一”整体医学大数据技术应用

千金方之约2024-05-09
1人工智能医学人工智能(ArtificialIntelligence,AI)是研究、开发以模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。如今已经进入了整个人的...
公众号广告

 

1人工智能医学

人工智能(Artificial Intelligence,AI)是研究、开发以模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。如今已经进入了整个人的社会生活中间每一个角落里面。先驱约翰·尼尔森认为人工智能是关于怎样表示知识以及怎样获得知识并使用知识的学科,总结为表示、获得以及使用知识,甚至有决策和创造能力。广义的人工智能医学通常更多的应用在包括医疗工程及医疗操作上的智能化,主要是虚拟助理、可穿戴设备、风险管理、医学影像、和病理学等领域;而狭义的人工智能医学所指真正医学诊断治疗决策意义上的智能医学,可实现疾病风险的智能预警、智能诊断、以及疗效的智能预警或智能匹配,如健康管理、营养学、精神健康、药物挖掘、生物技术、急救室/医院管理。人工智能在医疗健康领域中的应用已经非常广泛。可从其发展进程分为以下三个层次:弱人工智能、强人工智能、超人工智能。弱人工智能主要是指通过人工智能的方式,在某一个具体问题上产生它的能力或者智能。目前的主要人工智能系统, 比如说围棋人工智能(阿尔法狗)就是弱人工智能,与人类最强的选手对弈,竟打败人类选手,说明在某些思维能力方面能胜过人类。

强人工智能的能力可以和人的能力进行比拟了,就是所谓的思考、计划、解决问题、抽象思维,然后通过试错的学习或者是经验中的学习。超人工智能,人工智能可能超出人类,人类将面对的局面将不可想象。从1956年达特茅斯人工智能诞生,到1970年、1980年,出现专家系统,之后神经网络的算法,一度进入低谷,直到2006年后,以深度学习能力显著进步为特征的人工智能技术,使人类更为担心将来人工智能会超越人类思维能力,甚至出现损害人类能力。也许,人工智能成为人类的最后发明,从此以后人类创造力让位于人工智能,让它发明各种所需的东西。人工智能在医学方面发展一方面通过人工的神经网络技术深度学习、数据挖掘,丰富完善智能诊疗过程;另一方面,根据人类千百年来知识及实践经验建立起来的专家系统,可辅助的诊断以及治疗。将大数据技术应用到预防、保健、诊疗、康复医疗流程,是智能医学主要内容。目前,人工智能在现代医学中影响最为广泛的应用是Watson for Oncology系统(美国IBM)。其数据资料如今流行的各种教科书和期刊共1200万页文献、数千万份美国主流医院病历资料,可模仿现代医疗逻辑思维,根据患者的临床数据作出初步诊断及治疗方案。所提供的各种数据或图像必须进行标准化、量化、结构化,人工智能医学便可作出诊断及治疗方案,令人遗憾的是,目前在临床中所起到的作用并不是很大,原因很多,作者认为,如今的“碎片式”的医学数据,严重影响到医学人工智能的发展与应用,现代西医的思维方法局限性所造成的“战略”缺陷,不是用大数据算法能克服的。比如,现代医学的粗暴性,不是人工智能所能解决的。这也许是人工智能为什么没有快速发展广泛应用于临床的重要原因之一;相反,以整体观为“战略”指导思想的中医系统,人工智能的应用相对西医更易于应用于临床实践。当然,那些非标准化、充满不确定性以及人工操作的医疗工作,还是人工智能无法替代的。

各种慢性病尤其癌症仍是世界性医学难题。我国的癌症发病率和死亡率一直在上升,从2010年开始已经成为主要的致死原因,癌症的井喷式增长是我国重大的公共卫生问题[5]。建构于循证医学为主体的生物医学基础上,过去二十年以来以循证医学为基础的临床指南被奉为整个临床研究领域“金科玉律”。Meta分析被认为是“最高级别”的临床证据,是制定临床指南和指导医生临床决策最基本的依据。尽管如今循证医学科学性遭到了质疑:方法学及数学逻辑存在重大缺陷,同时受出资方利益等“主观偏倚”影响。不仅如此,现代肿瘤医学诊疗理论大厦赖以的基础“线性还原论”,把一个有机的生命整体,分解成无机的各个部分,完全不能够解释或证明具有“非线性、不稳定性、不确定性”为特征的、较为复杂的“自然”或“生命”现象,要“突破”或“超越”还原论,应以系统论来代替它。众所周知,虽然近代自然科学之所以能够取得飞速、迅猛的发展,与早期的科学家们所创立的正确“方法论”如“还原论”不无关系。但医学、或者说生命科学的发展似乎不尽人意,除了抗菌药物的发现使人类因感染病菌或病毒而死亡的人数大幅度降低以外,其它如癌症、代谢综合症和自身免疫性等疾病,是由于整体各个分系统之间协调处理出现了问题,无法用分解的“还原论”进行解析,其非正常死亡率并没有十分明显的下降,甚至于成为当代人类社会生命的重要“杀手”。近十多年来,由于还原论和整体论遭遇到的挑战、争论和系统科学的快速发展,从而迎来了一个科学方法论思维大变革的新时代,大数据技术正是系统论的真实体现。影响生命发展因素天文级的数量,从基因开始一直到表型,是一个巨大的海量数据的输入,少量的数据不足以说明,这些数据的输入需要起码做到一百万人,比如对影响身高基因的判断,需要一百万人以上的基因数据和身高数据,就有可能准确预测身高。以海量真实世界数据为基础,可克服当前运用循证医学进行各种肿瘤防治研究方法上的不足。

现代肿瘤治疗方法仍沿革于过去技术落后时代的方法,仍然具有较大的“粗暴性”,目前仍以外科手术、放疗、化疗为主的“三驾马车”,具有极大的伤害性,本质上疗效不确定、效果也不尽人意,有违医学的“初心”的“粗暴”治疗方式,对肿瘤防治的指导缺乏吸引力和先进性。医学的存在原本是为人类减轻痛苦,而现在以外科手术、放疗、化疗为主体的现代肿瘤治疗的,无不给人类带来巨大的痛苦,而且无法治愈肿瘤甚至加速病人的死亡[7,8]。事实上,面对日新月异的肿瘤学科发展,微无创治疗手段五彩纷呈,如何将分子靶向、免疫生物治疗、热疗、电场治疗、光动力、膳食营养、肠道微生态、生活方式等微无创治疗技术手段逐步替代传统的肿瘤治疗的“三架马车”手术、放疗、化疗等损伤性治疗,减少伤害,提高整体疗效,值得当下肿瘤各学科及业界深刻思考。一定要打破既有临床方法,突破思想上藩篱,大力推广肿瘤微无创治疗技术,优化整合分子靶向治疗、免疫生物、热疗、电场治疗、光动力等各种微无创技术,取代以“组织器官切除”为代表的“粗暴”伤害治疗。

未来肿瘤学的发展应摒弃占主流的手术、放疗、化疗等“伤害”治疗,主要表现为现代肿瘤学的治疗仍以外科手术、放疗、化疗为主导的“三驾马车”,具有极大的伤害性。目前,在肿瘤健康管理大数据领域,以IBM Watson for Oncology为代表人工智能系统,又被称为沃森肿瘤机器人已在临床中使用,但是其数据主要基于循证医学为主体的生物医学模式的治疗方案,而应建立以微无创技术为主体智能化大数据共享模式。

微无创整合医学大数据库的构建

如果把人工智能比作飞机,那么大数据就是机油,马达就是云计算算法。构建智能无创医学模式,首先得构建微无创整合医学数据模型及数据库。创新运用涵盖整个人体系统大数据,不仅包括传统的组织活检、手术、放、化疗为主体的临床诊疗数据、营养膳食、中药、运动生活方式环境、心理,基因组、代谢组学、微生物组学、生存时间、生活质量等、 还包括创新运用微无创技术如热疗、电场、免疫生物等治疗 “多元化”整合的临床数据、可穿戴或可携带设备监测的生命体征、中医“四诊”及微循环等无创的诊疗资料数据,通过云计算、智能“学习”,构建癌症微无创诊疗的互联网智能终端技术手段,来提升癌症防治的效率和质量,帮助人们更好地预防、监测慢性病以及获得个性化预防保健服务。加强慢性病防治的关键时期,需重视对慢性病管理的大数据处理和分析,利用先进的信息化技术形成全民参与的慢性病管理模式,遏制癌症等慢性病高发态势。正如以上所述,现代医学建立在线性思维逻辑的生物医学体系,对生物医学的化学物质层次进行深入研究,在这一层面上一产生各种数据库,如基因组学、转录组、蛋白质组、代谢组学等数据库,但社会心理自然环境等要素与临床表现组学等临床数据存在诸多问题,由于现代生物医学的局限性,其临床组学数据与微无创整合思想背道而驰,所形成的的数据库缺乏足够的挖掘价值,其二,目前仅仅停留在线性还原为思维基础生物医学学角度上的数据,对于外界作用于人体的“信息及能量”引起的人体复杂系统的生理变化熟视无睹或无从深入,更没有具体的数字化方法。中国古代《皇帝内经》主张的“天人合一”思想,无疑给予了很大的启发和指导,正所谓 “《皇帝内经》国人已读2500年,还值得再读2500年”。《皇帝内经》虽然成书于自然生产力、科学技术非常落后的远古时代,但我们先民的聪明智慧反应的是真实世界运行规律,所运用的“比类取象”“象数思维”方法,与人工智能利用计算机技术、立足数理逻辑、对人的形式逻辑思维和辩证逻辑思维过程的模拟,在研究对象、研究方法及目标上具有一致性。

系统生物学研究细胞以下各种物质相互作用的规律,是当今生物学研究的主要内容,目前产生大量的数据,这些数据人工智能医学深入研究的重要对象,已产生很多相关的大数据及生物信息,并建设成智能专家系统,近年来使用得比较多的各类遗传信息大数据库所建立的专家系统已在临床中运用,主要建立在基因组学、转录组学、蛋白组学及代谢组学等数据基础之上的各类生物信息汗牛充栋,这些不仅反应细胞内所有生物分子组成成分,更重要的相互联系、相互作用而形成的分子网络架构,如何运用现代分子生物学方法及复杂网络理论方法构建出复杂疾病后症候的复杂网络动力结构,肯定是未来医学必走的路。

近年来,寄生在人体的微生物组是微生物群落里所有基因组信息的总和,人体微生物总数是人体细胞数量的20倍,具有独特生理代谢优势,它决定着一个群落能够执行怎样的功能。越来越多的研究表明,微生物组--细菌、真菌、病毒和居住在人体内(主要在消化道)的其他微生物--对于人体健康和疾病起着重要作用。微生物应该在个性化医学领域中也起着至关重要的作用,但迄今为止该领域一直都以遗传学为主。最终,微生物必须成为整个精准医疗不可或缺的一个组成部分,因为这么多人的机能和代谢都依赖于它。对于细胞内分子网络各节点,微生态学分子网络必须与细胞内分子网络结合在一起,才能真正符合疾病形成机制。

对于细胞内分子网络动力系统来说,人体膳食营养包括各种化学物质、中药等对细胞的作用,应称之为外因,某一要素所有相关的外部因素,暂且称之为外因组学。网络药理学的诞生正是基于疾病分子网络特点,对分子网络相应关键节点予以调节。借用网络作用的原理,同样应建立网络营养学这一比药物更加重要的膳食营养数据模型,因此,应更加迫切建立疾病营养基因分子网络、转录组网络及蛋白质网络及数据模型,累积更完善的数据库。

代谢组学(metabonomics)是20世纪90年代中期发展起来的一门新兴学科,是关于生物体系受刺激或扰动后(如将某个特定的基因变异或环境变化后) 其代谢产物(内源代谢物质) 种类、数量及其变化规律的科学,人体内内因与外因相互作用的结果,更能反映疾病发展特点及全面反应疾病的分子特点。它研究的是生物整体、系统或器官的内源性代谢物质的代谢途径及其所受内在或外在因素的影响。常用的方法是检测和量化一个生物整体代谢随时间变化的规律,建立内在和外在因素影响下,代谢整体的变化轨迹,反映某种病理(生理)过程中所发生的一系列生物事件。由于代谢组学侧重于体内生物化学反应的产物的整体变化,而基因组、转录组和蛋白质组研究更强调生命过程的调控机制和物质基础。因此需进一步以基因组、转录组和蛋白质组方法从动物实验入手来研究机体内生物化学反应的过程及代谢通路变化的调控机理。

疾病各层次分子网络的建立,以不同物质层次维度共同构成多维度的疾病分子网络,如果这些分子网络不与临床表现及转化规律进行对接,将无法对临床医学推动。面对如此复杂的分子网络,依靠人类的思维能力肯定远远不够,人工智能的诞生及能力的提升,无疑为智能医学奠定基础。构建肿瘤“药物或营养物质-分子靶点”、“分子节点-细胞-功能节点(器官)-人体疾病或症候(中医)”相互联系相互作用网络动力图,如何与疾病各种临床表现特征(信息)或藏象相对应起来,并建立网络模型,以此研究各种疗法对疾病及人体的整体影响

人体内部复杂网络结构决定人体外在身心表现也具有十分复杂的特点,所呈现出各种属性数据十分巨大。数字化的医学工程技术为科学合理的建设数字化的临床数据库奠定了基础。中医望闻问切等收集临床数据的方法可实现数字化,为中西走向融合提供必要条件。基于整体观,采用象数思维的中医学与智能医学思维方法一致,更突显中医学在弥补西医的缺陷及在未来智能医疗中的重要作用。通过中医“四诊”中的面部“慢病面容”、“舌诊”、“脉诊”、经络等源于临床医学以下几方面数据:医院信息系统(HIS)、电子病历系统(EHRS)影像和通信系统(PACS)、临床信息系统(CIS)、放射学信息系统(RIS)和实验室信息系统(LIS)等数据共同融合集成一个数据平台,真正将中西医融合成一个整体。

需要指出的是,由于有别于现代西医为主流的医学模式,微无创整合医学更多强调整体调节,而不是“粗暴”的各种“伤害医疗”。一方面继承现代医学优秀成果,更多药进行微无创整合医疗探索。在伦理学许可的前提下,确保临床数据收集的可靠性。

数据挖掘

目前构建医学大数据库,首先把所有个体的各方面的信息,根据一定的规则,进行收集整合集成、存储,建立全方位数据库,运用数据挖掘技术搜索、处理和分析这些数据。数据挖掘的分析方法有很多种,针对不同的用途就有不同的分析方法,比较常见的分析方法有以下几种:分类、预测、相关性分组活关联规则、聚类、估值、描述和可视化、复杂数据类型挖掘,包括文本数据挖掘。WEB数据挖掘、图形图像数据挖掘、视频和音频数据挖掘。数据挖掘的过程一般由三个主要的阶段构成:数据准备、开采操作、结果表达和解释,对知识的发现可以描述为这三个阶段的反复过程。(1)数据准备:又可进一步分成三个子步骤:数据集成,数据选择、数据预处理。数据集成将多文件和多数据库运行环境中的数据进行组合,解决语义模糊性,处理数据中的遗漏和清洗无效数据等。数据选择的目的是辨别出需要分析的数据集合,缩小处理范围,提高数据挖掘的质量。预处理是为了克服目前数据挖掘工具的局限性。(2)数据挖掘:这个阶段进行实际性分析工作,包括的要点是:先决定如何产生假设,是让数据挖掘系统为用户产生假设,还是用户自己对数据库中可能包含的知识提出假设,前一种称为发现型的数据挖掘;后一种称为验证型的数据挖掘。再选择合适的工具进行发掘知识的操作,最后进行证实。(3)结果表述和解释:对提取的信息进行分析,挑选出有效信息,并且通过决策支持工具进行移交。因此,这一步骤的任务不仅是把结果表达出来(例如采用信息可视化方法),还要对信息进行过滤处理,如果不能令用户满意,需要重复以上数据挖掘的过程。

数据挖掘的功能:(1)自动预测趋势和行为:数据挖掘自动在大型数据库中寻找预测性信息,以往需要进行大量手工分析的问题如今可以迅速直接由数据本身得出结论。(2)关联分析:数据关联是数据库中存在的一类重要的可被发现的知识。若两个或多个变量的取值之间存在某种规律性,就称为关联。关联可分为简单关联、时序关联、因果关联。关联分析的目的是找出数据库中隐藏的关联网。有时并不知道数据库中数据的关联函数,即使知道也是不确定的,因此关联分析生成的规则带有可信度。(3)聚类:数据库中的记录可被划分为一系列有意义的子集,即聚类。聚类增强了人们对客观现实的认识,是概念描述和偏差分析的先决条件。(4)概念描述:概念描述就是对某类对象的内涵进行描述,并概括这类对象的有关特征。概念描述分为特征性描述和区别性描述,前者描述某类对象的共同特征,后者描述不同类对象之间的区别。(5)偏差检测:数据库中的数据常有一些异常记录,从数据库中检测这些偏差很有意义。偏差包括很多潜在的知识,如分类中的反常实例、不满足规则的特例、观测结果与模型预测值的偏差、量值随时间的变化等。偏差检测的基本方法是寻找观测结果与参照值之间有意义的差别。

基于对中医四诊、西医理化数据、量子医学数据等合参的研究,建立了一个智能化的医学诊断系统。利用问诊仪、舌诊仪、面色仪、脉诊仪穴位仪等中医数字化采集设备,西医生化检测、系统生物学、微生态数据、物理检查数据、量子医学数据及人体各种其他生理、心理数据。对中医四诊信息进行量化采集与分析,从而克服了西医线性还原分析及传统中医依靠意会主观化强的弊端,并以中医基础理论为指导,结合特征属性筛选,建立决策树EID3及神经网络MART2诊断模型,对未知采集数据给出一个初步诊断结论,并通过不断的临床验证、反馈,对诊断系统参数进行调整,从而使得诊断结论可靠。尽快建立微无创干预下的疾病多层次、多维度复杂网络巨系统的各层级数据,为实现未来智能微无创医学打下基础。在临床中有些疾病错综复杂,数据挖掘的有关分类分析可以应用于疾病的诊断。粗糙集理论、人工神经网络、模糊逻辑分析在疾病诊断方面是有效的。国内有学者将粗糙集理论应用于中医类风湿的诊断,取得了满意的效果,大大提高了诊断准确率,国外A.Kusiak等将基于粗糙集理论的两种算法应用于实体性肺结节的诊断,诊断准确率达100%, Roshawrma Scales等基于人工神经网络理论及模糊逻辑开发的对心血管疾病诊断的工具对疾病诊断的正确率达到92%。在病案信息库中有大量的关于病人的病情和病人的个人信息,包括年龄、性别、居住地、职业、生活情况等,对数据库中的信息进行关联规则分析可以发现有意义的关系及模式,某种疾病的相关发病危险因素分析可以指导患者如何预防该疾病。Jonathan C.Prather等成功地应用数据挖掘的有关理论对Duke大学医学中心的产科病人早产的3个危险因素进行了分析。确定某些疾病的发展模式,根据病人的病史预测病情的发展趋势,从而有针对性的预防疾病的发生。应用粗糙集理论根据以往病例归纳出诊断规则,用来预测新的疾病的发生,现有的人工预测早产的准确率只有17%~38%,应用粗糙集理论则可提高到68%~90%。

智能化辨病诊断模块或仿真模型的开发

癌症复杂生命体涉及物质层级无限多、每一层间内、外部各要素之间相互联系、相互作用纷繁复杂,要想在尽快的使用到人工智能的辅助作用,必须把这一人体复杂巨系统,根据其病理生理特点,分解成为独立的各种诊断模块,对疾病不同层级之间的相关性进行数据挖掘。根据西医临床治疗及理化检测数据疾病诊断及中医望闻问切数据辩证分析,建立起来基于辨病辩证的智能诊断系统。由于涉及的层级不大,所需要的数据相对不多就可达到一定使用价值。同样根据相应的原理,目前在临床中广泛使用的癌症遗传基因诊断,所产用软件也为智能诊断模块。癌症治疗靶点的发现也可采用人工智能技术。目前已产生了针对不同领域的独立智能诊断模块,如何利用这些模块继续扩大数据量,增强其准确,如何集成中西医数据,成为一个趋于一致的智能系统,最终实现中西医融合,应作为今后我国医学发展的重要方向。 

Fig5.2 Intelligent Diagnosis System in turm of  Differentiation of Diseases and Syndrome Classification

(基于辨病辩证智能化诊断系统) 

西医临床数据及中医四诊为辨病辨证论治提供依据,建立在西医临床数据与中医四诊数据基础的智能辨病辩证诊断系统,中西医临床数据所反应的人体生理体征不尽一样,各有其独特性,从不同的侧面反应人体生理特征,必须把中西医数据有机地结合起来,才能全面、系统地了解病情,做出正确判断。从理论上来说,掌握越多的数据属性信息,数据越多,更有助于诊断模型进行样本特征的学习和提炼,但是从另一方面看,数据多,特征性属性的辨别增加困难,非相关和冗余的数据信息会极大程度的影响到诊断模型的学习效能,进而影响对疾病的正确诊断。针对中医四诊数据中含有过多非相关属性和冗余属性的训练数据进行属性筛选,目的是提高四诊合参的质量,进而达到提升诊断模型的精度和性能的目的(Fig.5.3)。

Fig5.3  Attribute screening flow chart(属性筛选流程图)

利用信息技术,模拟复杂的中西医诊疗过程,建立智能诊断模块,Lei和Huan根据2003 年提出的“主相关性关系(predominant correlation)”概念,建立了一种快速属性筛选器模型(FCBF),很适合应对具备高维特征属性的数据集合进行属性筛选,与其它一些属性搜索算法比,搜索性能与搜索效率上都有一定优势。对于中西医包含 多项体征属性数据样本集合, FCBF属性搜索策略可满足搜索算法实际应用要求。FCBF 在进行属性搜索时基于这样一个认知理论:当发现一对特征属性存在冗余关系时,应保留与决策属性相关度更大的属性,去除与决策属性相关度较小的属性,从而在保留特征属性对于决策属性预测能力的同时降低特征属性的冗余度。降低了在辨病辩证过程中,属性筛选的人为性主观因素。

基于对中医四诊合参的研究,建立了一个智能化的中西医诊断系统。利用西医数字化数据、四诊仪、和穴位仪等数字化采集设备,对中西医信息进行量化采集与分析,克服了传统中医主观化强的弊端,并以中西医基础理论为指导,结合特征属性筛选,建立决策树EID3及神经网络MART2诊断模型,对未知采集数据给出一个初步诊断结论,并通过不断的临床验证、反馈,对诊断系统参数进行调整,从而使得诊断结论可靠。

基于辨病辩证的智能化诊断系统,旨在提供一种中西医客观化诊断的新途径。通过对采集的中西医信息进行无缝连接,将中西医等数据信息与脉诊、穴诊的传感器的输出信号信息,以及问诊的统计信息融合,转换成对有辨病辩证有价值、有意义的中西医高维输入向量。提取并消除中医四诊信息中的冗余属性,从高维的中医症状及体征信息中分离出主要影响中医证候诊断的症状及体征信息子集,将其作为建立辨证诊断模型部分的输入,对诊断特征信息及其规律进行分析和处理,输出为新建立的或修改后的证候诊断规则,并在通过临床验证中的信息反馈,对系统进行调整和完善,使得诊断结论正确可靠。

一个线性的数学模型来描述中西医辨病辨证的真实本质。而人工神经网络及数据挖掘技术的独特优势,能够有效处理复杂系统中杂乱无章的海量数据,并能够寻找规则,为中西医证候建模提供了一条新的技术路线。结合中西医辨病辨证诊断理论,采用专家推理与改进自适应谐振理论模型(MART2)以及增强型决策树(EID3)算法相结合的方式,对由中西医问诊仪、舌象仪、面色仪、脉诊仪和穴位仪采集、量化后的高维中西医数据进行仿真训练,建立中西医证候的辨病辨证模型(Fig.5.4.)。

Fig.5.4  TCM-based Intelligent Diagnosis Module(华式智能化诊断模块)

ID3算法是Quinlan提出的一种基于信息熵的决策树学习算法。作为最经典的决策树算法,ID3算法具有许多优点:首先,由于搜索空间是完全的假设空间,目标函数必在搜索空间中,不存在无解的问题;其次,每一条从根结点到叶子节点的路径即对应一条IF-THEN规则,易于理解;同时,由决策树自顶向下可以很清晰的看出各属性对分类的重要程度。适合应用于中医样本的数据分类问题。该算法存在不足,在计算信息增益时算法会偏向取值最多的属性,不一定最优;抗噪声的数据干扰能力不够强。针对ID3算法缺陷,本系统对其进行了改进,使原有算法在决策属性的挑选以及在“空枝问题”上得到改善,并且赋予算法自训练学习能力,形成增强型ID3算法,即EID3算法。ART2模型是Carpenter和Grossberg提出的一种神经网络模型,在解决日益复杂的数据分类问题时,凭借其优秀的可塑性与稳定性两全且可动态在线学习的独特优点备受关注,并进行了许多相关研究。该经典模型对样本进入训练的先后顺序很敏感,具有先入为主的缺陷,且对非标准化数据存在错误学习分类的问题。因此,本系统对其进行了改进, 解决了经典模型同相位不可分以及模式漂移等问题,提高分类算法准确性,即MART2模型,使其适用于待选分类属性过多,而训练样本数目相对不充分的中医数据训练样本集。

 

咨询体验广告
公众号广告
千方 AI 助理
评论
请先登录再发表评论!