马健
Copula熵的医学应用
2025-7-19 04:19
阅读:192

本文介绍Copula熵(Copula Entropy:CE)在医学领域的应用,涉及脑卒中、肝炎、癌症、心脏病、糖尿病、高血压、白内障、外科、中医、痴呆症、帕金森病、运动功能障碍、抑郁症、精神分裂症、注意缺陷多动障碍、癫痫症、法医和新冠等病症。

脑卒中

脑卒中(俗称中风)是全球高致死病因之一,准确的诊断有助于有效的治疗和病情管理。核磁共振成像(MRI)是脑卒中诊断的有力工具,但其复杂性给MRI数据分析构成了挑战。脑卒中对神经系统及其功能连接造成局部伤害,但是通过MRI功能连接变化的分析无法揭示病情对大脑动态功能的改变。有效连接(Effective Connectivity:EC)反映了大脑脑区之间动态的因果关系,为分析和诊断脑卒中对大脑动态功能伤害提供了有效路径。Ciezobka等[1]提出了一种结合EC有向图分析和图神经网络分类的脑卒中分类诊断方法,利用储备池计算(Reservoir Computing:RC)、格兰杰因果分析(GC)和传递熵(Transfer Entropy:TE)三种方法生成EC有向图,再利用GNN等方法对EC图进行分类,以进行病情诊断。该方法利用了基于CE的TE估计算法生成EC图。他们在圣路易斯华盛顿大学收集的脑卒中病人和健康人的MRI数据上对上述方法进行了对比,实验结果表明,基于RC、GC和TE方法生成的EC图在小样本异质性的情况下得到的分类性能大致相当。该诊断方法可以进行EC图可视化和解释,有利于将研究发现转化为临床实践。

肝炎

生物信息学(Bioinformatics)是通过算法分析基因数据(包括基因表达谱数据)来研究生命和疾病机理的新兴学科。基因表达谱是利用DNA微阵列技术在基因分子层面观察某一生命组织动态得到的数据,从而能够在基因组水平上反映生命系统的各种现象和机理。Wieczorek和Roth[2]提出了一种研究时间序列数据之间相互作用的分析方法,称为因果压缩(Causal Compression)。与传统的分析全时间序列之间的因果关系不同,该方法研究了基于定向信息(Directed Information)分解的时间序列间相互因果作用的稀疏表达,并据此给出了时序因果分割和因果二分图发现两类问题的解法。基于CE与MI之间的等价性,作者证明了该方法只与数据分布的Copula密度函数有关,并据此设计了求解方法。作者将该方法应用于NCBI数据库中的人类C型肝炎病毒感染数据(NCBI/GEO查询号:GSE7123),研究了接受了聚乙二醇干扰素和利巴韦林治疗的重组丙型肝炎病毒核心蛋白基因型1感染的基因表达谱时序数据,关注了在干扰素信号传导中具有重要交互角色的两个基因:转录子STAT1和干扰素诱导抗病毒基因IFIT3,分别生成了二者在有效救治和无效救治病人内相互作用的不同。研究发现,根据分析结果,干扰素疗法消除了大多数有效救治病人体内两种基因之间的关联,而无效救治病人体内的关联则不受影响。同时,分析表明两种病人救治前后二者之间均存在因果交互作用,但对于有效救治病人,早期的IFIT3对后期的STAT1的影响更显著,这与已有研究结论相符合。

癌症

很多疾病的发生与基因结构变异有关。拷贝数变异(Copy Number Variations:CNVs)指长度大于1kb的DNA片段的变异,在人类基因组中大量存在。作为重要的基因变异,CNVs包含了大量DNA序列、疾病点和功能单元,能为疾病研究提供线索。研究表明,多种癌症的形成和发展与不同的CNVs有关。因此,发现不同基因的CNVs与不同癌症之间的关系有助于研究癌症病因和诊断方法。从大量的CNVs的基因特征中选择出与癌症相关的特征是生物信息学的一个重要问题。Wu和Li[3]提出了一种基因选择方法,称为相关冗余和交互分析(Correlation Redundancy and Interaction Analysis:CRIA)方法,根据CNVs选择与癌症有关的基因,以用于癌症分类。CRIA方法利用了CE的多变量相关性特性,设计了基因特征交互强度度量,用于筛选与癌症类型相关性强的基因。他们将该方法应用于cBioPortal的癌症基因组数据,利用了其中的6种癌症数据,选择出了200个与癌症有关的基因。为了验证算法的有效性,他们基于亚利桑那州立大学的数据将方法与其他8种基因选择算法进行了对比,结果显示CRIA方法选择的基因能够更准确地预测癌症类型。Shang等[4]提出了一个基于CE的特征选择方法,称为CEFS+,用于高维基因数据分析工作。他们将该方法应用于3个公开的高维癌症基因数据集,将所提出的方法与同类方法进行了对比,结果表明,该方法在实验中给出了最好的预测结果,证明了该方法的优越性。

贝叶斯网络(Bayesian Network:BN)作为一种因果关系分析工具,在系统生物学的组学数据分析中越来越被广泛使用,但其具有线性假设,使其难以胜任复杂调控网络动态的分析。CE作为一种模型无关的非线性关系度量,提供了分析处理复杂高维基因数据的高效算法工具。Li[5]提出了一种将BN和CE相结合的新方法,用于构建基因调控网络,其中CE被用于对BN生成的子网络结构做进一步过滤识别,以得到最终的基因调控网络。基于6个公开的肝细胞癌测序数据集,作者将该方法应用于肝细胞癌(Hepatocelluar Carcinoma:HCC)的基因调控子网络识别问题,并将该方法与5种同类方法进行了对比。基于该方法的实验给出了一个包含12个基因和28条边的基因子网络,是所有方法中最小的子网络。作者将每种方法得到的子网络应用于三个GEO数据集,进行HCC肿瘤分类实验,以检验每种方法得到的子网络的有效性。实验结果显示,该方法得到子网络在3组分类实验中均表现最佳,平均AUC都显著高于90%。随后的差异基因表达分析进一步证实所得到的子网络基因在mRNA和蛋白质水平上被显著下调,是潜在的疾病诊断生物标志物。该方法得到的结果具有可解释性,能够增进对疾病潜在分子机制的理解,有助于识别潜在的治疗目标并开发出相应的治疗方法,有望在其他疾病的同类分析中得到应用。

人类基因组测序数据为理解疾病的生物学机理打开了一扇大门。然而基因组数据的维度远超过了测序人数,使得基因组数据分析面临维度灾难问题。理解数据并将其转化为生物医学技术需要更多新的高维统计分析工具,信息论为解决此问题提供了理论工具。传统信息论的MI和偏信息分解(Partial Information Decomposition)理论的独特信息、冗余和协同等概念可以帮助我们分析高维数据,但如何从数据估计它们是一个实际面临的难题。Lacalamita[6]提出利用基于CE的GCMI方法来估计MI和协同概念,并在此基础上提出了面向疾病预测的基因组数据分析流程方法。该方法首先利用复杂网络社区检测技术对基因进行聚类分析得到基因类簇,然后对每个类簇利用特征选择技术构建疾病预测模型,从而得到预测性能较好的基因类簇,再利用基于CE的MI和协同度量对得到的基因类簇做进一步聚类分析,得到基因子类簇,最后利用子类簇的基因进行疾病预测。他利用NCBI关于肝细胞癌(Hepatocellular Carcinoma)和自闭症谱系障碍(Autism Spectrum Disorder)的公开基因组数据验证了该方法,发现该方法可以对高维基因进行有效的筛选,同时利用协同概念聚类选择的基因要好于利用MI聚类选择的基因,表现为前者所选的基因更符合生物医学意义上的疾病机理研究结论,且得到的疾病预测性能更好。

乳腺癌是女性最常见的恶性肿瘤之一,在我国的发病率和死亡率都有逐年上升的趋势,严重威胁着女性的身体健康和家庭幸福。利用统计方法分析临床数据并构建诊断模型来辅助临床诊断决策,可以提高医生工作效率并降低误诊率,从而促进患者健康改善。付金露[7]提出采用特征选择的方法构建乳腺癌患者预后模型,采用了Lasso、CE和RFREF三种特征选择方法,分析了SEER数据库中2010-2014年的乳腺癌患者临床诊断数据,利用三种方法选择的特征分别构建了逻辑回归、随机森林、XGBoost和Stacking四种模型,用以预测患者5年生存状态。结果表明,利用CE选择的特征构建的逻辑回归模型给出了最高的预测准确率(96.84%)。

脑肿瘤是一种高致死率肿瘤,约占全身肿瘤的5%,近年来在我国发病率呈上升趋势。脑肿瘤病变具有形态多样、位置不定的特点,诊断难度大,基于无侵式医学影像的分类识别是主要的临床诊断方式。利用深度学习方法,从肿瘤医学影像提取定量特征并构建诊断模型,可以辅助医师的临床诊断,因此得到了大量的研究。如何提取和选择图像的定量特征是构建辅助诊断模型的关键问题。潘红宇[8]提出了一种此类特征选择方法,首先利用CE等相关性度量初始化特征集合,再利用灰狼优化算法以分类性能为目标优化特征集合。他利用来自重庆医科大学附属第一医院、西南医院和四川省肿瘤医院的102例具有ATRX突变的低级别脑胶质瘤患者影像数据,提取了五类共5530个影像组学特征,结果表明,相较对比方法,提出的方法在选择使用了最少(13个)的特征的情况下得到了最优的分类性能,且所选特征与ATRX突变特征状态相关,具有作为生物标志物的潜力。

心脏病

心脏病是最常见的临床疾病之一。医生已经积累了丰富的心脏病临床诊断经验,可以通过各种生理测量结果作出诊断决策。在此经验基础上开发智能临床诊断模型是业界长期追求的目标,开发此类模型的关键在于选择一组生理测量变量来构建预测诊断模型。基于著名的UCI心脏病数据集\cite{asuncion2007uci},Ma[9]提出采用CE作为变量选择方法,用以选择一组生理变量构建诊断模型。该数据集包含了来自世界四地真实的临床心脏病生理测量和诊断数据,其中13个生理测量变量被医学专家认定为是临床相关的。实验结果表明,CE方法选择出了13个临床医生认定变量中的11个变量,是对比方法中最多的,从而得到了最好的预测准确率。同时,CE方法还发现了认定变量以外其他与诊断相关的变量,为临床进一步检验提供了新的参考。

外科

主动脉瓣反流(Aortic Regurgitation)是一种常见的心脏瓣膜疾病,主要症状是在心脏舒张期,血液从主动脉回流到左心室。主动脉瓣膜置换手术是主动脉瓣反流的传统治疗方式之一。左心室射血分数(Left Ventricle Ejection Fraction:LVEF)是一项衡量心脏功能的重要指标,研究其在手术前后的改善关系可以为瓣膜置换手术时机选择和效果预测提供参考证据。Sunoj和Nair[10]利用survival copula扩展了CE概念,提出了一种称为Survival Copula Entropy(SCE)的新概念,用于衡量生存函数相关变量之间的依赖关系。他们将SCE应用于主动脉瓣置换手术临床数据,发现了手术前后LVEF之间的正相关关系。

糖尿病

糖尿病是另一种常见临床疾病。对糖尿病人的病情管理与临床诊治结果(发病率和致死率)密切相关,因此建立严格的糖尿病患者住院管理流程对其安全十分重要,这就需要对病情管理标准进行分析研究。为了评估住院患者的救治效果,美国业界建立了健康事实(Health Facts)数据集,包含了130所美国医院和救治网络的糖尿病患者的数据。基于该数据集1999至2008年的10年间101,721名住院患者的数据,Mesiar和Sheikhi[11]利用CE变量选择方法建立预测模型,用于从其他49个变量预测“是否已用药”变量,取得了良好的预测效果,在仅选择使用20个变量的情况下就获得了97.2%的准确率,增进了对用药相关变量的认识,构建了合理用药评价模型。

高血压

高血压是全球首要致死病因,对人群健康构成严重威胁。全基因组关联研究表明多个基因与高血压密切相关。已有多个研究报道I型细胞膜钙离子转运酶基因(ATP2B1)与收缩压和舒张压相关联。该基因有21个CpG位点。研究该基因及其CpG位点与高血压的关系是一个新的重要问题。Purkayastha和Song[12]提出了一种新的非对称可预测性概念,称为非对称MI(AMI),并利用CE理论给出了其估计方法。他们将该方法应用于ELEMENT数据集,分析525个年龄在10-18岁之间的儿童的数据,发现ATP2B1与舒张压相关联,证实了已有的发现;同时发现该基因的CpG位点CG17564205与舒张压相关联,且根据AMI判断,舒张压对该位点具有预测性,这一新发现表明血压可以改变位点。

白内障

白内障是眼科的常见疾病,是导致患者失明的最主要病因。白内障超声乳化手术(Phacoemulsification)是世界各国治疗白内障的首选手术治疗方式。尽管该手术已十分成熟,但临床仍然可能会导致术后角膜水肿等并发症,从而影响视力恢复并造成患者不适。构建基于风险因素的角膜水肿风险预测模型在临床十分必要。Luo等[13]提出利用CE方法构建术后角膜水肿风险预测模型,将方法应用于临床178名患者的数据,从数据的17个变量中筛选预测变量,最终将临床预测模型使用的四种变量(糖尿病、最佳矫正视力、晶状体厚度和累积耗散能量)减少为两种(最佳矫正视力和累积耗散能量),且不影响预测精度。结果分析表明,利用CE得到的预测模型具有临床应用价值,可以在保证预测性能的情况下减少预测需要收集的临床信息。

中医

脉搏波是传统中医的主要问诊方式,因其携带了复杂多样的病理信息,在一定程度上反映了心血管系统的生理状态。传统中医的诊脉主要依靠名医的个人经验,研究脉搏波数据的分析算法,对糖尿病和高血压等常见疾病的无创诊断具有重要意义,有助于传统中医的科学化发展。汤宇飞[14]提出了一种基于图卷积神经网络的多模态脉搏波诊断算法,通过将脉搏波转换为包含互补的病理信息的三通道图像,再利用ResNet提取图像特征,最后利用CE等相关度量得到反映脉搏波信号间时间相关性的邻接矩阵构建图卷积神经网络,从而进行疾病分类诊断。他在实际腕部和指尖的脉搏波数据的基础上,对高血压和糖尿病患者的健康状态进行分类,结果表明算法可以得到99%以上的预测准确率。

痴呆症

阿尔兹海默病(Alzheimer's disease,也称痴呆症)是老年人面对的主要神经退行性疾病之一,临床表现为认知能力的过度衰退等。早期筛查和诊断可以帮助痴呆症患者和家庭及早干预并管理病情发展,可以有效提高病人生活质量,降低家庭和社会成本和负担。简易精神状态量表(Mini-Mental State Examination: MMSE)是临床广泛采用的认知能力筛查工具之一。马健[15]通过利用CE分析了手指扣击运动(finger tapping)的特征和MMSE之间的关联强度,发现一组与MMSE相关联的特征,包括扣击频率(或扣击次数或扣击平均时间间隔)等。在此关联关系的基础上,他们构建了从手指扣击特征到MMSE的预测模型,取得了良好的预测效果。此预测模型有望用于痴呆症等疾病的认知能力筛查工作中。

帕金森病

帕金森病(Parkinson's disease:PD)是另一种常见的神经退行性疾病,临床表现为动作迟缓和运动功能障碍等症状。重复经颅磁刺激(repititive transcranial magnetic stimulation: rTMS)是利用脉冲磁场作用于中枢神经系统,以改善生理功能的临床治疗技术,广泛应用于神经、精神类疾病的治疗,并在近年应用于PD康复治疗的研究中,以期缓解患者症状并改善运动功能。李润泽等[16]研究了rTMS对PD患者运动症状辅助治疗的神经调控机制,利用基于CE的GCMI等方法分析了rTMS治疗前后的EEG数据,构建了脑功能网络连接矩阵并得到3种网络特征参数。实验结果表明rTMS主要改变PD患者的beta和gamma振荡,其中运动皮层的相应变化可能与运动功能改善有关。

运动功能障碍

跌倒是老年人面对的重大健康风险之一,需要科学管理和及早干预。跌倒预测是管理跌倒风险的重要手段之一。起立行走试验(Timed Up and Go: TUG)是一种主要的跌倒风险评估工具。Ma[17]提出了一种结合视频分析和机器学习技术的跌倒风险预测方法。该方法首先从老年人进行TUG测试的视频中分析出人体3D姿态信息,再由一段时间的姿态信息序列计算出一组步态特征,通过利用CE分析步态特征和跌倒风险指数之间的关联关系,选择出一组与风险关联的步态特征(包括步幅、步态速度和步态速度的方差等),最后用此特征作为输入构建跌倒风险的预测模型。该方法在真实数据上的实验显示了良好的预测效果。此分析结果也表明了步态特征反映的行动能力与跌倒风险之间的内在联系,使得模型具有临床意义的可解释性。

抑郁症

抑郁症是一种常见的情绪相关的心理精神障碍,全世界约有3.5亿名患者为此病所困扰,对其进行研究对人类健康具有重要意义。脑电图(EEG)是一种非侵入式的大脑活动电信号测量手段,广泛应用于大脑疾病的研究中。脑功能网络是在EEG信号基础上构建的反映大脑活动的功能性指标,可采用MI、相干性等多种方法构建此类网络。张婷婷等[18]提出基于相干性虚部(Imaginary part of Coherency)构建的脑网络连通性指标来研究抑郁症患者识别问题。他们利用CE、Relief过滤等特征选择方法对脑电网络连通特征进行选取,发现利用CE和Relief过滤联合得到的相干性在线反馈指标特征集合能够有效区分抑郁症患者和健康人群。

精神分裂症

精神疾病是由心理、生理和社会环境等因素导致的大脑功能紊乱,如精神分裂症、双相型障碍、注意缺陷多动障碍等。大量研究表明,这些疾病可能具有一个共同的精神病理学模式,因此跨疾病的病理学分析就变得十分重要。功能核磁共振成像(fMRI)作为非侵入的脑活动检测方法可以提供大脑脑区多频段的大脑活动信号,进而推断脑功能连接网络,用于疾病机理和诊断方法研究。然而,传统的脑功能网络大多基于脑区间的线性关系,而大脑神经活动则呈现非线性动态性特征,需要设计能够具有非线性关系检测能力的脑功能网络生成方法。Han等[19]提出了一个基于变分模式分解(VMD)和CE的多频段分解熵(Multi-frequency Decomposition Entropy:MDE)方法,用以从fMRI时序数据推断非线性脑功能连接网络。其中,VMD用于对脑区的fMRI时序信号进行频率模态分解,而CE则用于计算不同模态上脑区之间的非线性关联强度矩阵,最后基于此矩阵选出具有强关联的成对脑区关系。他们将该方法应用于openfMRI精神疾病脑成像公开数据集,其中包含了精神分裂症、双相型障碍、注意缺陷多动障碍和健康人的样本数据。研究发现,该方法得到的三种疾病的病人和健康人的网络关系具有明显的不同,且每一种疾病的网络都具有自己独特的特征,因而具有作为疾病生物标记物的潜力。作者将MDE方法生成脑功能连接网络与线性方法生成的网络进行了对比,发现基于CE非线性度量的MDE方法能够检测到病人和健康人之间网络上的差异,而传统线性方法则不能在网络上检测到差异,验证了该方法的优越性。

注意缺陷多动障碍

建立神经信号之间的因果关系对理解脑连接至关重要,因果关系连接反映了在脑认知过程中脑网络内部不同区域之间的信息传输方向,刻画了大脑认知过程的脑区之间动态关系特征。相比于传统的格兰杰因果检验,无模型假设的TE更适合此类因果分析任务。Redondo等[20]基于CE理论提出了一种新的TE概念,称为STE(Spectral Transfer Entropy),用于计算频域滤波后的时域信号之间的TE。与直接在原始信号上计算TE相比,在特定频域上计算的STE更具有神经学意义的可解释性。他们将方法应用于注意缺陷多动障碍(ADHD)患者EEG信号的分析,利用STE构建因果关系脑连接网络,发现了ADHD患者与健康人之间与注意力相关的脑连接网络连接的不同。实验结果表明,健康人在与注意力和受控记忆存取相关的θ和α频段表现出明显的因果联系,而ADHD患者的脑网络连接则主要在σ振荡上,可解释为与注意力缺陷有关。

癫痫症

大脑神经系统在执行任务期间,各个脑区的信息处理活动是作为一个整体来协同进行的。相位同步(Phase Synchronization)是指大脑活动期间各个脑区神经信号在时序结构上的关系。传统的相位同步研究关注于成对脑区之间的关系描述,而全局相位同步(Global Phase Synchronization)则关注于多个脑区神经信号之间的同步强度。Li等[21]提出利用CE计算多变量MI来估计GPS并检测脑网络结构。他们首先利用Rōssler模型将该方法与其他同类方法对比,证明了其能够更好地估计网络中的GPS强度。然后,他们将该方法应用于颞叶癫痫症病人的SEEG信号数据的分析,发现癫痫的终止伴随着GPS强度和脑区整合度的增加,与已有的研究结论相符合。

法医

法医DNA分析是法医医学领域的热点前沿技术之一,是指基于DNA遗传信息和人体表型特征之间的对应关系分析,从生物样本的DNA检验信息对DNA来源人表型特征(如身高、年龄等)进行刻画预测,为案情分析和身份鉴别提供线索和证据。身高是法医学关心的重要生物特征,基于DNA分析推断人身高是法医学关心的重要问题之一。DNA甲基化(DNA methylation)是重要的表观遗传学现象,很多研究表明了DNA甲基化与身高之间存在联系。因此,利用DNA甲基化位点预测身高特征是一个值得研究的问题。王中华[22]研究了基于DNA甲基化位点预测身高的问题。他首先利用公开数据证实了DNA甲基化与身高之间的联系,并筛选了相关位点集合,再基于招募人群的测序数据利用机器学习方法构建了基于所选位点的身高预测模型,得到了较为精确的预测性能(预测误差约为4.5cm)。其中,他利用CE等方法分析估计了不同性别对应的所选位点与身高之间的相关性,发现甲基化特征与身高的相关性存在性别差异,这种差异符合人体生长发育过程的性别异质性,同时也在模型预测实验结果中得到了体现,从而表明了基于性别构建不同身高预测模型的必要性。与之相对照的是,基于线性Pearson相关系数的分析没有发现这种性别差异性,说明了CE作为非线性相关性度量的优越性。

新冠

流行病是公共卫生学的重要话题,流行病患者的及时诊断对控制流行病的传播至关重要。感染了流行病毒的病人往往伴有发热等症状,很难与正常的发热病人进行区分。目前正在流行的新型冠状病毒患者就具有这样的发热症状,基于临床数据开发能够区分病毒感染者和正常流感病人的技术成为一个紧迫的问题。然而,相关的症状有10几种,如何选择合适的变量集合成为研究成功的关键。Mesiar和Sheikhi[11]基于CE变量选择方法,利用真实的临床数据,分析了新冠患者诊断相关的19种症状变量,发现年龄、疲劳和恶心呕吐是最重要的诊断变量,可以使诊断达到85%的诊断准确率,如果将诊断变量增加到15个,准确率可以提高到91.4%。

更多Copula熵的理论和应用,请参考我们在ChinaXiv的综述论文

参考文献

1. Wojciech Ciezobka, Joan Falcó-Roget, Cemal Koba, and Alessandro Crimi. End-to-End stroke imaging analysis using effective connectivity and interpretable artificial intelligence. IEEE Access, 13:10227–10239, 2025.

2. Aleksander Wieczorek and Volker Roth. Causal compression. arXiv preprint arXiv:1611.00261, 2016.

3. Qiang Wu and Dongxi Li. CRIA: An interactive gene selection algorithm for cancers prediction based on copy number variations. Frontiers in Plant Science, 13:839044, 2022.

4. Shilong Shang, Dongxi Li, Xiaoran Yan, and Yun Dang. CEFS+: An efficient and interactive feature selection approach based on copula entropy for high-dimensional genetic data. SSRN:5014010, 2024.

5. Jing Li. Advanced Computational Framework for Dissecting Gene Regulatory Dynamics in Complex Diseases: Hepatocellular Carcinoma. PhD thesis, University of Liverpool, 2024.

6. Antonio Lacalmita. Integrazione di approcci di intelligenza artificiale e reti complesse per l’analisi dei dati genomici e la scoperta di biomarcatori in malattie complesse. PhD thesis, Università degli studi di Bari, 2025.

7. 付金露. 基于特征选择的乳腺癌患者预后模型研究. 硕士学位论文, 江西财经大学, 2023.

8. 潘红宇. 基于影像组学与深度学习的脑肿瘤图像分类研究. 硕士学位论文, 西南大学, 2023.

9. Jian Ma. Variable selection with copula entropy. Chinese Journal of Applied Probability and Statistics, 37(4):405–420, 2021. See also arXiv preprint arXiv:1910.12389, 2019.

10. S.M. Sunoj and N. Unnikrishnan Nair. Survival copula entropy and dependence in bivariate distributions. REVSTAT-Statistical Journal, 23(1):101–115, 2025.

11. Radko Mesiar and Ayyub Sheikhi. Nonlinear random forest classification, a copula-based approach. Applied Sciences, 11(15):15, 2021.

12. Soumik Purkayastha and Peter X.K. Song. Asymmetric predictability in causal discovery: an information theoretic approach. arXiv preprint arXiv:2210.14455, 2022.

13. Yu Luo, Guangcan Xu, Hongyu Li, Tianju Ma, Zi Ye, and Zhaohui Li. Research on establishing corneal edema after phacoemulsification prediction model based on variable selection with copula entropy. Journal of Clinical Medicine, 12(4):1290, 2023.

14. 汤宇飞. 基于脉搏波的糖尿病和高血压诊断算法研究. 硕士学位论文, 中国矿业大学, 2023.

15. Jian Ma. Predicting MMSE score from finger-tapping measurement. In Proceedings of 2021 Chinese Intelligent Automation Conference, pages 294–304, 2022. See also bioRxiv 817338 (2019).

16. 李润泽, 姚尧, 冯珂珂, 杨硕, 李佳丽, 程轶峰, 尹绍雅, and 徐桂芝. 重复经颅磁刺激改善帕金森病运动症状的脑功能网络分析. 生物化学与生物物理进展, 50(1):126–134, 2023.

17. Jian Ma. Predicting TUG score from gait characteristics based on video analysis and machine learning. In Proceedings of 2023 Chinese Intelligent Automation Conference, pages 1–12, 2023. See also bioXiv 963686 (2020).

18. 张婷婷, 王楠, 周天彤, 王苏弘, and 邹凌. 基于 Couple 熵的抑郁症相干性反馈指标提取. 电子测量技术, 45(9):160–167, 2022.

19. Di Han, Yuhu Shi, Lei Wang, Yueyang Li, and Weiming Zeng. The multi-frequency decomposition entropy learning for nonlinear fMRI data analysis. IEEE Transactions on Neural Systems and Rehabilitation Engineering, 33:68–80, 2025.

20. Paolo Victor Redondo, Raphaël Huser, and Hernando Ombao. Measuring information transfer between nodes in a brain network through spectral transfer entropy. arXiv preprint arXiv:2303.06384, 2023.

21. Zhaohui Li, Yanyu Xing, Xinyan Wang, Yunlu Cai, Xiaoxia Zhou, and Xi Zhang. Estimating global phase synchronization by quantifying multivariate mutual information and detecting network structure. Neural Networks, 183:106984, 2025.

22. 王中华. 人类身高的表观基因组关联分析和基于 DNA 甲基化构建成人身高推断的深度神经网络模型. 博士学位论文, 河北医科大学, 2024.

转载本文请联系原作者获取授权,同时请注明本文来自马健科学网博客。

链接地址:https://wap.sciencenet.cn/blog-3018268-1494314.html?mobile=1

收藏

分享到:

下一篇
当前推荐数:0
推荐到博客首页
网友评论0 条评论
确定删除指定的回复吗?
确定删除本博文吗?