王旭文
(南京邮电大学 通信与信息工程学院,江苏 南京 210003)
摘要:复杂度理论已成为研究生理电信号的热点,而符号转移熵是一种反映系统混乱程度的非线性指标。文章在原有多变量转移熵的基础上提出了多变量符号转移熵,对传统时间序列静态划分方法做出了改进,即将时间序列使用动态自适应分割的方式进行符号化。应用该算法对正常人和冠心病患者的心电信号进行分析,在实验中选取最佳的导联对,结果表明该算法能够显著区分正常人和冠心病患者,对原始心电时间序列叠加上高斯噪声后依然可靠有效。
关键词:生理电信号;多变量符号转移熵;动态自适应分割
中图分类号:TN911.23文献标识码:ADOI: 10.19358/j.issn.16747720.2016.23.017
引用格式:王旭文. 基于多变量符号转移熵的心电信号研究[J].微型机与应用,2016,35(23):59-61,68.
0引言
人体最重要的生理信号就是电信号,电信号会随着时间的变化而产生瞬时的变化,这是因为人体的生理状态和病理状态是不同的。符号转移熵作为一个生理电信号特征,在生理电活动信号的特征提取与分析中发挥了越来越重要的作用[1]。
从临床医学方面来说,心电信号是心脏电活动体表的综合反映,因此,临床心电图检验对于检测和诊断心脏疾病有着十分重要的意义,并且对生命信息科学也有着十分重要的研究价值。
本文首先提出多变量符号转移熵算法,该算法主要用来分析心电信号的多变量符号转移熵值,采用自适应动态化方法划分时间序列[2]。然后通过正常人与冠心病患者的心电数据对比,传统算法与所提算法对比,以及叠加与不叠加高斯噪声对比,表明所提算法具有良好性能[3]。
1多变量符号转移熵
1.1多变量转移熵
测量时间序列复杂性的一种主要方法就是熵,熵具有使用简单、计算速度快、抗噪性能好等优势。转移熵是基于选择信息理论测量,它共享了一些有用的互信息之间的性质,同时还将动力学信息传输考虑在内。但它涉及到无穷向量,很难可靠地估计高维变量。针对这个问题提出了多变量转移熵算法:给定一个平稳多元离散时间随机过程X,其子过程为Y,Z,W…,在时间t时刻的值为Xt,Yt…。它们的过去时刻过程定义为X-t=(Xt-1,Xt-2,…)和Y-t=(Yt-1,Yt-2,…),并把Y-t作为X-t的一个子集。转移熵ITEX->Y=I(Y-t;Zt|X-t\Y-t)是在已知条件X-t\Y-t下,Y-t到Zt的不确定度。在多变量转移熵的公式中存在两个无限维的成分:X-t和X-t\Y-t。
1.2原始序列符号化
符号动力学是研究符号动力系统的一种复杂抽象的数学理论。在符号动力学系统中,系统的状态可以表示成有限个抽象符号的无穷序列。
符号时间序列分析方法是指把原始的时间序列转化成由若干个符号组成的时间序列,然后进行分析的一种“粗略”方法[4]。在把原始时间序列符号化的进程中,时间序列会不可避免地失去一部分细节信息。尽管失去了一部分的细节信息,原始时间序列的动力学特征还是保存了下来。在计算中使用符号化后的符号序列来代替原始的时间序列,会极大地提高计算数值的速度。
对原始时间序列进行符号化分析的过程中,最关键的是采取什么样的方式来对原始时间序列的值划分相应的符号区域,然后把原始时间序列转化成符号序列,有些符号动力学分析方法首先采用静态范围来划分符号区域,然后再进行符号的转化。
因为多变量转移熵算法对其中的参数有比较高的协调性要求,而且对噪声也是比较敏感的,因此又引入了基于符号化技术的新办法,形成多变量符号转移熵[5],即将序列X转换成符号序列S=s1,s2,…,si,…,sn,si∈A(A=0,1,2,3),序列Y转换成符号序列J=j1,j2,…,ji,…,jn,ji∈A(A=0,1,2,3),序列Z转换成符号序列K=k1,k2,…,ki,…,kn,ki∈A(A=0,1,2,3)。
1.3改进的多变量符号转移熵
在过去的20年,许多传统的算法都可以用来估计时间序列的复杂性,如维度和Lyapunov指数等。这些算法虽然都能够正确地估计复杂性,但是它们通常都需要很长的数据集来统计结果,不便于在临床上研究和应用。
使用动态自适应的方法来划分原始时间序列能够更精确地捕捉时间序列中的动力学特征。动态自适应划分方法如下:
对于一个N点的时间序列u:u={u(i):1≤i≤N}。对于时间序列u(i),在时间序列中嵌入m维相空间:
其中m是嵌入维数,L是时间延迟。当时间延迟L选取为1时,m维向量的个数是N-m+1。对于任意一个m维向量,基本尺度BS是通过m维向量相邻两点之间差值的均方根计算的:
基于基本尺度,划分的标准可以看做α×BS(i)。将任一m维向量X(i)转换成符号化序列S(X(i))=s(i),s(i+1),…,s(i+m-1),s∈A,A∈(0,1,2,3)。符号转换过程为:
其中,i=1,2,3,…,N-m+1,k=0,1,2,…,m-1。x是m维矢量X(i)的均值,BS(i)是第i个m维矢量的基本尺度,符号0,1,2,3用来标志所有的区域,这个值没有划分的意义。α是一个特殊的参数,在将原始时间序列转化为符号序列期间,如果α的值过大,那么将会丢失详细信息,不能捕捉动态信息;若是α值过小,会使时间序列受到比较明显的噪声影响。在本文中,α值的选择使用的是Wessel测试的方法。示意图如图1所示。
改进的多变量符号转移熵是指原始时间序列使用动态自适应进行划分,然后对符号化后的序列,利用多变量符号转移熵进行分析[6]。
2基于改进算法的心电信号分析
2.1实验数据
使用从医院临床诊断中采集得到的正常人与冠心病患者的原始心电信号的时间序列。该库中记录了包括12个导联信号(Ⅰ,Ⅱ,Ⅲ,aVR,aVL,aVF,V1,V2,V3,V4,V5,V6)的多参数脑电数据,该信号的记录长度均大于1 min,采样周期为512 Hz。
从正常人的心电数据和冠心病患者的心电数据中分别随机选取20个人的心电数据。选用的数据是分别从正常人心电和冠心病患者心电数据中取aVL、aVF、I 3个导联信号,即在已知I的条件下,计算aVL→aVF的多变量符号转移熵(由实验证实,aVL、aVF、I导联具有较好的区分度,故选择aVL、aVF、I导联作为研究对象)。将这两组数据分别记为样本“正常”及样本“冠心”。
2.2实验方法
首先读取各组原始数据中有效的心电时间序列,对原始心电数据进行符号化处理,然后对符号化后的时间序列计算其多变量符号转移熵值,对计算出来的结果使用SPSS统计分析软件进行显著性查验来验证该算法的有效性[7]。
2.3实验结果与分析
从“正常”与“冠心”样本中对每个个体的脑电信号序列每隔一个周期取一个点,取出全部的心电时间序列。对已经取出的心电时间序列,取长度为L=160的原始心电时间序列来计算心电数据的多变量符号熵。
对每个时间原始序列作符号化处理,计算每组时间序列长度为160的多变量符号转移熵值,并把计算的每个个体中的各个多变量符号转移熵值取平均作为这个个体最终的符号转移熵值。最后对这20个正常人和20个冠心病患者的多变量符号转移熵值进行平均,得到转移熵值。结果如图2所示。
由图2知正常人和冠心病患者在不同的导联组下心电信号的多变量符号转移熵的结果比较(横轴坐标表示的含义是:1—Ⅲ-> aVR |I, 2—aVL ->aVF|I, 3—V1-> V2|I, 4—V3-> V4|I, 5—V5-> V6|I)。在5组导联信号中,计算正常人与冠心病患者心电信号的多变量符号转移熵中导联aVL和导联aVF在导联I条件下多变量符号转移熵值的差值最大,由此可见信号区分度最好,所以取aVL和aVF以及I导联组数据作为分析对象。
对正常人与冠心病患者的心电信号的多变量符号转移熵值进行基本研究后,根据平均值与方差绘制成图,如图3所示。
使用SPSS统计分析软件对提出的算法的准确性及有效性进行进一步验证,将计算结果进行独立T检验分析[8]。结果如表1所示。
由表1可知,t=3.163,Sig=0.003<0.05, 这说明正常人与冠心病患者心电信号的多变量符号转移熵的差异性非常显著,该算法可以有效地区分正常人与冠心病患者。
对样本“正常”和“冠心”的心电数据采用传统符号化计算的多变量符号转移熵和改进的多变量符号转移熵比较,分析对比结果如图4所示。
图4表明无论是正常人还是冠心病患者,改进算法的熵值均大于传统算法的熵值,而且可以有效区分正常人和冠心病患者,说明改进的多变量符号转移熵在心电信号上优于传统的多变量符号转移熵。
对原始的心电时间序列叠加上高斯白噪声后[9],使用改进多变量符号转移熵算法计算正常人及冠心病患者心电信号的多变量符号转移熵值,与未叠加高斯噪声的多变量符号转移熵值对比,结果如图5所示。
由图5可知,叠加上高斯白噪声后正常人及冠心病患者的多变量符号转移熵值并没有太大的变化,这说明改进的多变量符号转移熵算法稳健性高。
3结论
本文提出的多变量符号转移熵算法,目的是为了计算电信号原始时间序列的多变量符号转移熵值,来区分正常人及患者。应用多变量符号转移熵在心电信号上,能实现预想的效果,对心电信号的研究及临床辅助诊断都有很大的帮助。
但是,该算法还有很多的不足和改进空间。一方面,多变量符号转移熵可以应用在更广泛的生理信号领域,比如脑电信号;另一方面,理论研究还需要与实际临床医学疾病的诊断和医治进行更为密切的结合,进一步提高算法和研究的实际应用价值及可操作性。
参考文献
[1] 王俊. ECG 信号的非线性特性研究[D].南京:南京大学, 2005.
[2] WESSEL N, ZIEHMANN C, KURTHS J, et al. Shortterm forecasting of lifethreatening cardiac arrhythmias based on symbolic dynamics and finitetime growth rates[J]. Physical Review E Statistical Physics Plasmas Fluids & Related Interdisciplinary Topics, 2000, 61(1):733-741.
[3] 宋爱玲, 黄晓林, 司峻峰,等. 符号动力学在心率变异性分析中的参数选择[J]. 物理学报,2011,60(2):120-127.
[4] 曹雪虹,张宗橙.信息论与编码[M].北京:清华大学出版社,2004.
[5] 井晓茹.基于符号转移熵和平均能量耗散的睡眠分期分析[D].南京:南京邮电大学,2012.
[6] FERNANDO L D S.EEG and MEG:relevance to neuroscience[J]. Neuron, 2013, 80(5):1112-1128.
[7] FEIGE B, VODERHOLZER U, RIEMANN D, et al. Independent sleep EEG slowwave and spindle band dynamics associated with 4 weeks of continuous application of shorthalf life hypnotics in healthy subjects[J]. Scandinavian Journal of Public Health, 1999, 110(11):1965-1974.
[8] 陈志云, 袁华萍, 李敬红,等. 动态心电图学在现代诊疗中的进展[J]. 中国医学文摘:内科学, 2004(1):100-101.
[9] 陈天华, 韩力群, 郑彧. 心电信号噪声的数字滤波研究[J]. 微计算机信息, 2008,24(18):252-254.