作者:黄忠浩 字数:2576 点击:

在医学图像领域,每种医学成像设备的成像原理和运行机制都会有所不同,最明显的问题就是任何一种图像都并不能提供医学诊断需要的所有信息,这样造成任何一种成像方式的图像都有很大的局限性和不完整性。

在这种情况下,为了提高疾病诊断的准确率,需要综合利用多种设备的多种图像。

根据医学图像所提供的信息,可以将医学图像分为两大类:解剖图像(CT、MRI、X线、超声图像等)和功能图像(PET、SPECT等)。

这两类图像都各有优缺点,如果能实现解剖图像和功能图像合并(例如现在最常使用的CT与PET图像的融合),那诊断效果会得到极大程度地提升,而能顺利解决这个问题的技术就是图像融合技术。

但是,医学图像融合与普通图像融合不同,不能盲目地进行,需要有理论有根据地进行,并且融合后的图像要进行图像质量评价和分析,得出正确的诊断信息和较高的融合效果。

在医学图像融合问题的评价过程中,我们可以利用两类方法进行图像处理和评价,包括主观定性法和客观定量法。

主观定性法主要以人作为观察者,对图像进行定性测试,但由于人会受到诸多因素的影响,例如环境、情绪、喜好和状况等会明显影响图像处理和评价,因此主观定性法有明显的人为性、不全面性[1]和不准确性。

客观定量法则是以数学运算作为基础,通过定量测量、分析数据的方法得到可靠可信的结果来处理和评价图像,而这个方法现在主要依靠计算机处理和评价。

可以看出,这两种方法各有利弊。因此,在实际工作过程中,往往是采取主观定性法和客观定量法相结合的方案,既便于工作人员测试又便于让计算机处理。

2 熵

评价图像融合质量的时候,会用到“熵”这种定量分析方法。

图像的“熵”主要是针对图像里所包含多少信息而言的,因此信息熵是一种衡量图像信息程度的重要参数,其值表示的是图像中所包含的信息量多少。

根据科学家Shannon定义的理论,“熵”说明的是规定范围内表现特定数量的信息所必需的最小数据量。

如果数据量没有达到“熵”定义的数值就可能不能完整地表现图像信息,从而造成图像信息丢失。

相反地,如果数据量超过“熵”定义的数值,则图像会产生数据冗余,这也是本文要论述的两个概念。

假设给定一幅图像I,则I的信息熵表示如下(此公式在信息技术界很有名):

此公式中,H是熵,i是灰度级,k是灰度级总数,p(i)是图像I中第i级灰度占整个图像的概率。

我们从信息熵的定义中可以得出如下结论:

如果两幅图像进行图像融合处理后,最终的处理结果中信息熵在增大,这就说明图像融合后的信息量是在增加,,反之亦然。

除了熵以外,在医学图像融合处理时还会用到另外一个概念是交叉熵,也称为相对熵,是用来反映两幅图像灰度分布信息的差异,交叉熵的值越小,说明两幅融合图像从原始图像提取出来的信息量增加,融合效果越好。

关于这个概念在这里就不再叙述,读者可以查阅相关文献。

3 冗余

熵的数值是图像能达到的最好效果,而实际的图像并达不到这种理想状态,所以任何一幅医学图像都会产生冗余。

未经压缩的医学图像数据量大,冗余多,因此大部分采集到的原始图像都要进行数据压缩,这样可以降低数据冗余,因此压缩算法的好坏对于图像来说就显得至关重要。

未经压缩的原始图像是以定长的二进制码的形式来表示的,这种编码的最小长度lm取决于给定的图像的大小n。

公式如下:

其中,n是图像数据的大小,[]表示的是向上取整数。

而计算图像中的冗余的方法是信息熵H与原始数据实际大小lm的比与1的差值,表示为:

对于数字图像来说,虽然可以使用压缩比率来表示压缩图像,但经常使用的概念是比特率,其单位是bpp。

下面举例说明一下冗余问题。

一幅图像4个灰度级的图像I(真正的图像远大于这个灰度级,为了降低运算量,我们把问题简化一下),灰度级的分布概率统计结果如下表所示:

4 编码

所谓熵编码指在数据熵或接近数据熵的时候所进行的信息无损压缩编码。

编码的基本思想是:

首先确定和描述数据冗余,然后对数据中的信息进行编码,最后给每个符号分配一个不同的编码。

每个编码的大小取决于各个符号各自出现的概率。总体来说,最常用的符号编码最小,而最不常用的符号编码最大,这些编码产生的方式取决于编码算法。

相关算法在业界有很多种,最常用的是Huffman编码。

Huffman算法通过对信号源符号的递归排序来产生自己的编码字母表,并根据得到的概率分布构建二叉树。

具体算法如下:

(1)循环。

(2)符号概率分布按降序排列。

(3)将概率最低的两个符号合并,建立一个分支并生成一个新的符号表,对每个分支而言,两个合并符号中的每一个都分配一个二进制数值,数值0给倒数第一个符号,数值1给倒数第二个,在循环中逐渐建立起二进制编码表。

(4)循环执行直到树的根部。

5 总结

任何医学图像在采集、处理、融合过程中,产生数据冗余是必定的,而熵公式所计算出来的数值只是理想情况。

对冗余进行降低和压缩处理是医学图像融合技术的重点,降低数据冗余后的医学图像再进行融合,得到的结果可以增加医学图像的信息量,降低无用途信息产生的几率,从而让医学图像融合达到比较好的结果。

参考文献

[1]Biomedical Information Technology[澳]冯大淦编,朱志良等译,科学出版社;

[2]C.E. Shannon, A mathematical theory of Communication, Bell System Technical Journal, 27:379-423,623-656, 1948;

[3]A .K. Jain, Fundamentals of Digital Image Processing, Prentice Hall,1989;

[4]D .A. Huffman, Method for the Construction of Minimum Redundancy Codes, Proceedings of the IRE 40(9):1098-1101, 1952;

[5]数字图像处理——Visual C#,NET编程与实验,机械工业出版社,孙燮华;

[6]Visual C++数字图像模式识别技术详解,冯伟兴、贺波,机械工业出版社。