发布网友 发布时间:2022-04-20 07:20
共1个回答
热心网友 时间:2023-07-04 01:02
指纹图谱的特征信息的分析与提取又称作数据挖掘。中药指纹图谱形象地反映了药用植物物种具有遗传特性的次生代谢“共有特征”,又由于次生代谢中地域、生长环境、采收等多种不定因素影响,具有统计学中多元随机分布的“模糊性”。数据挖掘技术就是利用模糊数学、统计学、计算机技术等建立一种同时反映这两种特征的方法,即从中药指纹图谱数据信息库中提取隐含的及有潜在应用价值、最终可理解的模式的过程。它是发现和解析中药指纹图谱潜在信息的有力工具,目的是评价和控制中药质量及研究中药定量组效关系(quantitative composition-activity relationship,QCAR);包含三个过程;
中药指纹图谱 获得信息化后的指纹图谱,需要研究如何来利用这些信息,即实现指纹图谱知识化。指纹图谱知识化包括信息解读、比较和判断,化学信息和药效信息相关性研究和信息的利用,即从大量指纹图谱数据中得到有关规律和知识。采用的方法有聚类分析、模式判别、关联度分析、人工神经网络等。
(1)聚类分析
聚类分析就是根据一定的规律和要求,对研究的对象进行分类。其基本思路是用“相似度”来衡量样品之间的亲疏程度,并以此来实现分类。通常将相似度大的样本归为一类,相似度小的样本归为不同类。对于不同批次的中药样品其色谱指纹图经计算机快速辨识处理可依据样品批与批之间的相似度,确定中药样品批间的稳定性。
模糊聚类分析的基本步骤如下:
A. 计算样品之间的相似度,并将其构成模糊相似关系矩阵R。在由m个己量化的指纹特征组成的m维空间中,可用多种方法定义样品之间的相似度。如:相关系数法、最大最小法、算术平均最小法、几何平均最小法、绝对指数法、广义夹角余弦法、马氏距离法、欧氏距离法等。
B. 用上述方法建立起来的模糊相似关系矩阵R,只有自反性和对称性,而没有传递性,需要将模糊相似关系矩阵R改造为模糊等价关系矩阵R`,再进行分类。
C. 取一定M值,作等价矩阵的截矩阵,依据取值的不同得到动态聚类谱系图。
(2)模式判别
模式判别的基本思路是先建立标准样本模式的色谱指纹图谱,然后对未知模式(待鉴定样品)色谱指纹图谱进行计算机解析,依据其与标准样本模式的“隶属度”、判别未知模式的真伪及优劣。
(3)关联度分析
众所周知,衡量药品质量的终极标准是药效。采用化学分析方法控制药品质量是一种间接的质量控制手段。一般来说,西药是成分单一的化合物或化学成分明确的混合物,这些化学成分的性质和数量决定了药品的疗效,因此定性和定量地控制这些化学成分就可全面地控制药品的内在质量。但中药与西药不同,中药相当于一个大复方,其成分多而复杂,大部分中药的化学成分不完全明确,某些已知成分并不能代表中药的全部疗效,因此传统的质量控制模式即单一成分的定性与定量难以控制药品质量。就中药指纹图谱而言,也存在着指纹图谱与药效相脱节的问题。所谓关联度,是指两个系统或两个因素间关联性大小的量度。关联度描述了系统发展过程中因素间相对变化的情况。如果两者在发展过程中相对变化基本一致,则认为两者关联度大;反之,两者关联度小。
(4)人工神经网络
随着模式识别理论的发展,人工神经网络的实践也得到了迅速的提高,在诸多领域都有广泛应用。1990年以来,人工神经网络在中药研究领域逐渐得到了应用。与经典模式识别相比,神经网络法更接近人脑思维过程,具有自组织性和容错性的优点。神经网络的结构和学习算法已有很多种,在中药指纹图谱中用到的主要有BP(反向误差传播),自适应神经网络(ART),自适应线性机(MBL)及模糊神经网络(FANN)。
(5)其他
实现指纹图谱知识化的方法还包括峰重叠法、夹角法、决策树,遗传算法及近邻算法等。近来又出现了几种相似度计算的方法。 将从药材、中间体直至最终产品的大量指纹图谱汇集成数据库,采用数学方法比对等,就能确定各个峰之间的相关性,从而做到对整个生产过程实现“全过程质量管理”,而对基础研究和新药开发,则可实现全过程化学成分群的表征。再加上*信息(HPLC/PDAD/MS/MS)的指纹图谱,对整个研究而言存在大量信息需要处理,建立指纹图谱智能数据库,就能较好的解决此类问题。