期刊简介

本刊为中国医药生物技术协会会刊,是面向全国医药生物技术研发、应用、产业化、市场管理的综合性学术刊物,国内外公开发行(CN 11-5512/R,ISSN 1673-713X)。办刊宗旨是及时全面地反映我国医药生物技术研发成果和行业动态,积极推进医药生物技术研发及产业化发展。主要栏目有述评、论著、法规与标准、研发/质量管理与控制、产业/企业家论坛、会议纪要、综述、讲座、继续教育园地、争鸣园地等。欢迎踊跃投稿和订阅。

往期目录

首页>中国医药生物技术杂志
  • 杂志名称:中国医药生物技术杂志
  • 主管单位:中华人民共和国卫生部
  • 主办单位:中国医药生物技术协会
  • 国际刊号:1673-713X
  • 国内刊号:11-5512/R
  • 出版周期:双月刊
期刊荣誉:中国期刊全文数据库(CJFD)期刊收录:上海图书馆馆藏, 万方收录(中), 国家图书馆馆藏, 知网收录(中), 统计源核心期刊(中国科技论文核心期刊), 维普收录(中)
中国医药生物技术杂志2009年第03期

主成分分析在基因芯片聚类分析中的适用性评估

马宁;张正国

关键词:主成分分析, 寡核苷酸序列分析, 聚类分析, 计算生物学
摘要:目的 探讨在基因芯片聚类分析前对数据进行主成分分析是否有助于提高聚类的准确性.方法 选取3组包含大量被生物学家人为分类基因的芯片数据集Budding yeast、Saccharomyces cerevisiae、Centralnervous system作为实验数据,分别计算对原数据直接聚类和提取主成分后聚类的结果,并以信息变化量为指标衡量这些结果与人为分类的匹配度.采用启发式算法搜寻优主成分组合,比较欧几里德距离和相似系数2种距离度量方法以及层次聚类和K-重心聚类2种聚类算法的结果.结果 在3组数据集中,层次聚类算法相比K-重心聚类算法效果均略好,且以主成分代替原数据进行聚类分析都没有显著提高聚类的准确性,有些情况下甚至不如后者.仅在Saccharomyces cerevisiae数据集中,当主成分个数足以覆盖原数据中90%~95%方差时,特定的主成分组合才展现出一定优势,但这种组合与主成分大小顺序并无规律可循.结论 在基因芯片数据模型不清时,应避免盲目地使用数据中提取的主成分作为聚类分析的输入.