采用Gene Expression Omnibus (GEO)数据集联合机器学习研究急性心肌梗死(acute myocardial infarction, AMI)的差异基因, 并预测具有调控作用的潜在成分及中药。从GEO数据库下载AMI的人类全基因组数据集(GSE66360和GSE61145), 以GSE66360作为测试集, 通过R语言的normalize Between Arrays包进行校正后, 再调用limma包获取差异基因(DEGs), 对DEGs作Gene Ontology (GO)、Kyoto Encyclopedia of Genes and Genomes (KEGG)、Disease Ontology (DO)富集分析; 采用SVM及随机森林树法筛选特征基因, 利用GSE61145数据集对得出的特征基因进行验证; 通过CTD数据库找到AMI特征基因所对应的中药成分, 利用Coremine数据库映射中药成分所对应的中药, 并依据《中药大辞典》、《中华本草》、《中国药典》等对所得中药的频次、四气、五味、归经进行汇总。通过对GSE66360数据集进行分析, 得到317个差异基因, 其中306个上调, 11个下调, GO和KEGG富集分析显示AMI的差异基因主要涉及中性粒细胞介导的炎症和免疫反应、脂代谢异常、脂质和动脉粥样硬化相关通路等, DO富集分析表明差异基因与动脉硬化性心血管疾病、肺部疾患等密切相关。通过SVM及随机森林树法得到6个特征基因: ZFP36、GADD45A、PELI1、METRNL、MMP9、CXCL16。CTD映射到成分97种, Coremine数据库映射到中药824味, 汇总后发现治疗AMI的中药以甘、苦、温为主, 多归于脾、胃、肝经。经汇总后, 调控AMI的特征基因(ZFP36、GADD45A、PELI1、METRNL、MMP9、CXCL16)成分主要有苯并[a]芘, 四氯二苯二氧芑, 对乙酰氨基酚等, 中药有茶树根、郁金、人参等, 其性味为甘、苦、温, 归经多为脾、胃、肝经。