近日,我院肖香教授、范松涛讲师在Top期刊《Journal of Agricultural and Food Chemistry》(Q1,IF2024:6.2)上发表综述论文“Recent Advances in Integrating Machine Learning with Omics Approaches in Food Science and Nutrition Research”。

文章链接:https://pubs.acs.org/doi/abs/10.1021/acs.jafc.5c08522
组学技术通过高通量解析食品成分与微生物群落,系统揭示其与人类健康的复杂关联,正引领食品与营养研究的范式变革。机器学习已成为高通量组学数据的分类、聚类、降维及模式识别分析的关键工具,在食品加工、安全和营养干预预测方面展现出独特价值。本文系统探讨了食品和营养研究中的基因组学、转录组学、蛋白质组学、代谢组学和多组学(图1),以及经典机器学习、深度学习和人工神经网络算法的应用。机器学习与组学相结合的核心优势在于解析复杂数据集以赋能食品质量评估与精准营养干预,但仍面临数据质量、模型可靠性和可解释性等挑战。

图1 组学技术在食品组学和营养组学中的应用。
机器学习凭借其卓越的模式识别、预测建模及高维数据处理能力,已成为从复杂组学数据中挖掘关键特征的核心工具。如图2所示,它的应用遵循一个结构化流程:数据预处理(收集、清洗、标准化)、特征选择(筛选关键生物标志物)及模型训练与验证(算法选择、参数调优与性能评估)。最终构建的稳健模型能够精准识别生物标志物并预测其功能,从而为个性化营养干预提供数据驱动的决策支持。

图2 机器学习在组学数据分析中的应用
营养干预旨在通过膳食调整改善健康,但其效果受个体遗传背景、肠道菌群及生活方式差异的影响而呈现高度异质性。多组学与机器学习研究揭示,个体对同一饮食结构的餐后血糖反应差异巨大,其根源在于上述因素的复杂互作。因此,精准预测营养干预措施对血糖、血脂等核心指标的影响,成为当前研究的焦点。机器学习模型已能通过分析个体数据预测血糖波动并识别关键营养功能因子,为实现个性化饮食干预提供了科学依据。总体而言,本综述系统总结了机器学习与组学技术融合的研究现状,并展望了其在食品组学与营养组学领域的未来发展方向。

图3 机器学习驱动的精准营养干预过程
上述工作得到了国家自然科学基金、江苏省自然科学基金和镇江市创新能力建设计划--学科重点实验室建设项目等资助。