破解6.2万余个乳酸菌基因组,首创性地整合菌种资源、基因组信息、临床试验数据等关键指标对乳酸菌进行高效挖掘,基于大数据和人工智能算力为乳酸菌产学研开发利用搭建里程碑式的“数据桥梁”,张和平团队做到了。
近日,内蒙古农业大学教授张和平团队历时5年建设的乳酸菌基因组数据库iLABdb正式建成上线(https://www.imhpc.com/iLABdb),成为目前全球最大的乳酸菌基因组、功能研究数据共享数据库和平台。利用基因组技术为乳酸菌资源注入创新活力,这一重大成果的发布,展现了我国在微生物学研究领域的领先地位和国际影响力,也将为全球乳酸菌研究与产业发展贡献积极力量。
iLABdb是借助前沿的生物信息学技术和先进的数据分析算法建立的一个基于Web的综合乳酸菌基因组数据共享平台,数据库涵盖6.2万余个乳酸菌基因组及相关元数据,包括1.1万余个新测序的乳酸菌基因组,由“青城之光”高性能计算公共服务平台提供算力资源支撑。
乳酸菌系统发育关系复杂,菌株间功能和代谢差异极大,难以通过传统实验方法系统性地研究和挖掘,这大大限制了乳酸菌的开发与利用效率。张和平介绍,依托平台,用户可根据实际需求准确高效地筛选出具有不同功效的菌株,对食品加工、农业种植、动物养殖以及生物制药等领域科学研究和产业应用意义重大,将最大程度地释放“数据生产力”。
据了解,乳酸菌作为微生物领域重要的战略资源,具有广泛的应用价值。张和平带领团队历时34年,从全球6大洲32个国家采集自然发酵乳制品等样品6202份,分离保藏乳酸菌47573株,建成全球最大、种类最全的乳酸菌种质资源库,该资源库入选2022年首批国家农业微生物种质资源库。依托乳酸菌种质资源库,团队于2018年启动了“乳酸菌万株基因组计划”,利用自建菌种资源库中1.1万株完成测序的乳酸菌全基因组序列,并结合现有公共数据库中5.19万个乳酸菌基因组数据,建立了iLABdb数据库,相关科研成果发表于《Science Bulletin》(《科学通报(英文版)》)。(记者 白莲)