嗜热四膜虫(Tetrahymena thermophila)是一种广泛应用于基础生物学研究的单细胞模式真核生物,曾因核酶和端粒酶的研究分别斩获1989年诺贝尔化学奖和2009年诺贝尔生理或医学奖。四膜虫大核基因组已历经多次组装和注释,其中包括2020年由中国海洋大学海洋生物多样性与进化研究所原生动物学团队高珊教授课题组率先完成的端粒到端粒的完整基因组组装。然而,现有的基因注释仍存在诸多不足,例如基因错误注释、TSS和TES位置不准确,以及UTR信息缺失等。近日,高珊教授课题组通过整合大规模的转录组数据和表观遗传学数据,运用机器学习模型、人工核对和实验验证,深度优化了嗜热四膜虫大核基因组的注释,相关成果Comprehensive genomeannotation of the model ciliate Tetrahymena thermophila by in-depth epigenetic and transcriptomic profiling(利用大规模的转录组和表观组数据深度优化模式生物嗜热四膜虫的基因组注释)于2024年12月9日在线发表于Nucleic Acids Research杂志上。
中国海洋大学海洋生物多样性与进化研究所原生动物学团队高珊教授为文章的通讯作者。博士生叶飞、山东大学陈晓教授和博士毕业生李源为共同第一作者。硕士生鞠艾利、博士毕业生盛亚岚、博士生段丽丽、张佳晨和张喆,以及美国布拉德利大学Naomi A. Stover副教授等对本文亦有重要贡献。该工作得到中国海洋大学海洋生物多样性与进化研究所超算集群、崂山实验室高性能科学计算与系统仿真平台和中国海洋大学高等海洋研究院海洋大数据中心等计算资源的资助。