请输入关键字
确定
Nat Commun | 原佳沛/杨扬/宣成昊团队首次开发InPACT方法,可利用RNA-seq数据精准刻画内含子多聚腺苷酸化
2024.04.03

选择性多聚腺苷酸化(APA)作为一种普遍的转录后调控机制,在真核生物基因表达中发挥着重要的作用。在前体mRNA的3’端加工过程中,由于存在多个polyA位点,细胞可以选择性地使用不同位点进行切割和多聚腺苷酸化,从而产生序列不同的转录本。APA主要发生在3’非翻译区(3’UTR),导致形成的mRNA具有相同的编码区序列,但3’UTR长度各异。然而,当polyA位点在内含子区域时,将可能导致mRNA编码区序列发生变化,进而产生截短型蛋白质产物或者非编码转录本,这一现象被称为内含子多聚腺苷酸化(IPA)[1]。近期研究表明,IPA的异常调控与恶性肿瘤等复杂疾病密切相关[2-3]。尽管已有多种基于常规RNA-seq数据的APA分析方法开发出来,但它们大多局限于3’UTR内的APA分析,对于IPA的研究仍面临诸多挑战。

近日,天津医科大学杨扬教授课题组领衔,与中国医学科学院血液病医院(中国医学科学院血液学研究所)原佳沛研究员和天津医科大学宣成昊教授合作在《Nature Communications》(IF=16.6)发表了题为“InPACT: A computational method for accurate characterization of intronic polyadenylation from RNA sequencing data”的研究论文。该研究通过综合考量序列特征以及RNA-seq读段分布特征,成功开发了一款新的生物信息学方法—InPACT。该方法能够利用常规RNA-seq数据,实现IPA位点的精准识别及定量分析,为IPA研究提供了有力工具。

InPACT方法包括序列模块(Sequence Module)和读段模块(Read Module)两部分,分别用于对polyA位点上下游序列特征以及末端外显子上的转录组测序(RNA-seq)读段分布特征的学习。通过基于翻译组测序(Ribo-seq)数据的翻译水平分析,以及3’RACE实验验证等,该研究进一步证实了InPACT所鉴定的IPA事件的准确性。


       为全面评估InPACT方法的性能,该研究在多种组织或细胞系的常规RNA-seq数据上进行了测试。通过将匹配的3’末端测序数据或基于三代测序技术的全长转录组数据作为参考,结果表明InPACT在IPA位点识别方面相较于其他方法具有更高的准确性。此外,不同深度的仿真RNA-seq数据进一步验证了InPACT在IPA分析方面的性能。该研究通过将InPACT应用于单核细胞活化相关RNA-seq数据以及人类胎儿骨髓单细胞转录组测序(SMART-seq)数据中的IPA分析,展示了InPACT的广泛实用性,为IPA动态调控及细胞类型特异性IPA事件的识别提供了有力支持。

       综上所述,该研究开发了一个新的生物信息学方法—InPACT,能够可靠且准确地利用常规RNA-seq数据识别未注释的IPA位点,并实现IPA转录本拼接及定量。通过在不同组织或细胞类型的数据上的应用,InPACT方法展现了其广泛实用性,有助于揭示IPA在不同生理或病理条件下的动态变化模式,从而更全面地解析IPA在不同的生物学过程以及疾病发生发展中的功能。

       天津医科大学杨扬教授和宣成昊教授及中国医学科学院血液病医院(中国医学科学院血液学研究所)原佳沛研究员为共同通讯作者,博士生刘小川和博士后陈皓为共同第一作者。该研究还得到了天津医科大学李龙教授的帮助与支持。该项目获得国家自然科学基金的支持。

       点击此处阅读原文

 

       参考文献:

       1. Mitschka S, Mayr C. Context-specific regulation and function of mRNA alternative polyadenylation. Nat Rev Mol Cell Biol 2022, 23(12): 779-796.

       2. Lee SH, Singh I, Tisdale S, Abdel-Wahab O, Leslie CS, Mayr C. Widespread intronic polyadenylation inactivates tumour suppressor genes in leukaemia. Nature 2018, 561(7721): 127-131.

       3. Singh I, Lee SH, Sperling AS, Samur MK, Tai YT, Fulciniti M, Munshi NC, Mayr C, Leslie CS. Widespread intronic polyadenylation diversifies immune cell transcriptomes. Nat Commun 2018, 9(1): 1716.