“暗蛋白质组”调查揭示数千个新的人类基因
近期发表在《科学》期刊上的一篇研究显示,不断有新的人类基因被揭示。事实上,可能所谓的非编码区,只是我们还没有发现其编码规律而已。人体内所有的存在都有其意义,没有毫无意义的信息和结构。下文是关于人类基因认识分享:
20 多年前,人类基因组首次测序时,最大的惊喜之一是基因组中基因数量之少,不到一些科学家预测的三分之一。似乎不到 30,000 个基因及其编码的蛋白质就足以构建和运作人体;最近的数字甚至更低,约为 20,000 个。但一项对一些人称之为“暗蛋白质组”的新系统分析表明,科学家们错过了数千种非传统基因,这些基因潜伏在以前被忽视的基因组片段中,产生的蛋白质比平均水平要小。新描述的基因及其产物可能会颠覆人类生物学的各个方面并加速医学发现。例如,一个新发现的基因会产生一种微型蛋白质,它似乎是儿童癌症的关键。“除非我们知道暗蛋白质组中的蛋白质是什么以及它们如何发挥作用,否则我们治疗疾病的能力将受到限制,”索尔克生物研究所的化学生物学家 Alan Saghatelian 表示,他没有参与这项新研究,该研究在上个月发布在 bioRxiv 上的预印本中进行了描述。这项分析的领导者之一 John Prensner 开始研究暗蛋白质组,因为他在已知基因中寻找与癌症相关的基因时,很多次都一无所获。“我对基因组其余部分能提供什么很感兴趣,”现就职于密歇根大学医学院的儿科神经肿瘤学家 Prensner 回忆道。他和他的同事扩展了基因的标准定义,通常认为基因由一个称为开放阅读框 (ORF) 的长蛋白质编码 DNA 序列组成,该序列具有告诉细胞从哪里开始和停止读取的信号。细胞将 ORF 序列转录为信使 RNA,信使 RNA 会进入细胞工厂,即核糖体,核糖体会将氨基酸序列组装成蛋白质。典型的 ORF 前面还有一段 DNA 片段,用于吸引基因读取所需的蛋白质。对于大多数研究人员来说,如果一个 ORF 编码的蛋白质含有 100 个或更多的氨基酸,那么它就符合基因的条件。
但研究酵母、蛇和人类等各种生物的生物学家最近发现了大量所谓的非规范 ORF,它们缺乏那些前导片段,并且比平均水平短。然而,它们经常被转录成 RNA,一种称为核糖体分析或 Ribo-Seq 的方法表明,许多转录的 RNA 附着在核糖体上,在那里它们可能被翻译成短氨基酸链——甚至是氨基酸少于十几个的蛋白质。即便如此,许多科学家仍认为由此产生的微蛋白不重要,认为它们是会迅速降解的“噪音”。多伦多儿童医院的生物化学家 Ji-Young Youn 说,让人们相信这些 ORF 值得认真研究是非常困难的。但大约 3 年前,Prensner 及其同事证明癌细胞含有大约 550 种这种微蛋白。两年前,Princess Máxima 儿科肿瘤中心的系统生物学家 Sebastiaan van Heesch 在心脏组织中发现了类似数量的微小蛋白质。“Sebastiaan 和我发现了这些非常非常酷的基因,我们认为世界应该知道它们,”Prensner 说。因此,他们与 GENCODE(官方认可基因数据库)的基因注释专家 Jonathan Mudge 合作,并最终招募了来自四大洲 20 个机构的数十名其他研究人员,以帮助评估有多少人类非规范 ORF 存在。欧洲分子生物学实验室欧洲生物信息学研究所的计算生物学家 Fergal Martin 说,这“成为一种超级联盟,为一个相对较新的领域带来秩序”这个小组没有进行自己的实验,而是探究了其他人所做的工作,首先梳理了核糖体分析论文。到 2022 年,科学家们已经在人类基因组中追踪到了 7264 个非规范 ORF。在人类蛋白质组组织(旨在对所有人类蛋白质进行分类)和 PeptideAtlas(汇编蛋白质质谱数据)的帮助下,他们着手证明这些 ORF 可以制造蛋白质。Youn 指出,这是一个“巨大的挑战”。该联盟仔细搜索了 PeptideAtlas 的质谱数据档案,寻找与 ORF 序列相匹配的小蛋白质,并对已发表的实验进行了分类,这些实验对人类免疫系统检测到的蛋白质片段进行了分类,这是一个蓬勃发展的领域,称为免疫肽组学。总而言之,他们证实,他们统计的 7264 个非规范 ORF 中有四分之一可以制造蛋白质,总共约有 3000 个。 (一个 ORF 可以通过多种方式读取,从而产生多种蛋白质。)斯坦福大学遗传学家 Ami Bhatt 表示,新发现的微型蛋白质“有助于提供 [人类] 基因组编码部分的更完整图景”,他自己的研究探索了微生物的暗蛋白质组。它们还为科学家提供了新的生物医学研究目标。Prensner 和 van Heesch 已经开始跟踪他们在暗蛋白质组研究早期发现的 ORF 及其微型蛋白质。通过使用基因编辑器 CRISPR 在 ORF 中引入突变,他们可以检查其蛋白质在癌细胞中的重要性。他们在 1 月 18 日的《分子细胞》杂志上报道说,尽管 ORF 的产物很小,但它对于髓母细胞瘤(一种影响儿童的脑癌)的生存至关重要。“并不是每天都能打开一个研究方向并说‘我们可能为患者提供一整类全新的药物靶点’,”Prensner 说。这种微蛋白并不在人类基因组的原始分析中,但“它在髓母细胞瘤中起着关键作用”,Saghatelian 表示同意。Prensner 还为马萨诸塞州一家名为 ProFound Therapeutics 的公司提供咨询,该公司已与制药巨头辉瑞公司合作,开发基于微蛋白靶点的肥胖症治疗方法。预印本的另一位合著者、加州大学欧文分校的蛋白质生物化学家 Thomas Martinez 和他的团队正在追踪与胰腺癌和代谢疾病有关的微小蛋白质。“我最兴奋的是将微蛋白转化为治疗手段,希望既能作为生物标志物,又能作为药物靶点,”Martinez 说。“一旦跨越了这一障碍,我认为人们对该领域的兴趣将急剧增加。”尽管 Martinez 对暗蛋白质组被揭示的数量感到满意,但 Youn 认为还有更多的东西有待发现。她说,她的团队和其他人所做的工作只是对看不见的微蛋白群体投射了“一丝光芒”。她的团队正在改进质谱技术,以检测更小的分子,并希望利用它们找到在大脑发育中发挥作用的微蛋白。所有这些对人类基因总数有什么影响?暗蛋白质组显然增加了总数,但没有人知道真正的数字。“我的直觉是它可能不会高达 100,000,”马丁内斯说,“但 50,000 是有可能的。”
转载本文请联系原作者获取授权,同时请注明本文来自赵相轩科学网博客。
链接地址:https://wap.sciencenet.cn/blog-3544986-1462913.html?mobile=1
收藏