人类白细胞抗原(HLA)系统在人体的免疫识别中起着至关重要的作用,区分“自我”和“非自我”。它的基因高度多样化,是人类基因组中遗传多样性最大的区域之一。HLA分型报告通过严格的命名系统和分型层次将复杂的遗传信息转化为结构化的格式。这些报告对遗传分析、人口研究和样本比较至关重要。
1. HLA系统的生物学基础
HLA基因簇主要位于6号染色体的短臂上(6p21.31),是免A系统抗原识别的遗传基础。HLA编码的蛋白质主要分为两类:
I类分子(HLA-A,B,C):这些蛋白质存在于几乎所有有核细胞表面,并呈现内部蛋白质片段,例如病毒感染期间产生的蛋白质片段。
II类分子(HLA-DP,DQ,DR):这些分子主要作用于抗原呈递细胞,如树突状细胞,巨噬细胞和B细胞。它们呈现细胞外的蛋白质片段,如细菌蛋白质。
HLA的极端遗传多样性—已知等位基因超过28000个—为人群提供了广泛的抗原识别能力。这种多样性是对抗多种病原体的关键进化策略
2. HLA分型技术的发展
HLA分型已经从基本的血清学分析发展到复杂的高通量测序。每一次技术飞跃都提高了分型的精度、速度和实用性。
血清学时代(1950s-1980s)
早期的方法依赖于抗体介导的淋巴细胞毒性试验来检测广泛的HLA抗原群。这些测试提供低分辨率,通常限于两位数代码(例如HLA-B27)。尽管精度有限,但血清学快速,成本效益高(每次测试约20$),适合大规模人群筛查或初始兼容性检查。然而,它不能区分细微的亚型差异,限制了它的应用。
分子生物学时代(1990s-2010s)
PCR与序列特异性引物(PCR-SSP)的引入使常见HLA等位基因的快速筛选具有四位数的分辨率,显着提高了准确性。PCR-SSP支持多基因检测,广泛应用于遗传调查和等位基因筛选。与此同时,Sanger测序(SBT)成为金标准,实现了高达6-8位的分辨率和编码区变异的精确分析。虽然昂贵(每个样品约300美元)且低通量,但Sanger测序能够进行详细的基因型分析,并确认罕见或模糊的类型。
高通量测序时代(2010s-)
二代测序技术(NGS)迎来了一个新的阶段,实现了基因的全覆盖(包括内含子和非翻译区域)和等位基因的精确分型。与Sanger测序相比,NGS提供了几个优势:能够同时处理数十到数百个样品;更高的分辨率和相位,揭示新的等位基因和复杂的变体;非编码区分析提供了对基因多样性和免疫功能更深入的了解。虽然数据分析更复杂,仪器成本更高,但NGS极大地提高了样本吞吐量和成本效率。
3. 了解HLA分型结果一览
HLA命名规则详细说明
HLA基因的命名遵循国际标准的四域编码系统。以表中的HLA-A*01:02:01:01为例,其结构可以分解为:
示例解释:
01:属于血清学A1组;02:第二个氨基酸变体;01:编码区突变,但不影响功能;01:非编码区碱基差异,可能影响表达。
HLA命名与等位基因分辨率在四个字段(八位数)。HLA前缀后面跟着基因字母,然后用星号(*)分隔四个数字字段,每个字段用冒号(:)分隔:
字段1:相关血清学组或等位基因组(例如,A02、A03、C*03);
字段2:在同一血清学组(亚型)中具有氨基酸变化的等位基因(例如,A02:02, A02:04);
字段3:具有同义DNA变化但不改变氨基酸的等位基因(例如,A*02:01:02);
字段4:非编码区不同的等位基因(例如,A2:01:01:01, A2:01:01:21L);
特殊的标记:
当两个或两个以上的等位基因不能被区分时,使用斜杠(/),例如:HLA-DRB1*15/16当不确定等位基因过多时,加号(+)表示遗漏,例如:HLA-DRB1 *15:01/16:01/+
当肽结合区存在不确定性时(HLA I类外显子2和3;II类外显子2),P或G后缀表示等位基因之间的氨基酸(P)或核苷酸(G)序列相同。
HLA分型报告中特殊符号的解释
例如:HLA-B*15:02:01Q:可能的未确认突变;建议进一步分析。DRB1*15:01/16:01/+:多个不确定等位基因;建议补充高分辨率分析。
1. 分型分辨率结构:四层金字塔模型
HLA分型分辨率
低分辨率(4位数字) 如:HLA-B*27,包括:仅字段1(血清学组),应用:快速,广泛的群体研究或初始兼容性检查分组。血清学:基于抗体的广谱检测,分辨率~2位数。PCR-SSP/SSOP:序列特异性引物/探针方法,提供4位数分辨率,检测常见亚型。
(注:“4位数字”是历史残留,若讨论历史数据(如早期检测报告):“Low Resolution(4-digit)"可理解为当时的习惯说法,反映早年技术限制下的分型精度。按现行标准:严谨表述应为“低分辨率(仅 Field 1)”,而非绑定“4位数字”—因为Field 1的位数随等位基因发现而变化--2位、3位均可能)。
高分辨率(6位)如:HLA-B*27:05,包括:字段1和2(血清学组+氨基酸变体),应用:详细的人群研究和特定亚型鉴定。Sanger测序:金标准,6位数分辨率,精确的氨基酸鉴定。PCR-SSP:靶向扩增,可以识别6位数类型,但可能不如测序精确。
等位基因分辨率(8位)如:HLA-B*27:05:01,包括:字段1-3(血清学组,氨基酸变异,同义突变),应用:用于追踪遗传和识别同义DNA变异。Sanger测序:高精度的8位数分辨率。NGS:支持高通量和新等位基因的发现。
全序列分辨率(G组)如:HLA-A*02:01:01或G组标记,包括:字段1-4或整个基因序列,包括非编码区域,应用:完整的变异分析,包括非编码和调控区域,帮助详细的遗传研究。NGS:全基因覆盖,包括内含子和调控区域,允许分阶段和多样本分析。G/P组标记:G表示等位基因间的全编码序列相同;P表示相同的肽结合区氨基酸序列。
四个分辨率级别反映了不同类型技术和数据细节的逐步细化。选择合适的解决方案取决于研究目标和技术能力。低分辨率适合广泛分组和快速筛选;高分辨率显示氨基酸变化;等位基因解析有助于家族研究;全序列测序分辨率提供最全面的数据。了解这些区别是优化HLA分型策略的关键。
解释真实世界的HLA分型报告和常见的误读
一个典型的报告部分可能是这样的:
HLA报告解读常见的错误包括将低分辨率数据误认为完整的分型,忽略Q或N等特殊标志,将保证功能相似性的G分组混淆。掌握HLA命名法、类型深度和标记含义可以帮助相关团队从报告中获得有价值的见解。随着高级测序成为标准,数据丰富性增长,HLA分型在支持免疫遗传学,人口研究和生物制剂开发中的应用比以往任何时候都多。
转载本文请联系原作者获取授权,同时请注明本文来自阎影科学网博客。
链接地址:https://wap.sciencenet.cn/blog-3302154-1496030.html?mobile=1
收藏