Login| Sign Up| Help| Contact|

Patent Searching and Data


Title:
NEW PCR SEQUENCING METHOD AND USE THEREOF IN HLA GENOTYPING
Document Type and Number:
WIPO Patent Application WO/2012/000445
Kind Code:
A1
Abstract:
The present invention provides a PCR sequencing method, which comprises the steps of: 1) providing the sample; 2) amplifying; 3) mixing; 4) breaking; 5) sequencing and 6) splicing. The present invention also provides the primer tags used in the method, as well as the use of the method in genotyping, especially in HLA analysis. The present invention also provides PCR primers for HLA-A/B, HLA-C and HLA-DQB1.

Inventors:
LI JIAN (CN)
CHEN SHIPING (CN)
ZHANG XIANDONG (CN)
LIU YING (CN)
ZHANG CAIFEN (CN)
LIU TAO (CN)
ZHAO MEIRU (CN)
Application Number:
PCT/CN2011/076688
Publication Date:
January 05, 2012
Filing Date:
June 30, 2011
Export Citation:
Click for automatic bibliography generation   Help
Assignee:
BGI SHENZHEN CO LTD (CN)
LI JIAN (CN)
CHEN SHIPING (CN)
ZHANG XIANDONG (CN)
LIU YING (CN)
ZHANG CAIFEN (CN)
LIU TAO (CN)
ZHAO MEIRU (CN)
International Classes:
C12Q1/68; C12N15/11
Foreign References:
CN101921840A2010-12-22
CN101921841A2010-12-22
CN101921842A2010-12-22
CN101313078A2008-11-26
US7300755B12007-11-27
Other References:
JEESUK: "Analysis of children with type 1 diabetes in Korea: high prevalence of specific anti-islet autoantibodies, immunogenetic similarities to Western populations with ''unique'' haplotypes, and lack of discrimination by aspartic acid at position 57 of DQB.", CLINICAL IMMUNOLOGY., vol. 113, September 2004 (2004-09-01), pages 318 - 325, XP002716063
TIERCY J M.: "Molecular basis ofHLA polymorphism: implications in clinical transplantation", J]. TRANSPL IMMUNOL, vol. 9, 2002, pages 173 - 180, XP027388192
C.ANTOINE; S.MIILLER; A.CANT ET AL.: "Long-term survival and transplantation of haemopoietic stem cells for immunodeficiencies: report of the European experience", THE LANCET, vol. 9357, 2003, pages 553 - 560, XP004778553, DOI: doi:10.1016/S0140-6736(03)12513-5
H. A. ERLICH; G. OPELZ; J. HANSEN ET AL.: "HLA DNA Typing and Transplantation", IMMUNITY, vol. 14, 2001, pages 347 - 356
LILLO R; BALAS A; VICARIO JL: "Two new HLA class allele, DPB 1*02014, by sequence-based typing", TISSUE ANTIGENS, vol. 59, 2002, pages 47 - 48
A. DORMOY; N. FROELICH; LEISENBACH ET AL.: "Mono-allelic amplification of exons 2-4 using allele group-specific primers for sequence-based typing (SBT) of the HLA-A, -B and -C genes: Preparation and validation of ready-to-use pre-SBT mini-kits", J]. TISSUE ANTIGENS, vol. 62, 2003, pages 201 - 216
ELAINE R. MARDIS: "The impact of next-generation sequencing technology on genetics", TRENDS IN GENETICS, vol. 24, 2008, pages 133 - 141, XP022498431
CHRISTIAN HOFFMANNL; NANA MINKAHL; JEREMY LEIPZIG: "DNA barcoding and pyrosequencing to identify rare HIV drug resistance mutations", NUCLEIC ACIDS RESEARCH, 2007, pages 1 - 8
SHANNON J.ODELBERG; ROBERT B.WEISS; AKIRA HATA: "Template-switching during DNA synthesis by Thermus aquaticus DNA polymerase I", NUCLEIC ACIDS RESEARCH, vol. 23, 1995, pages 2049 - 2057
SAYER D; WHIDBORNE R; BRESTOVAC B.: "HLA-DRB1 DNA sequencing based typing: an approach suitable for high throughput typing including unrelated bone marrow registry donors", TISSUE ANTIGENS, vol. 57, no. 1, 2001, pages 46 - 54
IWANKA KOZAREWA; ZEMIN NING; MICHAEL A QUAIL: "Amplification-free Illumina sequencing-library preparation facilitates improved mapping and assembly of (G+C)-biased genomes", NATURE METHODS, vol. 6, 2009, pages 291 - 295, XP055087323, DOI: doi:10.1038/nmeth.1311
MARSH, S.G.E.; PARHAM, P.; BARBER, L.D.: "The HLA Facts Book", vol. 3, 2000, ACADEMIC PRESS, pages: 91
CAMPBELL, K.J. ET AL.: "Characterization of 47 MHC class I sequences in Filipino cynomolgus macaques", IMMUNOGENETICS, vol. 61, 2009, pages 177 - 187, XP019705365
GOULDER, P.J.R.; WATKINS, D.I.: "Impact of MHC class I diversity on immune control of immunodeficiency virus replication", NAT. REV. IMMUNOL, vol. 8, 2008, pages 619 - 630
O'LEARY, C.E. ET AL.: "Identification of novel MHC class I sequences in pig-tailed macaques by amplicon pyrosequencing and full-length cDNA cloning and sequencing", IMMUNOGENETICS, vol. 61, 2009, pages 689 - 701, XP019757439, DOI: doi:10.1007/s00251-009-0397-4
ROBINSON J; MALIK A; PARHAM P; BODMER JG; MARSH SGE: "IMGT/HLA database-a sequence database for the human major histocompatibility complex", TISSUE ANTIGENS, vol. 55, 2000, pages 80 - 7
HOFFMANN C; MINKAH N; LEIPZIG J; WANG G; ARENS MQ; TEBAS P; BUSHMAN FD: "DNA bar coding and pyrosequencing to identify rare HIV drug resistance mutations", NUCLEIC ACIDS RES., vol. 35, no. 13, 2007, pages E91, XP055059023, DOI: doi:10.1093/nar/gkm435
WU, D. L. ET AL.: "Comparative analysis of serologic typing and HLA-II typing by micro-PCR-SSP", DI YI JUN YI DA XUE XUE BAO, vol. 22, 2002, pages 247 - 249
AL- HUSSEIN K A; RAMA N R; BUTT A I ET AL.: "HLA class II sequence based typing in normal Saudi individuals", TISSUE ANTIGENS, vol. 60, 2002, pages 259 - 261
D. C. SAYER; D. M. GOODRIDGE: "Pilot study: assessment of interlaboratory variability of sequencing-based typing DNA sequence data quality", TISSUE ANTIGENS, vol. 69, 2007, pages 66 - 68
HORTON V; STRATTON I; BOTTAZZO G. F. ET AL.: "Genetic heterogeneity of autoimmune diabetes: age of presentation in adults is influenced by HLA DRB1 and DQB1 genotypes", DIABETOLOGIA, vol. 42, 1999, pages 608 - 616
C.E.M. VOORTER; M.C. KIK1; E.M. VAN DEN BERG-LOONEN ET AL.: "High-resolution HLA typing for the DQB1 gene by sequence-based typing", TISSUE ANTIGENS, vol. 51, 2008, pages 80 - 87
G. BENTLEY; R. HIGUCHI; B. HOGLUND ET AL.: "High-resolution, high-throughput HLA genotyping by next-generation sequencing", TISSUE ANTIGENS, vol. 74, 2009, pages 393 - 403, XP055087325, DOI: doi:10.1111/j.1399-0039.2009.01345.x
See also references of EP 2599877A4
Attorney, Agent or Firm:
CCPIT PATENT AND TRADEMARK LAW OFFICE (CN)
中国国际贸易促进委员会专利商标事务所 (CN)
Download PDF:
Claims:

1. 一种测定样品中目的核酸的核苷酸序列的方法, 其包括:

1 )提供 n个样品, n为大于等于 1的整数, 所述样品优选地来 自哺乳动物, 更优选是人, 特别是人的血样; 可选地, 将待分析 的 n个样品分成 m个小组, m为整数且 n > m > l;

2 )扩增: 对于每一个样品, 使用一对或多对标签引物, 在存 在来自该样品的模板时, 在适于扩增目的核酸的条件下进行 PCR 扩增, 其中, 每一对标签引物由包含引物标签的正向标签引物和 反向标签引物 (均可以是简并引物)构成, 其中正向标签引物和 反向标签引物所包含的引物标签可以相同或者不同; 不同样品所 用标签引物对中的引物标签彼此不同;

3 ) 混合: 当 n>l时, 将各样品的 PCR扩增产物混合在一起;

4 )打断: 将所得的扩增产物进行不完全打断, 并进行纯化回 收;

5 )测序: 将回收的 DNA混合物利用二代测序技术, 优选的是 Pair-End技术(例如 Illumina GA、 Illumina Hiseq 2000 )进行测序, 获得打断后的 DNA的序列; 和

6 )拼接:基于每个样品独特的引物标签将获得的测序结果与 样品 对应, 利用比对程序 (例如 Blast, BWA程序)把各个测 序序列定位到 PCR产物的相应 DNA参考序列上, 通过序列重叠和 连锁关系, 从打断后的 DNA的序列拼接出完整的目的核酸。

2. 权利要求 1所述的方法,其中每一对引物标签与 PCR引物对 组合成一对标签引物, 正反 PCR引物的 5,端分别具有 (或者任选 通过连接序列连接)正向引物标签和反向引物标签。

3. 权利要求 1或 2所述的方法, 其中所述 PCR引物是用于扩增 HLA基因的 PCR引物, 特别是用于扩增 HLA-A/B基因的 PCR引 物, 优选的是用于扩增 HLA-A/B的 2 , 3 , 4号外显子以及 HLA-DRB1 2号外显子的 PCR引物, 优选的所述用于扩增 HLA-A/B的 2 , 3 , 4号外显子的 PCR引物如表 1或表 2所示, 优选 的所述用于扩增 HLA-DRB1 2号外显子的 PCR引物如表 7所示。

4. 权利要求 1或 2所述的方法, 其中所述 PCR引物是用于扩增 HLA基因的 PCR引物, 特别是用于扩增 HLA-C基因的 PCR引物, 优选的是用于扩增 HLA-C的 2, 3和 /或 4号外显子的 PCR引物, 优 选的所述 PCR引物如表 3或表 4所示。

5. 权利要求 1或 2所述的方法, 其中所述 PCR引物是用于扩增 HLA基因的 PCR引物, 特别是用于扩增 HLA- DQB1基因的 PCR 引物,优选的是用于扩增 HLA-基因 2和 /或 3号外显子的 PCR引物, 优选的所述 PCR引物如表 5所示。

6. 权利要求 1所述的方法,其中所述引物标签针对 PCR引物进 行设计, 优选针对用于扩增 HLA的特定基因的 PCR引物进行设 计, 更优选是用于扩增 HLA-A/B的 2 , 3 , 4号外显子以及 HLA-DRB1 2号外显子的 PCR引物,特别是如表 2或表 3或表 7所示 的 PCR引物进行设计,所述引物标签特别是包括表 6所示 95对引物 标签中的至少 10对, 或至少 20对, 或至少 30对, 或至少 40对, 或 至少 50对, 至少 60对, 或至少 70对, 或至少 80对, 或至少 90对, 或 95对 (或者所述一组引物标签由表 1所示 95对引物标签中的 10 - 95对(例如 10 - 95对, 20 - 95对, 30 - 95对, 40 - 95对, 50 - 95对, 60 - 95对, 70 - 95对, 80 - 95对, 90 - 95对, 或 95对)组 成) , 并且

所述一组引物标签优选地至少包括表 6所示 95对引物标签中 的 PI-1至 PI-10 , 或 PI-11至 PI-20 , 或 PI-21至 PI-30 , 或 PI-31至 PI-40,或 PI-41至 PI-50,或 PI-51至 PI-60,或 PI-61至 PI-70,或 PI-71 至 PI-80 , 或 PI-81至 PI-90, 或 PI-91至 PI-95 , 或者它们任何两个 或者多个的组合。

7. 权利要求 1所述的方法,其中所述 DNA打断包括化学打断方 法和物理打断方法, 其中所述化学方法包括酶切方法, 所述物理 打断方法包括超声波打断方法或机械打断方法。

8. 权利要求 1所述的方法, 其中所述 DNA打断后, 纯化回收 从测序仪最大读取长度到测序仪可适用的最长 DNA长度范围之间 的所有 DNA条带 ,其中所述纯化回收方法包括但不限于电泳割胶回 收, 也可以是磁珠回收。

9. 权利要求 1所述的方法, 其中所述方法还可以包括权利要求 1所述的步骤 1 ) - 4 ) , 以及如下步骤:

5 )建库: 将打断后的 PCR产物文库构建 PCR-Free测序文库, 可以对文库添加不同的文库接头 ( adapter ) 以区分不同的 PCR-Free测序文库,纯化回收位于所用测序仪最大读长长度到所 用测序仪适用的最长 DNA长度范围之间的所有 DNA条带,优选地 是 450-750bp长度范围的 DNA片段;

6 ) 测序: 将回收的 DNA混合物利用二代测序技术, 优选的 是 Pair-End技术(例如 Illumina GA、 Illumina Hiseq 2000 )进行 测序, 获得打断后的 DNA的序列;

7 )拼接:基于各个文库不同的文库接头序列和每个样品独特 的引物标签将获得的测序结果与样品一一对应,利用比对程序(例 如 Blast,BWA程序 各个测序序列定位到 PCR产物的相应 DNA 参考序列上,通过序列重叠和连锁关系,从打断后的 DNA的序列 拼接出完整的目的核酸。

10. 权利要求 1 - 9中任一项所述的方法用于 HLA分型的用途, 其特征在于包括: 使用权利要求 1 - 7中任一项的方法对来自患者 的样品(特别是血样)进行测序, 以及将测序结果与 HLA数据库 (如 IMGT HLA专业数据库) 中 HLA外显子, 优选地 HLA-A/B 的 2, 3, 4号外显子, HLA-C的 2, 3和 /或 4号外显子, HLA-DQB1 基因 2和 /或 3号外显子和 /或 HLA-DRB1 2号外显子的序列数据比 对, 序列比对结果 100 %匹配的即为对应样本的 HLA基因型别。

11. 一组引物标签, 其包括表 6所示 95对引物标签中的至少 10 对, 或至少 20对, 或至少 30对, 或至少 40对, 或至少 50对, 至少 60对, 或至少 70对, 或至少 80对, 或至少 90对, 或 95对(或者所 述一组引物标签由表 1所示 95对引物标签中的 10 - 95对 (例如 10 - 95对, 20 - 95对, 30 - 95对, 40 - 95对, 50 - 95对, 60 - 95 对, 70 - 95对, 80 - 95对, 90 - 95对, 或 95对)组成) , 并且 所述一组引物标签优选地至少包括表 6所示 95对引物标签中 的 PI-1至 PI-10 , 或 PI-11至 PI-20 , 或 PI-21至 PI-30 , 或 PI-31至 PI-40,或 PI-41至 PI-50,或 PI-51至 PI-60,或 PI-61至 PI-70,或 PI-71 至 PI-80 , 或 PI-81至 PI-90, 或 PI-91至 PI-95 , 或者它们任何两个 或者多个的组合。

12. 权利要求 9所述的一组引物标签用于 PCR测序方法的用 途,其中特别是,每一对引物标签与用于扩增待测目的序列的 PCR 引物对组合成一对标签引物, 正反 PCR引物的 5,端分别具有 (或 者任选通过连接序列连接)正向引物标签和反向引物标签。

13. 权利要求 12所述的用途, 其中 PCR引物是用于扩增 HLA的 特定基因的 PCR引物, 优选是用于扩增 HLA-A/B的 2, 3 , 4号外 显子以及 HLA-DRB1 2号外显子的 PCR引物, 优选的所述用于扩 增 HLA-A/B的 2, 3 , 4号外显子的 PCR引物如表 1或表 2所示, 优 选的所述用于扩增 HLA-DRB1 2号外显子的 PCR引物如表 7所示; 或者优选是用于扩增 HLA-C的 2, 3和 /或 4号外显子的 PCR引物, 优选的所述 PCR引物如表 3或表 4所示; 或者优选是用于扩增 HLA-DQB1基因 2和 /或 3号外显子的 PCR引物, 优选的所述 PCR 引物如表 5所示。

14. 权利要求 11的一组引物标签与用于扩增待测目的序列的 PCR引物对组合成的一组标签引物, 其中每一对引物标签与 PCR 引物对组合成一对标签引物, 正反 PCR引物的 5,端各具有 (或者 任选通过连接序列连接)一个引物标签。

15. 权利要求 14所述的标签引物, 其中所述 PCR引物是用于扩 增 HLA的特定基因的 PCR引物,优选是用于扩增 HLA-A/B的 2, 3, 4号外显子以及 HLA-DRB1 2号外显子的 PCR引物,优选的所述用 于扩增 HLA-A/B的 2, 3, 4号外显子的 PCR引物如表 1或表 2所示, 优选的所述用于扩增 HLA-DRB1 2号外显子的 PCR引物如表 7所 示; 或者优选是用于扩增 HLA-C的 2, 3和 /或 4号外显子的 PCR引 物, 优选的所述 PCR引物如表 3或表 4所示; 或者优选是用于扩增 HLA-DQB1基因 2和 /或 3号外显子的 PCR引物, 优选的所述 PCR 引物如表 5所示。

16. 权利要求 14所述的标签引物用于 PCR测序方法的用途。

17. 一种 HLA分型方法, 其包括:

1 )提供 n个样品, n为大于等于 1的整数, 所述样品优选地来 自哺乳动物, 更优选是人, 特别是人的血样;

2 )将待分析的 n个样品分成 m个小组, m为整数且 n > m > l;

3 )扩增: 对于每一个样品, 使用一对标签引物, 在存在来自 该样品的模板时, 在适于扩增目的核酸的条件下进行 PCR扩增, 其中, 每一对标签引物由包含引物标签的正向标签引物和反向标 签引物 (均可以是简并引物)构成, 其中正向标签引物和反向标 签引物所包含的引物标签可以相同或者不同; 不同样品所用标签 引物对中的引物标签彼此不同;

4 ) 混合: 将各样品的 PCR扩增产物混合在一起, 获得 PCR 产物文库;

5 )打断: 将所得的 PCR产物文库进行不完全打断;

6 )建库: 结合文库接头标签技术, 将打断后的 PCR产物文库 构建 PCR-Free测序文库, 可以对文库添加不同的文库接头

( adapter ) 以区分不同的 PCR-Free测序文库, 回收位于所用测 序仪最大读长长度到所用测序仪适用的最长 DNA长度范围之间 的所有 DNA条带, 具体而言是 450-750bp长度范围的 DNA片段;

7 ) 测序: 将回收的 DNA混合物利用二代测序技术, 优选的 是 Pair-End技术(例如 Illumina GA、 Illumina Hiseq 2000 )进行 测序, 获得打断后的 DNA的序列;

8 )拼接:基于各个文库不同的文库接头序列和每个样品独特 的引物标签将获得的测序结果与样品一一对应,利用比对程序(例 如 Blast, BWA程序)把各个测序序列定位到 PCR产物的相应 DNA 参考序列上, 通过序列重叠和连锁关系, 从打断后的 DNA的序列 拼接出完整的目的核酸; 和

9 )分型: 将测序结果与 HLA数据库(如 IMGT HLA专业数 据库)中 HLA外显子,优选地 HLA-A/B的 2, 3, 4号外显子, HLA-C 的 2 , 3和 /或 4号外显子, HLA-DQB1基因 2和 /或 3号外显子和 /或 HLA-DRB1 2号外显子的序列数据比对,序列比对结果 100 %匹配 的即为对应样本的 HLA基因型别。

18. 权利要求 17所述的方法, 其中每一对引物标签与 PCR引物 对组合成一对标签引物, 正反 PCR引物的 5,端分别具有 (或者任 选通过连接序列连接)正向引物标签和反向引物标签。

19. 权利要求 17所述的方法, 其中所述 PCR引物是用于扩增 HLA的特定基因的 PCR引物, 优选是用于扩增 HLA-A/B的 2, 3, 4号外显子以及 HLA-DRB1 2号外显子的 PCR引物,优选的所述用 于扩增 HLA-A/B的 2, 3, 4号外显子的 PCR引物如表 1或表 2所示, 优选的所述用于扩增 HLA-DRB1 2号外显子的 PCR引物如表 7所 示; 或者优选是用于扩增 HLA-C的 2, 3和 /或 4号外显子的 PCR引 物, 优选的所述 PCR引物如表 3或表 4所示; 或者优选是用于扩增 HLA-DQB1基因 2和 /或 3号外显子的 PCR引物, 优选的所述 PCR 引物如表 5所示。

20. 权利要求 17所述的方法,其中所述引物标签如权利要求 6所 述。

21. 权利要求 17所述的方法, 其中所述 DNA打断包括化学打断 方法和物理打断方法, 其中所述化学方法包括酶切方法, 所述物 理打断方法包括超声波打断方法或机械打断方法。

22. 权利要求 17所述的方法, 其中所述纯化回收方法包括但不 限于电泳割胶回收, 也可以是磁珠回收。

23. 权利要求 17所述的方法, 所述结合文库接头标签技术, 将 打断后的 PCR产物文库构建 PCR-Free测序文库是指使用 m种文 库接头给 2 ) 中得到的 m个 PCR产物文库加上接头, 其中每一个 PCR产物文库使用一种不同的文库接头, 从而构建 m个接头标签 测序文库; 将 m个接头标签测序文库等摩尔混合在一起构建混合 接头标签测序文库。 其中连接文库接头的方法是指不通过 PCR程 序直接采用 DNA连接酶进行连接。

24. 用于 HLA基因分型的 PCR引物, 其特征在于所述 PCR引物 是用于扩增 HLA-A/B的 2, 3, 4号外显子以及 HLA-DRB1 2号外显 子的 PCR引物, 优选的所述用于扩增 HLA-A/B的 2 , 3 , 4号外显 子的 PCR引物如表 1或表 2所示, 优选的所述用于扩增 HLA-DRB1 2号外显子的 PCR引物如表 7所示; 或者是用于扩增 HLA-C的 2, 3 和 /或 4号外显子的 PCR引物, 优选的所述 PCR引物如表 3或表 4所 示; 或者用于扩增 HLA-DQB1基因 2和 /或 3号外显子的 PCR引物, 优选的所述 PCR引物如表 5所示。

25. 权利要求 24所述的 PCR引物的用于测序的方法,其包括: 提供样品, 特别是血样, 所述血样优选地来自哺乳动物, 特 别是人;

扩增: 使用所述 PCR引物用于扩增血样来源的 DNA从而得 到 PCR产物, 并对 PCR产物进行纯化;

测序: 对所述 PCR产物进行测序, 测序方法可以是 Sanger 测序法,或者可以是第二代测序法(例如 HiSeq 2000, Illumina GA 和 Roche454 ) 。

26. 权利要求 24所述的 PCR引物用于 HLA基因分型的用途, 其特征在于使用权利要求 24所述的 PCR引物,根据权利要求 25 的方法得到的结果进行组装和比对分析, 并将测序结果与数据库 中的标准序列进行比较, 得到 HLA基因分型结果。

27. 一种用于进行 HLA基因分型的试剂盒, 所述试剂盒中包 括权利要求 24所述的 PCR引物。

28. 一套用于 HLA-Α,Β基因分型的 PCR引物, 其特征在于所 述 PCR引物如表 1或表 2所示, 优选地所述分型是基于测序法, 包括第二代测序法, 和 Sanger法。

29. 权利要求 28所述的 PCR引物的用于测序的方法,其包括: 提供样品, 特别是血样, 所述血样优选地来自哺乳动物, 特 别是人;

扩增: 使用所述 PCR引物用于扩增血样来源的 DNA从而得 到 PCR产物, 并对 PCR产物进行纯化;

测序: 对所述 PCR产物进行测序, 测序方法可以是 Sanger 测序法,或者可以是第二代测序法(例如 HiSeq 2000、Illumina GA 和 Roche454 ) 。

30. 权利要求 28所述的 PCR引物用于 HLA基因分型的用途, 其特征在于使用权利要求 1所述的 PCR引物, 根据权利要求 29 的方法得到的结果进行组装和比对分析, 并将测序结果与数据库 中的标准序列进行比较, 得到 HLA基因分型结果。

31. 一种用于进行 HLA基因分型的试剂盒, 所述试剂盒中包 括权利要求 28所述的 PCR引物。

32. 具有 SEQ ID NO: 25、 SEQ ID NO: 26、 SEQ ID NO: 27、 SEQ ID NO: 28、 SEQ ID NO: 29和 SEQ ID NO: 30, 或者 SEQ ID NO: 31、 SEQ ID NO: 32、 SEQ ID NO: 33、 SEQ ID NO: 34、 SEQ ID NO: 35和 SEQ ID NO: 36任一项所示序列的多核苷

33. 一种 HLA-C基因 2、 3和 /或 4号外显子扩增方法, 其特征在 于使用选自 SEQ ID NO: 25和 SEQ ID NO: 26、 SEQ ID NO: 27 和 SEQ ID NO: 28、 SEQ ID NO: 29和 SEQ ID NO: 30, 或者 SEQ ID NO: 31和 SEQ ID NO: 32、 SEQ ID NO: 33和 SEQ ID NO:

34. SEQ ID NO: 35和 SEQ ID NO: 36的引物对进行 PCR扩增, 扩增 HLA-C基因 2、 3和 /或 4号外显子。

34. —种对样品中 HLA-C基因 2、 3和 /或 4号外显子进行测序的 方法, 其包括步骤:

1 ) 提供一个样品并提取该样品的 DNA;

2 ) 将选自 SEQ ID NO: 25和 SEQ ID NO: 26、 SEQ ID NO: 27和 SEQ ID NO: 28、 SEQ ID NO: 29和 SEQ ID NO: 30, 或者

-80- 更正页 (细则第 91条) SEQ ID NO: 31和 SEQ ID NO: 32、 SEQ ID NO: 33和 SEQ ID NO:

34. SEQ ID NO: 35和 SEQ ID NO: 36的引物对用于扩增所述 DNA 从而得到 PCR产物, 优选对 PCR产物进行纯化;

3 ) 对所述 PCR产物进行测序。

35. 权利要求 34的方法, 其中所述样品是血样。

36. 权利要求 35的方法, 其中所述血样来自哺乳动物或人。

37. 一种 HLA-C基因分型方法, 所述方法包括:

1) 使用选自 SEQ ID NO: 25和 SEQ ID NO: 26、 SEQ ID NO: 27和 SEQ ID NO: 28、 SEQ ID NO: 29和 SEQ ID NO: 30, 或者 SEQ ID NO: 31和 SEQ ID NO: 32、 SEQ ID NO: 33和 SEQ ID NO: 34、 SEQ ID NO: 35和 SEQ ID NO: 36的引物对进行 PCR扩增, 扩增待测样本的 HLA-C基因 2、 3和 /或 4号外显子;

2) 对扩增出的外显子进行测序,并将测序结果与数据库中的 标准序列进行比较, 从而确定基因分型结果。

38. 权利要求 34或 37的方法, 其中所述测序是通过 Sanger测序 法, 或者是通过第二代测序法。

39. 权利要求 38的方法, 其中所述第二代测序方法是 Illumina Solexa或 Roche454。

40. —种用于进行 HLA-C基因分型的试剂盒, 所述试剂盒中包 括 SEQ ID NO: 25和 SEQ ID NO: 26、 SEQ ID NO: 27和 SEQ ID NO: 28、 SEQ ID NO: 29和 SEQ ID NO: 30, 或者 SEQ ID NO: 31和 SEQ ID NO: 32、 SEQ ID NO: 33和 SEQ ID NO: 34、 SEQ ID NO: 35和 SEQ ID NO: 36的 PCR扩增引物对, 所述试剂盒优 选还包含用于 DNA扩增、 DNA纯化和 /或 DNA测序的试剂。

41. 权利要求 32的多核苷酸、 权利要求 37的方法或权利要求 40 的试剂盒用于 HLA-C基因分型的用途。

-81 - 更正页 (细则第 91条)

42. 具有 SEQ ID NO: 37至 SEQ ID NO: 40任一项所示序列的 多核苷酸。

43. —种 HLA-DQB1的 2和 /或 3号外显子扩增方法, 其特征在于 使用 SEQ ID NO: 37和 SEQ ID NO: 38; 以及 /或者 SEQ ID NO: 39和 SEQ ID NO: 40的引物对进行 PCR扩增。

44. 一种对样品中 HLA-DQB1的 2和 /或 3号外显子进行测序的方 法, 其包括步骤:

1 ) 提供一个样品并提取该样品的 DNA;

2 ) 将 SEQ ID NO: 37和 SEQ ID NO: 38; 以及 /或者 SEQ ID NO: 39和 SEQ ID NO: 40的引物对用于扩增所述 DNA从而得到 PCR产物, 优选对 PCR产物进行纯化;

3 ) 对所述 PCR产物进行测序。

45. 权利要求 44的方法, 其中所述样品是血样。

46. 权利要求 45的方法, 其中所述血样来自哺乳动物或人。

47. —种 HLA-DQB1基因分型方法, 所述方法包括:

1) 使用 SEQ ID NO: 37和 SEQ ID NO: 38;以及 /或者 SEQ ID NO: 39和 SEQ ID NO: 40的引物对进行 PCR扩增, 扩增待测样 本的 HLA-DQB1的 2和 /或 3号外显子;

2) 对扩增出的外显子进行测序,并将测序结果与数据库中的 标准序列进行比较, 从而确定基因分型结果。

48. 权利要求 44或 47的方法, 其中所述测序是通过 Sanger测序 法或第二代测序法。

49. 权利要求 48的方法, 其中所述第二代测序方法是 Illumina Solexa或 Roche454。

50. 一种用于进行 HLA-DQB1基因分型的试剂盒, 所述试剂盒 中包括 SEQ ID NO: 37和 SEQ ID NO: 38; 以及 /或者 SEQ ID NO:

-82- 更正页 (细则第 91条) 39和 SEQ ID NO: 40的引物对, 所述试剂盒优选还包含用于 DNA 扩增、 DNA纯化和 /或 DNA测序的试剂。

51. 权利要求 42的多核苷酸、 权利要求 47的方法或权利要求 50 的试剂盒用于 HLA- DQB1基因分型的用途。

-83- 更正页 (细则第 91条)

Description:
新的 PCR测序方法及其在 HLA基因分型中的应用

相关申请

本申请根据要求于 2010年 6月 30日提交的中国专利申请号 201010213717.6, 201010213719.5, 201010213721.2以及 2010年 12 月 24 日 提交的国 际申请号 PCT/CN2010/002150 和 PCT/CN2010/002149的优先权, 其完整内容通过引用在此合并。 技术领域

本发明涉及核酸测序技术领域, 特别是 PCR测序技术领域。 另外,本发明还涉及 DNA分子标签技术和 DNA不完全打断策略。 本发明的方法特别适用于第二代测序技术, 尤其是第二代测序技 术中的 Pair-end测序技术, 还可以用于 HLA基因分型。 特别地, 本发明提供了用于 HLA基因分型的方法, 特别是用于 HLA-A、 HLA-B、 HLA-C和 HLA-DQB1基因分型的方法, 以及所述方法 中使用的 PCR扩增引物对。 背景技术

PCR测序 (PCR sequencing )方法是通过 PCR的方法得到 目的基因 DNA片段,再通过对所得到的目的基因 DNA片段进行 DNA序列检测, 从而得到目的基因 DNA序列信息的一种技术, 长久以来广泛应用于基因突变检测以及基因分 型等领域。

DNA测序技术主要分为以桑格( Sanger )测序法为代表的第 一代 DNA测序技术与以 Illumina GA, Roche 454, ABI Solid等为 代表的的第二代 DNA测序技术。 桑格 DNA测序技术具有实验操 作简单、 结果直观、 准确和实验周期短等特点, 在对检测结果时 效性要求很高的临床基因突变检测以及基因分 型等领域有着广泛 的应用。 但其通量小、 成本高等特点限制了其在需要进行大规模 基因分型领域的应用。

第二代 DNA测序技术与第一代 DNA测序技术相比, 具有测 序通量大、 成本低、 自动化程度高和单分子测序的特点, 以 Illumina GA单分子测序技术为例,其一个实验流程可以 生 50G (约 500亿)碱基的数据, 平均每天产生 50亿碱基的数据, 平均 每个碱基的测序成本不到桑格法测序成本的 1/1000, 且结果分析 可通过计算机直接处理,是一种非常适合大规 模测序项目的技术。 但第二代测序技术的连续测序长度普遍较短, 当前 Illumina GA 双向最大测长为 200bp; Roche 454 GS-FLX的最大测长虽然可以 达到 500bp左右, 但其测序成本较高, 通量较小。 当 PCR产物 的长度大于测序仪的测长时,直接采取 PCR测序的方法, 不能把 整个 PCR产物测通, 得不到被检测 PCR产物的全部 DNA序列 信息。短的测序读长限制了第二代测序技术在 PCR测序方法中的 应用,除了通过逐步改进测序技术来获得更长 的实际测序读长外, 开发可克服第二代 DNA测序仪现有测序读长在 PCR测序应用领 域不足的新技术也成为当务之急。

人类白细胞抗原 , 即 HLA(human leukocyte antigen, HLA), 是迄今为止发现的多态性最高的基因系统之一 , 它是调控人体特 异性免疫应答和决定疾病易感性个体差异的主 要基因系统, 与同 种异体器官移植的排斥反应密切相关。 研究发现, 移植时, 供受 双方的 HLA-A、 B、 C、 DRB1、 DQB1等基因的匹配程度越高, 分辨率越高, 移植物的存活时间越长。 在造血干细胞移植前, 对 供受双方进行 HLA基因高分辨率配型已经成为一项常规检测项 I 。

目前国际标准的 HLA 高分辨率基因分型技术是基于桑格测 序技术的 PCR测序方法, 该方法通过 PCR扩增相应 HLA的基 因区域, 对扩增产物测序, 测序结果经过专业的分型软件分型, 最终得到样本的 HLA基因型别信息。 其具有直观、 高分辨且能 检测新的等位基因的特点。 但因桑格测序的成本高、 通量小等特 点限制了其在类似造血干细胞志愿者登记库 (骨髓库)这种需要 进行大规模 HLA分型检测的机构中的应用。

有文献报道利用基于 Roche 454 GS-FLX的 PCR测序方法进 行 HLA分型的技术, 但因其本身测序成本相对较高, 致使其检 测通量和检测成本与基于桑格测序的 HLA分型技术相比没有明 显优势。 Illumina GA与 Roche 454 GS-FLX相比, 虽然最大测长 较短, 但测序通量和测序成本具有明显优势, 如果能够克服 Illumina GA测序读长的缺陷, 将其应用于 HLA分型领域, 将能 弥补现有 HLA分型方法的不足。 发明内容

当前利用第二代测序技术, 对大量样本中的特定基因相关序 列同时进行测序分析时,一般会采用 PCR测序的策略,直接利用 引物标签 + 二代测序技术的组合。 当所用测序仪的测长可以覆 盖整个 PCR产物的长度时,上述技术就足够满足要求了 。但当所 用测序仪的测长不够覆盖整个 PCR产物的长度时 ,要么更换具有 更长测长的第二代测序仪(如用 Roche 454 GS-FLX)替代 Illumina GA, 如果测长还不满足要求的话, 只能牺牲成本和通量, 改用第 一代测序仪。

现实情况是, Illumina GA具有超高测序通量, 但其测长才 200bp; Roche 454 GS-FLX的测长虽然可以达到 500bp, 但其测 序成本较高, 通量较小; 第一代测序仪的测长虽然可以达到 lOOObp以上, 但其通量和成本没法和第二代测序仪相比。

有没有能够兼顾成本和通量, 能提高测序仪可以测通的 PCR 产物长度的技术呢? 本专利中的引物标签 + DNA不完全打断策略 + 二代测序技术的组合能在充分利用第二代测序 仪高通量、 低成 本特点的同时,使测序仪能够测通的 PCR产物长度达到测序仪本 身测长以上, 大大扩大了其适用范围。 其中, 本发明的所采用的 二代测序技术包括第二代测序技术中的 Pair-end测序技术, 以及 针对 PCR模板有 DNA参考序列 (DNA Reference Sequence ) 的 PCR测序技术。

本发明提供了用于 PCR测序的方法,通过所述方法减少了自 身测序读长较短造成的限制,扩大了第二代 DNA测序技术在 PCR 测序应用领域的应用。 例如, 在利用二代测序技术进行测序过程 中, 可以使用 5,末端添加引物标签(primer index )序列的标签引 物进行, 可以将扩增后的 PCR产物进行打断, 并且打断后产物进 行末端修复并在其 3,端连接脱氧腺苷 (A ) , 然后连接不同的 PCR-free接头。

基于 DNA分子标签技术和 DNA不完全打断策略的 PCR测 序方法的使用可在不增加引物标签数目的情况 下, 大大提高可唯 一标记的样本数目 (图 5 )。 在本发明中, 通过对正反 PCR引物 添加引物标记, 结合 DNA 不完全打断策略, 使第二代测序技术 应用于 PCR测序领域时, 实际可测得的 PCR产物长度超过测序 仪的最大测序长度。

在扩增引物前端连接一段标签序列是为了实现 同时对多个样 品进行测序。 具体而言, 可以结合 PCR-index/barcode技术, 通过 在 PCR引物的 5,末端添加引物标签( primer index )序列合成标签 引物, 在 PCR过程中对每个样本引入独特的引物标签。 这样, 在 利用第二代 DNA测序技术检测过程中,除 PCR环节必须逐个样本 处理外, 其它实验环节可把多个样本混在一起同时处理 , 最终每个 样本的检测结果可以通过其独特的引物标签序 列找回。

"接头(adapter ),,或 "文库接头( library adapter ),,标签技术 是指通 it t多个测序文库添加不同文库接头(不同文库 头的组成 序列不同, 序列不同的部分称为接头标签(adapter index ) ) , 构 建标签测序文库, 从而可实现多个不同标签测序文库混合测序, 且 最终各个标签测序文库的测序结果可相互区分 的一种文库标签技 术。术语" PCR-Free文库接头( adapter ),,是指经设计的一段碱基, 其主要作用是辅助固定 DNA分子在测序芯片上以及提供通用测序 引物的结合位点, PCR-Free文库接头可以通过 DNA连接酶将其直 接连接至测序文库中的 DNA 片段两端,接头的导入过程因为没有 PCR的参与, 因此称作 PCR-Free文库接头。 例如, 本发明实施例 中使用 PCR-FREE文库接头来自 ILLUMIA。

结合文库接头标签技术的 PCR-FREE的文库构建方法,是指 将文库接头直接连接至测序文库中的 DNA片段两端,文库接头的 导入过程因为没有 PCR的参与, 因此称作 PCR-Free文库构建。 其中接入方法可以采用 DNA连接酶进行连接。 其整个文库构建 过程中无 PCR的参与, 避免了在高序列相似度的 PCR产物混合 ( pooling )文库的构建过程中, 由 PCR 引入错误而导致最后结 果的不准确性。

本发明中涉及的 DNA扩增方法、 从样品提取 DNA的方法、 DNA纯化方法和 DNA序列比对的方法可以是本领域中的任何可用 方法。 所述方法可以由本领域技术人员根据具体情况 进行选择。 对 于 DNA测序的方法, 本领域技术人员可以根据常规的方法进行, 或者根据测序仪器的使用说明书进行。

引物标签的设计根据所应用的实验平台不同而 不同, 考虑

Illumina GA测序平台本身的特点, 本发明在设计引物标签时主 要考虑了以下几点: 1: 引物标签序列中避免 3 个以上 (包括 3 个)单碱基重复序列, 2: 所有引物标签的同一位点中碱基 A和 碱基 C的总含量占所有碱基含量的 30%-70%之间, 3: 引物标签 序列本身的 GC含量在 40-60%之间, 4: 引物标签之间序列差异 度大于 4个碱基, 5: 引物标签序列中避免出现与 Illumina GA测 序引物相似度高的序列, 6: 减少引物标签序列添加到 PCR引物 上后 , 对 PCR引物造成的严重发卡( hairpin ), 二聚体 ( dimer ) 情况的出现。

本发明通过 PCR反应在 PCR产物两端各引入一个引物标签 (引物标签序列可以相同也可以不同),使 PCR产物任何一端的 引物标签都可以特异的标记 PCR产物的样本信息。 所得 PCR产 物经过经不完全打断。所谓不完全打断,指打 断终产物中包含完整 的未被打断的 PCR产物和局部打断的 PCR产物。所述打断方法包 括但不限于化学打断方法 (例如酶切)和物理打断方法, 所述物 理打断方法包括超声波打断方法或机械打断方 法等。打断的 DNA 经 2%琼脂糖电泳, 割胶纯化回收从测序仪最大读取长度到测序仪 可适用的最长 DNA长度范围之间的所有 DNA条带 ( Illumina GA 测序仪可适用的最长 DNA为 700bp, 此长度为原始 DNA长度, 没 有包括文库接头序列长度) 。 纯化回收方法包括但不限于电泳割 胶回收, 也可以是磁珠回收等。 回收的 DNA片段再按照第二代测 序仪测序文库构建的流程构建测序文库, 然后进行测序, 优选为 采用 PCR-FREE测序文库构建的流程构建测序文库,测 方法优 选采用 Pair-End方法测序。 PCR-Free测序文库构建的流程按照 本领域技术人员已知方法构建。 在得到测序总数据中, 通过引物 标签序列可以找到所有所测样本的序列信息, 利用 BWA把各个 测序序列定位到 PCR 产物的相应 DNA 参考序列 (Reference Sequence )上,再通过测序序列之间的重叠和连锁关系 接出 PCR 产物的完整序列(图 1)。此处连锁是指由 Pair-End测序特点决定的 pair- end连锁关系。

IUumina GA测序 ( IUumina公司的 Genome Analyzer测序 仪, 简称 IUumina GA )是利用边合成边测序的原理进行 DNA序 列分析,可以检测单体型,其最终产出的数据 是一系列的 ^序列, 可直接用于与 HLA数据库中的参考序列直接比对, 不存在传统分 型软件峰图误判的问题, 有利于软件分型的自动化。 IUumina GA 的测序通量大, 目前一个实验流程下来可以产生 50G ( 500亿)碱 基的数据, 平均每天产生 50亿碱基的数据。 高的数据通量可以在 测序序列数确定的情况下, 使得每条序列获得高的测序深度, 确保 测序结果的可靠性。

目前还未有将 IUumina GA应用于 HLA分型领域的研究, 本 发明首次将 IUumina GA测序应用于 HLA分型领域,结合 DNA分 子标签技术、 DNA不完全打断及 PCR-FREE建库的 PCR测序技 术, 实现 HLA的低成本, 高通量、 高准确率、 高分辨率的分型。

本发明中 , 采用基于 DNA分子标签技术、 DNA不完全打断及 PCR-FREE建库的 PCR测序技术, 通过对待分析样本分组, 再对 每组样本通过双向引物标签标记的引物, 对 HLA基因目的片段扩 增 ( PCR产物的最大长度取决于测序仪可结合的最大 DNA长度, 当前 Illumina GA适用的最大 DNA长度为 700bp, 此长度为原始 DNA长度, 没有包括文库接头序列长度) , 所得 PCR产物等量混 合, 经 DNA不完全打断处理, 构建 PCR-Free标签测序文库。 把 各样本组得到的不同标签测序文库等摩尔混合 ,选择性回收片段长 度大于测序仪最大测序长度以上的所有 DNA片段,随后用 Illumina GA测序仪测序。 通过对测序结果中接头标签(adapter index ) 、 引物标签以及 PCR引物的序列信息筛选, 可获得每个样本的 DNA 序列信息, 所得 DNA序列经过组装与 IMGT HLA专业数据库中 对应数据库的比对, 最终可得到样本的 HLA基因型别。

在上文所述的方法中, 所述 DNA打断后, 在构建 PCR-Free 标签文库的过程中, 对不同组样品的 DNA用不同的文库接头连 接, 从而在其后的分型步骤中, 基于每个样品所用的引物标签和 接头标签, 将获得的测序结果与样本一一对应。 利用比对程序把 各个样本测序序列定位到其 PCR产物已知相应的 DNA参考序列 ( Reference Sequence )上, 通过序列重叠和连锁关系, 从打断后 的 DNA的序列拼接出完整的 PCR产物序列。

本发明提供了基于 illumina GA测序技术的 HLA基因高分辨 率分型方法, 从而实现单体型测序、 软件分型自动化, 提高 HLA 基因分型的通量, 降低成本。 鉴于现有新测序技术对 DNA模板长度的要求和新测序技术 读长偏短的事实,原用于 HLA-SBT方法的 PCR引物不再适用以 新测序技术为基础的 HLA 高分辨分型方法。 本发明设计了全新 的分别单独扩增 HLA-Α,Β基因的 2, 3, 4号外显子的特异性和 保守性良好的 PCR引物, 且 PCR产物长度不大于 700bp, 特别 适用于 Illumina GA (当前 Illumina GA适用的最大 DNA长度为 700bp ) 。 本发明所提供的一套 PCR引物可用于对受试者(特别 是人)进行大规模、 高通量和低成本的 HLA基因分型。

本发明采用的技术方案是, 从 IMGT/HLA 因特网站点 ( http://www.ebi.ac.uk/imgt/hla/ ) 下载所有最新 HLA-A/B基因 序列, 然后保存到本地磁盘中做为 HLA-A数据集; 同时下载所 有最新非 HLA-A的 HLA-I类基因序列做为比较数据集。 将两数 据集进行比较, 在 2, 3, 4号外显子两端和内部寻找各基因位点 保守和特异序列,并将设计的 PCR引物序列与人类全基因组序列 进行同源性比较。 由于 HLA-A/B基因与同属于 HLA-I类分子的 其它基因具有很高的序列相似性,在设计 PCR引物时尽量保证引 物 3,末端特异, 确保引物扩增 HLA-A/B基因的特异性。 同时使 PCR产物的长度小于 700bp, 且正反引物的退火温度基本保持一 致。

将满足设计要求的多对候选 HLA-A/B 引物用于扩增少数具 有 HLA-A/B常见血清型的模板 DNA, 从中筛选出保守性和特异 性最好的,分别用于扩增 2, 3, 4号外显子的 2套各 6对 HLA-A/B 的 PCR引物。

用筛选出的 2套各 6对 PCR引物为基础引物, 并以此设计 95套标签引物分别扩增 95个和 950个具有 HLA-A/B常见血清型 的 DNA模板 (该部分模板的 HLA型别包括所有常见 HLA-A/B 的血清型)。 所有 PCR产物等量混合后用 Illumina GA Pair-End 100 测序, 组装后的测序结果通过分型与原分型结果比较 来验证 PCR引物的保守性和特异性。

本发明设计的 HLA-Α,Β位点引物, 即分别用于扩增 2, 3, 4 号外显子的 2套各 6对 HLA-A/B的 PCR引物分别见表 1和表 2。 表 1 HLA-Α,Β位点 PCR引物

其中, 简并引物是指代表编码单个氨基酸所有不同碱 基可能性 的不同序列的混合物。 为了增加特异性, 可以参考密码子使用表, 根据不同生物的 使用偏好, 减少简并性。 其中 R = A/G, Y = C/T, M = A/C, K = G/T, S = C/G, W = A/T, H = A/C/T, B = C/G/T, V = A/C/G, D = A/G /T, N=A/C/G/T。

本发明采用如上涉及用于扩增 HLA-A/B基因 2、 3和 4号外显 子的 PCR引物的方法设计扩增 HLA-C的 2、 3和 4号外显子的 2 套各 3对 PCR引物。

在如下的实施例中, 用筛选出的 2套各 3对 PCR引物, 分别 对 95例和 950例已知 HHLA常见基因型别的血样进行 HLA-C位 点 PCR扩增, 扩增产物经 Sanger法和第二代测序方法进行测序。 将测序结果用于 HLA-C 分型, 并通过与原分型结果比较来验证 PCR引物的保守性和特异性。

本发明提供了用于扩增 HLA-C基因的 2、 3和 4号外显子的 2 套各 3对 PCR引物, 它们分别是表 3中显示的 SEQ ID NO: 25和 26、 27和 28以及 29和 30, 以及表 4中显示的 SEQ ID NO: 31和 32、 33和 34以及 35和 36。 所述 6对 PCR引物具有良好的保守性 和特异性, 并且可覆盖 HLA-C位点 2、 3和 4号外显子全长序列, PCR产物长度均小于 700bp, 满足正常 Illumina Solexa测序要求。 另外, 本发明的引物还适用于 Sanger法测序。

表 3: HLA-C基因 2、 3和 4号外显子的 PCR引物

30 C-R4 GC TC TGGG AAAGG AGGRG AAGG 表 4: HLA-C基因 2、 3和 4号外显子的 PCR引物

根据如上所述的方法,为了将第二代测序技术 用于 HLA-DQB1 基因分型, 本发明提供了用于扩增 HLA-DQB1的 2和 /或 3号外显 子的 PCR引物, 它们是表 5中显示的 SEQ ID NO: 37-40。 所述 PCR引物具有良好的保守性和特异性, 并且可覆盖 HLA-DQB1位 点 2、 3号外显子全长序列, PCR产物长度均小于 700bp, 满足正 常 Illumina Solexa测序要求。另外,本发明的引物还适用于 Sanger 法测序。

应用本发明提供的扩增引物对和基因分型方法 , 能够在扩增

HLA-DQB1的 2和 /或 3号外显子的基础上进行基因分型。 相对于 现有技术而言, 该分型方法利用了 Illumina Solexa测序技术, 该技 术具有可高通量、 低成本地获得高分辨的 HLA分型结果的特点。 具体实施方式

一种核酸测序方法

本发明一方面提供了一种测定样品中目的核酸 的核苷酸序列 的方法, 其包括:

1 )提供 n个样品, n为大于等于 1的整数, 所述样品优选地来 自哺乳动物, 更优选是人, 特别是人的血样; 可选地, 将待分析 的 n个样品分成 m个小组, m为整数且 n > m > l;

2 )扩增: 对于每一个样品, 使用一对或多对标签引物, 在存 在来自该样品的模板时, 在适于扩增目的核酸的条件下进行 PCR 扩增, 其中, 每一对标签引物由包含引物标签的正向标签引 物和 反向标签引物 (均可以是简并引物)构成, 其中正向标签引物和 反向标签引物所包含的引物标签可以相同或者 不同; 不同样品所 用标签引物对中的引物标签彼此不同;

3 ) 混合: 当 n>l时, 将各样品的 PCR扩增产物混合在一起;

4 )打断: 将所得的扩增产物进行不完全打断, 并进行纯化回 收;

5 )测序: 将回收的 DNA混合物利用二代测序技术, 优选的是 Pair-End技术(例如 Illumina GA、 Illumina Hiseq 2000 )进行测序, 获得打断后的 DNA的序列; 和

6 )拼接:基于每个样品独特的引物标签将获得 测序结果与 样品 对应, 利用比对程序 (例如 Blast, BWA程序)把各个测 序序列定位到 PCR产物的相应 DNA参考序列上, 通过序列重叠和 连锁关系, 从打断后的 DNA的序列拼接出完整的目的核酸。

根据本发明的一个方面, 每一对引物标签与 PCR引物对组合 成一对标签引物, 正反 PCR引物的 5,端分别具有 (或者任选通过 连接序列连接)正向引物标签和反向引物标签 。 在本发明的一个具体实施方式中, 所述 PCR引物是用于扩增 HLA基因的 PCR引物, 特别是用于扩增 HLA-A/B基因的 PCR引 物, 优选的是 HLA-A/B的 2, 3, 4号外显子以及 HLA-DRB1 2号外 显子的 PCR引物, 优选的所述用于扩增 HLA-A/B的 2, 3 , 4号外 显子的 PCR引物如表 1或表 2所示, 优选的所述用于扩增 HLA-DRB1 2号外显子的 PCR引物如表 7所示。

在本发明的一个具体实施方式中, 所述 PCR引物是用于扩增 HLA基因的 PCR引物, 特别是用于扩增 HLA-C基因的 PCR引物, 优选的是用于扩增 HLA-C的 2, 3和 /或 4号外显子的 PCR引物, 优 选的所述 PCR引物如表 3或表 4所示。

在本发明的一个具体实施方式中, 所述 PCR引物是用于扩增 HLA基因的 PCR引物,特别是特别是用于扩增 HLA-DQB1基因的 PCR引物,优选的是用于扩增 HLA-DQB1基因 2和 /或 3号外显子的 PCR引物, 优选的所述 PCR引物如表 5所示。

在本发明的一个方面中, 其中所述引物标签针对 PCR引物进 行设计, 优选针对用于扩增 HLA的特定基因的 PCR引物进行设 计, 更优选是用于扩增 HLA-A/B的 2 , 3 , 4号外显子以及 HLA-DRB1 2号外显子的 PCR引物, 特别是如表 1或表 2或者表 7 所示的 PCR引物进行设计, 所述引物标签特别是包括表 6所示 95 对引物标签中的至少 10对, 或至少 20对, 或至少 30对, 或至少 40 对, 或至少 50对, 至少 60对, 或至少 70对, 或至少 80对, 或至少 90对,或 95对(或者所述一组引物标签由表 1所示 95对引物标签中 的 10 - 95对(例如 10 - 95对, 20 - 95对, 30 - 95对, 40 - 95对, 50 - 95对, 60 - 95对, 70 - 95对, 80 - 95对, 90 - 95对, 或 95 对)组成) , 并且

所述一组引物标签优选地至少包括表 6所示 95对引物标签中 的 PI-1至 PI-10 , 或 Pi ll至 PI-20 , 或 PI-21至 PI-30 , 或 PI-31至 PI-40,或 PI-41至 PI-50,或 PI-51至 PI-60,或 PI-61至 PI-70,或 PI-71 至 PI-80 , 或 PI-81至 PI-90, 或 PI-91至 PI-95 , 或者它们任何两个 或者多个的组合。

在本发明的一个具体实施方式中, 所述 DNA打断包括化学打 断方法和物理打断方法, 其中所述化学方法包括酶切方法, 所述 物理打断方法包括超声波打断方法或机械打断 方法。

在本发明的一个具体实施方式中, 所述 DNA打断后, 纯化回 收从测序仪最大读取长度到测序仪可适用的最 长 DNA长度范围之 间的所有 DNA条带,其中所述纯化回收方法包括但不限于 电泳割胶 回收, 也可以是磁珠回收。

在本发明的另一方面中,测定样品中目的核酸 的核苷酸序列的 方法还可以包括权利要求 1所述的步骤 1 ) - 4 ) , 以及如下步骤:

5 )建库: 将打断后的 PCR产物文库构建 PCR-Free测序文库, 可以对文库添加不同的文库接头 ( adapter ) 以区分不同的 PCR-Free测序文库,纯化回收位于所用测序仪最 读长长度到所 用测序仪适用的最长 DNA长度范围之间的所有 DNA条带,优选地 是 450-750bp长度范围的 DNA片段;

6 ) 测序: 将回收的 DNA混合物利用二代测序技术, 优选的 是 Pair-End技术(例如 Illumina GA、 Illumina Hiseq 2000 )进行 测序, 获得打断后的 DNA的序列;

7 )拼接:基于各个文库不同的文库接头序列和 个样品独特 的引物标签将获得的测序结果与样品一一对应 ,利用比对程序(例 如 Blast,BWA程序 各个测序序列定位到 PCR产物的相应 DNA 参考序列上,通过序列重叠和连锁关系,从打 断后的 DNA的序列 拼接出完整的目的核酸。 本发明一方面还提供了上文所述的方法用于 HLA分型的用 途, 其特征在于包括: 使用所述方法对来自患者的样品 (特别是 血样)进行测序,以及将测序结果与 HLA数据库(如 IMGT HLA 专业数据库) 中 HLA外显子, 优选地 HLA-A/B的 2, 3, 4号外 显子, HLA-C的 2, 3和 /或 4号外显子, HLA-DQB1基因 2和 / 或 3号外显子和 /或 HLA-DRB1 2号外显子的序列数据比对, 序 列比对结果 100 %匹配的即为对应样本的 HLA基因型别。 一组引物标签

本发明另一方面提供了一组引物标签,其包括 表 6所示 95对引 物标签中的至少 10对, 或至少 20对, 或至少 30对, 或至少 40对, 或至少 50对, 至少 60对, 或至少 70对, 或至少 80对, 或至少 90对, 或 95对 (或者所述一组引物标签由表 1所示 95对引物标签中的 10 - 95对(例如 10 - 95对, 20 - 95对, 30 - 95对, 40 - 95对, 50 - 95对, 60 - 95对, 70 - 95对, 80 - 95对, 90 - 95对, 或 95对)组 成) , 并且

所述一组引物标签优选地至少包括表 6所示 95对引物标签中 的 PI-1至 PI-10 , 或 PI-11至 PI-20 , 或 PI-21至 PI-30 , 或 PI-31至 PI-40,或 PI-41至 PI-50,或 PI-51至 PI-60,或 PI-61至 PI-70,或 PI-71 至 PI-80 , 或 PI-81至 PI-90, 或 PI-91至 PI-95 , 或者它们任何两个 或者多个的组合。

本发明进一步提供了所述的一组引物标签用于 PCR测序方法 的用途, 其中特别是, 每一对引物标签与用于扩增待测目的序列 的 PCR引物对组合成一对标签引物, 正反 PCR引物的 5,端分别具 有(或者任选通过连接序列连接)正向引物标 签和反向引物标签。

在本发明的一个方面中, 所述 PCR引物是用于扩增 HLA的特 定基因的 PCR引物, 优选是用于扩增 HLA-A/B的 2 , 3 , 4号外显 子以及 HLA-DRB1 2号外显子的 PCR引物, 优选的所述用于扩增 HLA-A/B的 2 , 3 , 4号外显子的 PCR引物如表 1或表 2所示, 优选 的所述用于扩增 HLA-DRB1 2号外显子的 PCR引物如表 7所示;或 者优选是用于扩增 HLA-C的 2, 3和 /或 4号外显子的 PCR引物, 优 选的所述 PCR引物如表 3或表 4所示; 或者优选是用于扩增 HLA-DQB1基因 2和 /或 3号外显子的 PCR引物, 优选的所述 PCR 引物如表 5所示。 在本发明的另一方面中, 提供了上述一组引物标签与用于扩 增待测目的序列的 PCR引物对组合成的一组标签引物, 其中每一 对引物标签与 PCR引物对组合成一对标签引物, 正反 PCR引物的 5,端各具有 (或者任选通过连接序列连接)一个引物标签 。

在本发明的一个具体实施方式中, 所述 PCR引物是用于扩增 HLA的特定基因的 PCR引物, 优选是用于扩增 HLA-A/B的 2, 3, 4号外显子以及 HLA-DRB1 2号外显子的 PCR引物,优选的所述用 于扩增 HLA-A/B的 2, 3, 4号外显子的 PCR引物如表 1或表 2所示, 优选的所述用于扩增 HLA-DRB1 2号外显子的 PCR引物如表 7所 示; 或者优选是用于扩增 HLA-C的 2, 3和 /或 4号外显子的 PCR引 物, 优选的所述 PCR引物如表 3或表 4所示; 或者优选是用于扩增 HLA-DQB1基因 2和 /或 3号外显子的 PCR引物, 优选的所述 PCR 引物如表 5所示。

本发明另一方面还提供了上述的标签引物用于 PCR测序方法 的用途。 一种 HLA分型方法

在本发明的一个方面中,提供了一种 HLA分型方法,其包括:

1 )提供 n个样品, n为大于等于 1的整数, 所述样品优选地来 自哺乳动物, 更优选是人, 特别是人的血样;

2 )将待分析的 n个样品分成 m个小组, m为整数且 n > m > l;

3 )扩增: 对于每一个样品, 使用一对标签引物, 在存在来自 该样品的模板时, 在适于扩增目的核酸的条件下进行 PCR扩增, 其中, 每一对标签引物由包含引物标签的正向标签引 物和反向标 签引物 (均可以是简并引物)构成, 其中正向标签引物和反向标 签引物所包含的引物标签可以相同或者不同; 不同样品所用标签 引物对中的引物标签彼此不同;

4 ) 混合: 将各样品的 PCR扩增产物混合在一起, 获得 PCR 产物文库;

5 )打断: 将所得的 PCR产物文库进行不完全打断;

6 )建库: 结合文库接头标签技术, 将打断后的 PCR产物文库 构建 PCR-Free测序文库, 可以对文库添加不同的文库接头

( adapter ) 以区分不同的 PCR-Free测序文库, 回收位于所用测 序仪最大读长长度到所用测序仪适用的最长 DNA长度范围之间 的所有 DNA条带, 具体而言是 450-750bp长度范围的 DNA片段;

7 ) 测序: 将回收的 DNA混合物利用二代测序技术, 优选的 是 Pair-End技术(例如 Illumina GA、 Illumina Hiseq 2000 )进行 测序, 获得打断后的 DNA的序列;

8 )拼接:基于各个文库不同的文库接头序列和 个样品独特 的引物标签将获得的测序结果与样品一一对应 ,利用比对程序(例 如 Blast, BWA程序)把各个测序序列定位到 PCR产物的相应 DNA 参考序列上, 通过序列重叠和连锁关系, 从打断后的 DNA的序列 拼接出完整的目的核酸; 和

9 )分型: 将测序结果与 HLA数据库(如 IMGT HLA专业 数据库)中 HLA外显子, 优选地 HLA-A/B的 2, 3, 4号外显子, HLA-C的 2, 3和 /或 4号外显子, HLA-DQB1基因 2和 /或 3号 外显子和 /或 HLA-DRB1 2号外显子的序列数据比对, 序列比对 结果 100 %匹配的即为对应样本的 HLA基因型别。

在本发明的所述的 HLA分型方法中, 其中每一对引物标签与 PCR引物对组合成一对标签引物, 正反 PCR引物的 5,端分别具有 (或者任选通过连接序列连接)正向引物标签 反向引物标签。

在本发明的一个具体实施方式中, 所述 PCR引物是用于扩增 HLA的特定基因的 PCR引物, 优选是用于扩增 HLA-A/B的 2, 3, 4号外显子以及 HLA-DRB1 2号外显子的 PCR引物,优选的所述用 于扩增 HLA-A/B的 2, 3, 4号外显子的 PCR引物如表 1或表 2所示, 优选的所述用于扩增 HLA-DRB1 2号外显子的 PCR引物如表 7所 示; 或者优选是用于扩增 HLA-C的 2, 3和 /或 4号外显子的 PCR引 物, 优选的所述 PCR引物如表 3或表 4所示; 或者优选是用于扩增 HLA-DQB1基因 2和 /或 3号外显子的 PCR引物, 优选的所述 PCR 引物如表 5所示。

在本发明的一个具体实施方式中, 所述引物标签是如上文所 述的一组引物标签。

在本发明所述的 HLA分型方法的一个具体实施方式中, 所述 DNA打断包括化学打断方法和物理打断方法, 其中所述化学方法 包括酶切方法, 所述物理打断方法包括超声波打断方法或机械 打 断方法。

在本发明所述的 HLA分型方法的一个具体实施方式中, 所述 纯化回收方法包括但不限于电泳割胶回收, 也可以是磁珠回收。 在本发明所述的 HLA分型方法中, 所述结合文库接头标签技 术, 将打断后的 PCR产物文库构建 PCR-Free测序文库是指使用 m 种文库接头给 2 )中得到的 m个 PCR产物文库加上接头, 其中每一 个 PCR产物文库使用一种不同的文库接头, 从而构建 m个接头标 签测序文库; 将 m个接头标签测序文库等摩尔混合在一起构建 合接头标签测序文库。 其中连接文库接头的方法是指不通过 PCR 程序直接采用 DN A连接酶进行连接。 用于 HLA基因分型的 PCR引物

本发明在一个方面中, 提供了用于 HLA基因分型的 PCR引 物, 其特征在于所述 PCR引物是用于扩增 HLA-A/B的 2, 3, 4号 外显子以及 HLA-DRB1 2号外显子的 PCR引物, 优选的所述用于 扩增 HLA-A/B的 2, 3, 4号外显子的 PCR引物如表 1或表 2所示, 优选的所述用于扩增 HLA-DRB1 2号外显子的 PCR引物如表 7所 示; 或者是用于扩增 HLA-C的 2, 3和 /或 4号外显子的 PCR引物, 优选的所述 PCR引物如表 3或表 4所示; 或者用于扩增 HLA-DQB1 基因 2和 /或 3号外显子的 PCR引物, 优选的所述 PCR引物如表 5所 示。

本发明进一步提供了上述的 PCR引物的用于测序的方法,其 包括:

提供样品, 特别是血样, 所述血样优选地来自哺乳动物, 特 别是人;

扩增: 使用所述 PCR引物用于扩增血样来源的 DNA从而得 到 PCR产物, 并对 PCR产物进行纯化;

测序: 对所述 PCR产物进行测序, 测序方法可以是 Sanger 测序法,或者可以是第二代测序法(例如 HiSeq 2000, Illumina GA 和 Roche454 ) 。

本发明另一方面还提供了上述 PCR引物用于 HLA基因分型 的用途,其特征在于使用上述的 PCR引物,根据上述测序方法得 到的结果进行组装和比对分析, 并将测序结果与数据库中的标准 序列进行比较, 得到 HLA基因分型结果。

本发明另一方面进一步还提供了一种用于进行 HLA基因分 型的试剂盒, 所述试剂盒中包括上述 PCR引物。 用于 HLA-Α,Β基因分型的 PCR引物

本发明一方面提供了一套用于 HLA-A,B基因分型的 PCR引 物, 其特征在于所述 PCR引物如表 1或表 2所示。

本发明另一方面提供了本发明用于 HLA-A,B基因分型的 PCR 引物的用于测序的方法, 其包括:

提供样品, 特别是是血样, 所述血样优选地来自哺乳动物, 特 别是人;

扩增:使用所述 PCR引物用于扩增血样来源的 DNA从而得到 PCR产物, 并对 PCR产物进行纯化;

测序: 对所述 PCR产物进行测序, 测序方法可以是 Sanger测 序法,或者可以是第二代测序法(例如 HiSeq 2000、 Illumina GA 和 Roche454 )

本发明另一方面提供了本发明用于 HLA-A,B基因分型的 PCR 引物用于 HLA基因分型的用途,其特征在于使用上述的 PCR引物, 根据上述方法得到的测序结果进行组装和比对 分析,并将测序结果 与数据库中的标准序列进行比较, 得到 HLA基因分型结果。

另一方面, 本发明还提供了一种用于进行 HLA基因分型的试 剂盒, 所述试剂盒中包括本发明的用于 HLA-Α,Β基因分型的 PCR 引物。 用于 HLA-C基因分型的 PCR引物

本发明还提供了一种新的 HLA-C基因 2、3和 4号外显子扩增 方法, 其特征在于使用本发明的扩增引物对进行 PCR扩增, 所述 扩增引物对的序列示于表 3或表 4。

由于能够通过 PCR反应扩增出 HLA-C的 2、3和 4号外显子, 因此, 本发明的方法特别有利地可用于进行 HLA-C基因分型。 与 现有的 HLA-C基因分型方法相比, 由于使用本发明的方法和扩增 引物的产物被控制在 700 bp以内, 因此在进一步进行分型时, 可 以利用基于 Illumina Solexa测序技术的 HLA-SBT。

本发明还提供了一种对样品中的 HLA-C基因 2、 3和 /或 4号 外显子进行测序的方法, 其包括步骤:

1 ) 提供一个样品并提取该样品的 DNA;

2 ) 将本发明的用于 HLA-C基因分型的 PCR引物对,优选地 选自 SEQ ID NO: 25和 SEQ ID NO: 26、 SEQ ID NO: 27和 SEQ ID NO: 28、 SEQ ID NO: 29和 SEQ ID NO: 30,或者 SEQ ID NO: 31和 SEQ ID NO: 32、 SEQ ID NO: 33和 SEQ ID NO: 34、 SEQ ID NO: 35和 SEQ ID NO: 36的引物对用于扩增所述 DNA从而 得到 PCR产物, 优选对 PCR产物进行纯化;

3 ) 对所述 PCR产物进行测序, 所述测序优选是通过第二代 测序法,所述第二代测序方法是例如 Illumina Solexa或 Roche454。

本发明还提供了一种 HLA-C基因分型方法, 所述方法包括: 1)使用本发明的用于 HLA-C基因分型的 PCR引物对, 优选 地选自 SEQ ID NO: 25和 SEQ ID NO: 26、 SEQ ID NO: 27和 SEQ ID NO: 28、 SEQ ID NO: 29和 SEQ ID NO: 30, 或者 SEQ ID NO: 31和 SEQ ID NO: 32、 SEQ ID NO: 33和 SEQ ID NO: 34、 SEQ ID NO: 35和 SEQ ID NO: 36的引物对进行 PCR扩增, 扩增待测样本的 HLA-C基因 2、 3和 /或 4号外显子;

2) 对扩增出的外显子进行测序, 并将测序结果与数据库中的 标准序列进行比较, 从而确定基因分型结果, 其中所述测序是通过 Sanger测序法,或者是通过第二代测序法,所述 第二代测序方法是 例如 Illumina Solexa或 Roche454。

另一方面, 本发明还提供了一种用于进行 HLA-C基因分型的 试剂盒, 所述试剂盒中包括本发明的用于 HLA-C基因分型的 PCR 引物对,优选的选自 SEQ ID NO: 25和 SEQ ID NO: 26、 SEQ ID NO: 27和 SEQ ID NO: 28、 SEQ ID NO: 29和 SEQ ID NO: 30, 或者 SEQ ID NO: 31和 SEQ ID NO: 32、 SEQ ID NO: 33 和 SEQ ID NO: 34、 SEQ ID NO: 35和 SEQ ID NO: 36的引物 对。 在一个实施方案中, 所述试剂盒还包含其他试剂, 例如用于 DNA扩增、 DNA纯化和 /或 DNA测序的试剂。

应用本发明提供的扩增引物对和基因分型方法 , 能够在扩增 HLA-C的 2、 3和 4号外显子的基础上进行基因分型。 因此相对于 现有技术而言, 该分型利用了 Illumina Solexa测序技术,提高了通 量, 简化了流程, 同时还节省了时间和成本。 用于 HLA-DQB1基因分型的 PCR 11物

本发明还提供了一种新的 HLA-DQB1的 2和 /或 3号外显子扩 增方法, 其特征在于使用本发明的扩增引物对进行 PCR扩增, 所 述扩增引物对的序列示于表 5。

由于能够通过 PCR反应扩增出 HLA-DQB1的 2和 /或 3号外 显子, 因此, 本发明的方法特别有利地可用于进行 HLA-DQB1基 因分型。 与现有的 HLA-DQB1基因分型方法相比, 由于使用本发 明的方法和扩增引物的产物被控制在 300-400bp之间, 因此在进行 进一步分型时, 可以利用基于 Illumina Solexa 测序技术的 HLA-SBT。

本发明还提供了一种对样品中的 HLA-DQB1的 2和 /或 3号外 显子进行测序的方法, 其包括步骤:

1 ) 提供一个样品并提取该样品的 DNA;

2 ) 将本发明的用于 HLA- DQB1基因分型的 PCR引物对, 优选地表 5中的 PCR引物对用于扩增所述 DNA从而得到 PCR产 物, 优选对 PCR产物进行纯化;

3 ) 对所述 PCR产物进行测序, 测序方法可以是第二代测序 法, 例如 Illumina Solexa或 Roche454。

在本发明另一方面中, 本发明提供了一种改进的 HLA-DQB1 基因分型方法, 所述方法包括:

1) 使用本发明的用于 HLA- DQB1基因分型的 PCR引物对, 优选地表 5中的 PCR扩增引物对扩增待测的 HLA-DQB1的 2和 / 或 3号外显子,

2) 对扩增出的外显子进行测序, 并将测序结果与数据库中的 标准序列进行比较, 从而确定基因分型结果。 其中测序方法可以是 Sanger测序法,或者可以是第二代测序法,所述 第二代测序方法例 如 Illumina Solexa或 Roche 454.

另一方面, 本发明还提供了一种用于进行 HLA-DQB1基因分 型的试剂盒, 所述试剂盒中包含本发明的用于 HLA- DQB1基因分 型的 PCR引物对, 优选地表 5中的 PCR扩增引物对。 在一个实施 方案中, 所述试剂盒还包含其他试剂, 例如用于 DNA扩增、 DNA 纯化和 /或 DNA测序的试剂。 附图说明

图 1: 为引物标签标记, DNA打断和 DNA测序后, 序列拼 接图示。 第 N号样本的 PCR产物两端引入了正反引物标签序列 Index-N-F/R (1), PCR产物经物理方法打断后的产物中包括: 一 端带有引物标签序列的产物, 两端都不带引物标签序列的产物, 完全未被打断的产物, 割胶纯化回收位于测序仪最大读长长度到 测序仪适用的最长 DNA长度范围之间的所有 DNA条带用于测序 ( 2 ) , 利用 Index-N-F/R在测序结果中找回属于第 N号样本的 PCR产物的测序结果, 利用 PCR产物已知的参考序列信息定位 各个测序序列相对参考的位置, 并根据测序序列之间的重叠和连 锁关系组装成完整的 PCR产物的测序结果(3, 4 ) 。

图 2: 为实施例 2 中, 1号样本 HLA-A/B/DRB1相应外显子 PCR产物电泳结果, 从电泳图上看, PCR产物为一系列片段大小 300bp-500b 的单一条带, 其中泳道 M 是分子量标记物 ( DL 2000,Takara公司), 泳道 1-7为 1号样本的 HLA-A/B/DRB1各外 显子(A2、 A3、 A4、 B2、 B3、 B4、 DRB1-2 ) PCR扩增产物, 阴 性对照 (N )无扩增条带。 其它样品的结果与此类似。

图 3: 为实施例 4中, HLA-Mix打断后 DNA电泳情况 (割 胶前后),割胶区域为 450-750bp区域。 其中泳道 M是分子量标记 物( NEB-50bp DNA Ladder ) , 泳道 1是割股前 HLA-Mix的电泳 情况, 泳道 2是割胶后 HLA-Mix的胶图。

图 4: 为实施例 6中, 1号样本的一致性(consensus )序列构 建程序截图, 示例说明了根据引物标签和 DNA片段之间的重叠关 系拼接出 PCR产物的完整序列。关于 HLA分型命名的查询可见于 http://www.ebi.ac.uk/imgt/hla/align.htmlo 从左侧结果输出栏里面 我们看到了 A*02:03:01 A*ll:01:01的所有编码序列的结果,其中 2号外显子的序列与 1号模板原已知结果相同。

图 5:为引物标签和接头标签( adaptor index )标记后的 PCR 产物示意图。 实验时, 通过 PCR在每个样本的 PCR产物两端同 时引入引物标签;把多个带有不同引物标签的 PCR产物混合在一 起, 用于构建测序文库。 测序文库构建过程中, 当需要构建多个 测序文库时, 可通过添加带有不同接头标签的文库接头, 来标记 各个测序文库。 文库构建完毕后, 带有不同接头标签标记的多个 测序文库可以混合在一起同时用 Illumina GA测序 (不同接头标 签标记的测序文库之间的引物标签可以相同) 。测序结果出来后, 通过对测序结果中接头标签和引物标签序列信 息的筛选, 可获得 每个样本的 DNA序列信息。

图 6:为实施例 8中 ,部分样本的 HLA-C 2,3,4号外显子 PCR 产物电泳结果,从电泳图上看, PCR产物片段大小分别为位于 400 -500 b 之间的单一条带,其中泳道 M是 DNA标准分子量参照物 ( DL 2000,Takara公司 ) 。

图 7: 显示了实施例 8中, 对 HLA-Mix打断后 DNA电泳凝 胶割胶的情况, 割胶区域为 450-750 b 区域。 其中泳道 M是分 子量标准物 (NEB-50bp DNA Ladder ) , 泳道 1 示出割股前 HLA-Mix的胶图, 泳道 2示出割胶后 HLA-Mix的胶图。

图 8: 显示实施例 8中, 2号样品的 HLA-C位点的 2号外显 子一致性序列构建程序截图。 首先, 该样本的 C位点的测序序列 通过 BWA软件比对到参考序列上,分别构建出该样本 C位点 2、 3、 4号外显子的一致性序列, 再根据 SNP之间的连锁关系来确 定 C位点各外显子的单体型序列, 最后, 由各外显子单体型序列 的交集确定该样本的型别。如图所示,在 2号样本 C基因序列 695 - 764区域含有 2个杂合 SNP, 由 readl和 read2可确定 SNP连 锁关系分别为: A-C,G-A (图中的"… "表示与参考序列相同的碱 基)。 其序列分别对应 C*010201和 C*07020101型别序列的阴影 部分。 其他区域的连锁关系的判定与此类似。

图 9: 显示实施例 9中, 26份样本 HLA-C位点 2、 3和 4号 外显子 PCR产物电泳图。 26份样本 HLA-C位点 2、 3和 4号外 显子 PCR产物电泳图,如图中所示,所有 PCR产物均小于 500 bp , 且电泳条带单一, 无明显的非特异性条带, 同一对引物对于各样 本的扩增效率均一。

图 10: 显示实施例 9中, 扩增 1号模板 PCR产物测序峰图 经 uType 软件分析的结果, 左侧结果输出栏中显示结果 C*08:01:01 C*15:05:01 , 与 1号模板原已知型别相同。

图 11: 为实施例 10中, 94个样本 HLA-DQB1 2+3外显子 PCR产物电泳结果, 从电泳图上看, PCR产物片段大小为位于 250bp-500b 之间的单一条带, 其中泳道 M是 DNA标准分子量 参照物 ( DL 2000,Takara公司) , 泳道 PI-1至 PI-94为 94个样 本的 HLA-DQB1 2+3外显子 PCR扩增产物, 阴性对照 (N )无 扩增条带。

图 12显示实施例 10中,对 HLA-Q-Mix打断后 DNA电泳凝 胶割胶的情况,割胶区域为 350-550bp区域。其中泳道 M是 DNA 标准分子量参照物( NEB-50bp DNA Ladder ) , 泳道 1示出割股 前 HLA-Q-Mix的胶图, 泳道 2示出割胶后 HLA-Q-Mix的胶图。

图 13示出实施例 10中, 7号样本一致性( consensus )序列 构建程序部分截图, 示例性说明了数据分析的主要流程。 首先, 该样本的 DQB1位点的测序序列通过 BWA软件比对到参考序列 上,构建出该样本 DQB1 2,3外显子的一致性序列,再根据 SNP之 间的连锁关系来确定 DQBl 2,3外显子单体型序列。 如图所示: 在 7号样本 DQB1基因序列 2322-2412区域含有 6个杂合 SNP, 由 readl可确定 SNP1-SNP5的连锁关系为 T-G-T-C-C,由 read2 可确定另一组 SNP1-SNP5 的连锁关系为 C-C-A-G-T, 由 read3 可确定 SNP3-SNP6的连锁关系为 A-G-T-G,由 read4可确定另一 组 SNP3-SNP6的连锁关系为 T-C-C-A,通过上述 SNP的连锁关系 可确定 readl与 read4连锁, read2与 read3连锁,在此区域完整 的 SNP 组合为: T-G-T-C-C-A 和 C-C-A-G-T-G, 其序列对应 DQB1*0303和 DQB1*0602型别序列的阴影部分。 其它区域的连 锁关系的判定与此类似。

图 14示例性显示了实施例 11中,两对 PCR引物分别单独扩 增 HLA-DQB1位点 2和 3号外显子和同时扩增 2和 3号外显子 产物电泳图, 图中显示来自 7个 DNA模板的三组 PCR产物, 所 有 PCR产物长度均小于 500bp, 且电泳条带单一, 无明显的非特 异性条带。 阴性对照 (N )无扩增条带,泳道 M是 DNA标准分子 量参照物 (DL 2000, Takara公司) 。

图 15示例性显示了实施例 11 中, HLA-DQB1扩增 7 号模 板 2和 3号外显子的 PCR产物的测序峰图经 uType软件分析的 结果, 左侧结果输出栏中显示 DQB1*03:03 DQB1*06:02 的结 果, 与 7 号模板原已知结果相同。

图 16为实施例 12中, 1号样本 HLA-A/B/C/DQB1相应外显子 PCR产物电泳结果, 从电泳图上看, PCR产物为一系列片段大小 300bp-500bp的单一条带, 其中泳道 M是分子量标记物 ( DL 2000,Takara公司), 泳道 1-10为 1号样本的 HLA-A/B/C/DQB1各外 显子 (A2、 A3、 A4、 B2、 B3、 B4、 C2、 C3、 C4、 DQBl ) PCR 扩增产物, 阴性对照(N )无扩增条带。 其它样品的结果与此类似。 图 17为实施例 12中, HLA-l-Mix、HLA-2-Mix、HLA-3-Mix、 HLA-4-Mix, HLA-5-Mix, HLA-6-Mix, HLA-7-Mix, HLA-8-Mix, HLA-9-Mix 和 HLA-10-Mix 经等摩尔混合后的琼脂糖胶回收结 果。 其中泳道 M是分子量标记物, 泳道 1为混合物的电泳结果, 泳道 2为对 450-750bp长度范围 DNA片段切胶回收后的电泳图。

图 18显示实施例 12中, 1号样品的 HLA-C位点的 2号外显子一致 性序列构建程序截图。 首先, 该样本的 C位点的测序序列通过 BWA 软件比对到参考序列上, 分别构建出该样本 C位点 2、 2、 4号外显子 的一致性序列, 再根据 SNP之间的连锁关系来确定 C位点各外显子 的单体型序列, 最后, 由各外显子单体型序列的交集确定该样本的 型别。 如图所示, 在 1号样本 C基因序列 695 - 764区域含有 2个杂合 SNP, 由 readl和 read2可确定 SNP连锁关系分别为: A-C,G-A (图 中的"…"表示与参考序列相同的碱基) 。 其序列分别对应 C*010201和 C*07020101型别序列的阴影部分。其他区域的连 关 系的判定与此类似。 实施例

下面将结合实施例对本发明的实施方案进行详 细描述, 但是 本领域技术人员将会理解, 下列实施例仅用于说明本发明, 而不 应视为限定本发明的范围。

在本发明的实施例 1 - 6中, 通过采取引物标签 + DNA不完 全打断策略 + Illumia GA测序仪 Pair-End 100测序技术的组合 对 95个样本的 HLA-A/B 2, 3, 4号外显子以及 HLA-DRB1 2号外 显子的基因分型 ( PCR产物长度大小处于 290bp-500bp之间 ) , 证明该策略可以在充分发挥第二代测序仪高通 量、低成本特点的同 时, 可以实现对超过测序仪本身测长以上的基因片 段的分型。 原理: 将待分析的样本, 通过 PCR反应在 HLA-A/B 2, 3, 4 号外显子以及 HLA-DRB1 2号外显子的 PCR产物两端引入引物标 签, 使其特异的标记 PCR 产物的样本信息。 将各组内样品的 HLA-A/B/DRB1三个位点的 PCR扩增产物混合在一起,获得 PCR 产物文库; 所得 PCR 产物文库经过超声不完全打断后, 构建 PCR-Free测序文库, 测序文库经 2%低熔点琼脂糖电泳, 割胶纯 化回收位于 450bp-750bp 长度范围之间的所有 DNA 条带 (PCR-Free测序文库的构建过程中在 DNA 片段的两端都添加上 了文库接头, 使 DNA 片段在电泳图上体现的长度比实际长度大 了 250bp左右, 因此,此处回收 450bp-700bp的片段, 实际上相当 于回收原长度为 200bp-500bp 的 DNA 片段)。 回收的 DNA 经 Illumina GA PE-100测序。 通过引物标签序列可以找到所有所测 样本的序列信息, 再通过已知 DNA片段的参考序列信息和 DNA 片段序列之间的重叠和连锁关系组装出整个 PCR产物的序列,再 通过与 HLA-A/B/DRB1 相应外显子的标准数据库的比对结果可 组装出原 PCR产物的全序列,实现 HLA-A/B/DRB1的基因分型。 实施例 1

样本提取

使用 KingFisher 自动提取仪 (美国 Thermo公司)从 95份 已知 HLA-SBT分型结果的血样(中国造血干细胞捐献 资料库 (以下称 "中华骨髓库" )) 中提取 DNA。 主要步骤如下: 取出 6 个 Kingfisher自动提取仪配套的深孔板及 1个浅孔板, 根据说明 书分别加入一定量配套的试剂并做好标记, 将所有已加好试剂的 孔板按要求置于相应的位置, 选定程序 "Bioeasy_200ul Blood DNA KF.msz" 程序, 按下 "star" 执行该程序进行核酸提取。 程序结束后收集 plate Elution中的 lOOul左右的洗脱产物即为提 取的 DNA。 实施例 2

PCR扩增

通过合成在 5, 末端具有不同引物标签的 PCR引物制作不同 的 PCR标签引物, 这样不同的 PCR标签引物可以用于不同的样 本, 所述 PCR引物是针对 HLA-A/B的 2, 3, 4号外显子以及 HLA-DRB1 2号外显子的 PCR引物。其后通过 PCR反应在 PCR 产物两端引入引物标签,从而特异地标记了来 自不同样本的 PCR 产物。

以 95套 PCR标签引物来分别扩增 95份 DNA样本,每套 PCR 标签引物由一对双向引物标签(表 6 )和用于扩增 HLA-A/B的 2, 3, 4号外显子 (表 1 ) 以及 HLA-DRB1 2号外显子的 PCR引物 (表 7 )组成, 其中每个正向 PCR引物的 5, 末端上连接一对引 物标签的正向引物标签, 而反向 PCR引物的 5, 末端上连接一对 引物标签的反向引物标签。 引物标签在引物合成时直接添加在 PCR引物的 5,末端。

把实施例 1的样本提取步骤中所得的 95份 DNA, 依次编号 1-95, PCR反应在 96孔板中进行,共 7板,编号分别为 HL A-P-A2、 HLA-P-A3, HLA-P-A4、 HLA-P-B2、 HLA-P-B3, HLA-P-B4以 及 HLA-P-DRB1-2 ( A2/3/4, B2/B3/B4, DRB1-2 表示扩增的位 点) , 板内设置一个不添加模板的阴性对照, 阴性对照所用引物 与模板 1的对应引物相同。 实验的同时, 记录下每对引物标签对 应的样本编号信息。 表 6, 引物标签的相关信息

表 7,未添加引物标签前用于扩增 DRBl相应外显子的 PCR引物

D2-F1, D2-F2, D2-F3, D2-F4, D2-F5, D2-F6, D2-F7为扩增 HLA-DRB1 2号外显子的正向引物, D2-R为扩增 HLA-DRB1 2号 外显子的反向引物。

HLA-A/B/DRB1 的 PCR程序如下:

96 *C 2min

95 "C 30s ^60"C 30s ^72 "Ό 20s (32cycles)

15 "C oo

HLA-A/B的 PCR反应体系如下所有试剂均购自普洛麦^ (北 京)生物技术有限公司 ( Promega )

HLA-DRB1的 PCR反应体系如下:

其中 PI nr A/B/D2-F 1/2/3/4/5/6/7 表示引物 5,末端带有第 n号正向引 物标签序列(表 6 )的 HLA-A/B/DRB1的 F引物, PI nr --A/B/D2-R 2/3/4 表示引物 5,末端带有第 n号反向引物标签序列的 HLA-A/B/DRB1 的 R引物(此处 n < 95 ), 其它依次类推。 且每个样本对应特定的 一套 PCR引物( PI nr A/B/D2-F 1/2 PI nr --A/B/D2-R 2/3/4 )

PCR反应在 Bio-Rad公司的 PTC-200 PCR仪上运行。 PCR完 成后, 取 2ul PCR产物经 1%的琼脂糖凝胶电泳检测。 图 2显示 了 1号样本 HLA-A/B/DRB1相应外显子 PCR产物电泳结果, DNA 分子标记为 DL 2000 ( Takara公司), 胶图上有一系列片段大小为 300bp-500b 单一条带, 表明 1号样本的 HLA-A/B/DRB1各外显 子(A2 A3 A4 B2 B3 B4 DRB1-2 ) PCR扩增成功, 阴性 对照 (N )无扩增条带。 其它样品的结果与此类似

PCR产物混合和纯化 从 96孔板 HLA-P-A2剩余的 PCR产物中 (阴性对照除外) 20ul混合在一个 3ml的 EP管中, 标记为 HLA-A2-Mix, 对 其它 6个 96孔板进行同样的操作, 分别标记为 HLA-A3-Mix、 HLA-A4-Mix、 HLA-B2-Mix、 HLA-B3-Mix、 HLA-B4-Mix 和 HLA-D2-Mix , 震荡混勾, 从 HLA-A2-Mix、 HLA-A3-Mix、 HLA-A4-Mix、 HLA-B2-Mix、 HLA-B3-Mix、 HLA-B4-Mix 和 HLA-D2-Mix中各取 200ul混合在一个 3ml的 EP管中, 标记为 HLA-Mix, 从 HLA-Mix中取 500ul DNA混合物经 Qiagen DNA Purification kit试剂盒(QIAGEN公司) 过柱纯化(具体纯化步 骤详见说明书 ) , 纯化所得的 200ul DNA , 经 Nanodrop 8000(Thermo Fisher Scientific公司)测定 HLA-Mix DNA浓度为 48ng/ul。 实施例 4

PCR产物的打断, 以及 Illumina GA PCR-Free测序文库的 构建

1. DNA打断

从纯化后的 HLA-Mix中取总量 5ug的 DNA 用带 AFA纤维 扣盖的 Covaris 微管在 Covaris S2DNA打断仪 (Covaris公司)上 打断。 打断条件如下:

频率扫描 ( frequency sweeping )

2. 打断后纯化

将 HLA-Mix的所有打断产物用 QIAquick PCR Purification Kit 回收纯化, 分别溶于 37.5ul 的 EB ( QIAGEN Elution Buffer ) 中;

3. 末端修复反应

对打断后纯化的 HLA-Mix进行 DNA末端修复反应 , 体系如 下 (试剂均购自 Enzymatics公司) :

DNA 37.5μί

H 2 0 37.5μί 多核苷酸激酶緩冲液 ( 10x Polynucleotide Kinase Buffer ( B904 ) ) 10 iL dNTP混合物 (每种 lOmM ) ( Solution Set ( lOmM each ) ) 4

T4 DNA聚合酶( T4 DNA Polymerase ) 5μΙ

Klenow片段 ( Klenow Fragment ) l iL

T4多聚核苷酸激酶 ( T4 Polynucleotide Kinase ) 5μΙ 总体积 ( Total volume ) 100 iL

反应条件为:恒温混匀器(Thermomixer, Eppendorf公司) 20

"C温浴 30 min。

反应产物经 QIAquick PCR Purification Kit回收纯化, 溶于 34 μΐ的 EB ( QIAGEN Elution Buffer ) 中。

4. 3' 末端加 A反应

上一步回收 DNA的 3, 末端加 A反应, 体系如下 (试剂均 购自 Enzymatics公司 ) :

上一步所得 DNA 32

10x 蓝色緩冲液 ( 10x blue buffer ) 5

dATP(lmM, GE公司) 10 iL

Klenow (3'-5' exo-) 3

总体积 ( Total volume ) 50 \iL

反应条件为: 恒温混匀器 (Thermomixer, Eppendorf公司) 37 "C温浴 30 min。

反应产物经 MiniElute PCR Purification Kit( QIAGEN公司) 回收纯化, 溶于 13 μΐ的 EB溶液( QIAGEN Elution Buffer )中。 5. 连接 Illumina GA PCR-Free文库接头 ( adapter ) 术语 "PCR-Free文库接头 (adapter ) " 是指经设计的一段 碱基, 其主要作用是辅助固定 DNA分子在测序芯片上以及提供 通用测序引物的结合位点, PCR-Free文库接头可以通过 DNA连 接酶将其直接连接至测序文库中的 DNA 片段两端, 文库接头的 导入过程因为没有 PCR的参与, 因此称作 PCR-Free文库接头。

加 A后的产物连接 Illumina GA PCR-Free文库接头, 体系 如下 (试剂均购自 Illumina公司) :

上一步所得 DNA Ιΐμί

2x 快速连接緩冲液( 2x Rapid ligation buffer )

PCR-free寡核苷酸接头混合物(30mM) ( PCR-free Adapter Ιμί

oligo mix )

T4 DNA连接酶( T4 DNA Ligase ) (Rapid, L603-HC-L) 3μΙ

总体积 ( Total volume ) 30

反应条件为: 恒温混匀器 (Thermomixer, Eppendorf公司) 20 温浴 15 min。

反应产物经 Ampure Beads(Beckman Coulter Genomics)纯化 后溶于 50ul去离子水, 经荧光定量 PCR ( QPCR )检测到 DNA 浓度结果如下:

6. 割胶回收

取 3( L HLA-Mix用 2%低熔点琼脂糖胶进行回收。电泳条件 为 100V, lOOmii DNA marker为 NEB公司的 50bp DNA marker„ 割胶回收 450-750bp长度范围的 DNA片段(图 3 ) 。 胶回收产物 经 QIAquick PCR Purification Kit ( QIAGEN公司) 回收纯化, 纯化后体积为 32ul, 经荧光定量 PCR ( QPCR )检测到 DNA浓 度结果为 10.16nM。 实施例 5

Illumina GA测序

根据 QPCR检测结果, 取 lOpmol DNA 用 Illumina GA PE-100程序测序, 具体操作流程详见 Illumina GA操作说明书 ( Illumina GA II x ) 。 实施例 6

结果分析

Illumina GA产出的测序结果是一系列 DNA序列,通过查找 测序结果中的正反引物标签序列和引物序列, 建立各个引物标签 对应样本 HLA-A/B/DRB1 各外显子 PCR产物测序结果的数据 库。 通过 BWA(Burrows-Wheeler Aligner)把各外显子的测序结果 定位在相应外显子的参考序列上 ( 参考序列来源: http://www.ebi.ac.uk/imgt/hla/ ) 同时, 构建各个数据库的一致性

( consensus )序列, 再对数据库中 DNA序列进行筛选和测序错 误校正。 校正后的 DNA 序列通过序列重叠 (overlap ) 和连锁

( Pair-End连锁) 关系可组装成 HLA-A/B/DRB1 各外显子相应 的序列。 所得 DNA 序列利用与 IMGT HLA 专业数据库中 HLA-A/B/DRB1 相应各外显子的序列数据库比对,序列比对结 果 100%匹配的即为对应样本的 HLA-A/B/DRB1基因型别。 可参考 图 4示例说明的 1号样品的 HLA-A位点的 2号外显子一致性序 列构建程序的截图。

所有 95 个样本, 得到的分型结果与原已知分型结果完全相 符, 其中 1-32号样本的具体结果如下: 10:60; WIS, I0:0 80:^ 17

WLt, 10:10; f v ε

10:80; 10:10; f v τ

10:81^ f v \

\n ia¾G/a/v-viH ^ f« 备 εο:^ wu> f v

W 10:10; f v u

ZO'-Z w-zo> f v οε

I0:99*V 6Z wo 10:60; 10:10; f v sz

10: 10:10; f v LI

£0:80; W-L^ 10:9^ I0:I V 10:10; f v 91

90: χο:χε*ν I0:IL f v z

W-L^ f v VI wo 10:91^ 10:10; f v £Z

SO: 10:10; f v zz wz W-L^ 90:Z0*V 10:10; f v \z

I0:IL 90:0^ I0:0 U'Z0> f v oz

ZV^ f v 61

Z0-9 10:^ f v 81

ιο:εο; 10:0^ f v LI

I0:0L 10:10; f v 91

W W-L^ I0:0 10:10; f v SI

Z0-9 w-z^ 10:10; f v I

W 10:60; ZO'-LO, ZO'I Y 10:10; f v ex

W I0:IL f v Zl

10:10; w-z^ 10:^ 10:10; f v II

I0:0L 10:61^ I0:99*V 10:10; f v 01 ιο:εο; LO'-LZ, χο:χε*ν f v 6

W 10:18; εο:^ 10:10; f v s

I0:IL f v L

10:10; f v 9

10:60; 10:10; f v

10:60; 80:^ f v

10:10; f v

10:80; 10:10; f v z

fv I 、Sf 备

8899 .0/ll0ZN3/X3d Z OAV 5 01:01 A*24:02 4:01 5:02 DRB1' ^04:05 DRBl^ ^09:01

6 01:01 A*03:02 15:11 37:01 DRB1' 40:01 DRBl^ 14:54

7 11:01 A*30:01 13:02 15:18 DRB1' "04:04 DRBl^ ^07:01

8 01:01 A*02:01 35:03 81:01 DRB1' 41:01 DRBl^ 15:01

9 02:06 A*31:01 27:07 40:02 DRB1' ^03:01 DRBl^ 13:02

10 01:01 A*66:01 37:01 49:01 DRB1' 40:01 DRBl^ 13:02

11 01:01 A*03:01 35:01 2:01 DRB1' ^01:01 DRBl^ 15:02

12 11:01 A*ll:01 15:01 15:05 DRB1' ^04:06 DRBl^ 15:01

13 01:01 A*ll:02 07:02 15:02 DRB1' :01 DRBl^ 15:01

14 01:01 A*02:01 2:01 67:01 DRB1' 45:02 DRBl^ 16:02

15 01:01 A*02:05 15:17 0:01 DRB1' ^07:01 DRBl^ 15:01

16 01:01 A*ll:01 37:01 40:02 DRB1' 40:01 DRBl^ 12:02

17 24:07 A*32:01 35:05 40:01 DRB1' ^03:01 DRBl^ ^04:05

18 11:01 A*24:02 13:01 35:01 DRB1' 46:02 DRBl^ 16:02

19 11:01 A*ll:01 40:02 5:12 DRB1' ^04:05 DRBl^ 15:01

20 02:11 A*24:02 40:01 40:06 DRB1' 41:01 DRBl^ 15:01

21 01:01 A*02:06 1:01 7:01 DRB1' ^07:01 DRBl^ 12:01

22 01:01 A*29:01 07:05 15:01 DRB1' ^04:05 DRBl^ ^07:01

23 01:01 A*02:07 37:01 46:01 DRB1' ^04:03 DRBl^ 10:01

24 24:85 A*30:01 13:02 5:02 DRB1' ^07:01 DRBl^ 15:01

25 11:01 A*31:01 07:06 1:01 DRB1' "12:02 DRBl^ 14:05

26 01:01 A*ll:01 46:01 7:01 DRB1' ^07:01 DRBl^ ^08:03

27 01:01 A*02:01 15:18 37:01 DRB1' ^04:01 DRBl^ 15:01

28 01:01 A*24:02 37:01 46:01 DRB1' :01 DRBl^ 10:01

29 A*26:01 A*66:01 40:40 41:02 DRB1' "12:01 DRBl^ 15:01

30 02:01 A*29:02 13:02 45:01 DRB1' ^03:01 DRBl^ 12:02

31 01:01 A*ll:03 15:01 7:01 DRB1' ^07:01 DRBl^ 15:01

32 11:01 A*26:01 35:03 38:01 DRB1' 41:03 DRBl^ 14:04 注 : HLA-DRB1 型 别 中 的 DRB1*1201 不 排 除 DRB1*1206/1210/1217的可能性, DRB1*1454不排除 DRB1*1401 的可能性, 因为上述等位基因在 HLA-DRB12号外显子的序列完 全相同。 实施例 7 用第二代测序技术( Illumina GA )进行 HLA-A,B 和 DRB1基因分型

样本提取 使用 KingFisher自动提取仪 (请提供供货商信息) (美国 Thermo公司)从 950份已知 HLA-SBT分型结果的血样(中国造血 干细胞捐献者资料库(以下称 "中华骨髓库" )) 中提取 DNA, 具 体方法如实施例 1所述。

PCR扩增

把样本提取步骤中所得的 950份 DNA依次编号 1-950, 均分 成 10组,每组 95份 DNA,分别标记为 HLA-1、 HLA-2、 HLA-3、 HLA-4、 HLA-5、 HLA-6、 HLA-7、 HLA-8、 HLA-9、 HLA-10。 对每组样本分别以 95 套带有双向引物标签 (表 6 ) 用于扩增 HLA-A/B 2, 3, 4号外显子的 PCR引物(表 1 )和 HLA-DRB1 2 号外显子的 PCR引物(表 7 )来分别扩增 95份 DNA样本。 PCR 反应在 96 孔板中进行, 共 70板, 编号分别为 HLA-X-P-A2、 HLA-X-P-A3、 HLA-X-P-A4、 HLA-X-P-B2、 HLA-X-P-B3、 HLA-X-P-B4 以及 HLA-X-P-DRB1-2 ( "X"表示样本组号信息 1/2/3/4/5/6/7/8/9/10, "A2/3/4,B2/3/4, DRB1-2"表示扩增的位点) , 每板内设置一个不添加模板的阴性对照, 阴性对照所用引物为 PI-1 (表 1 )标记的引物。 实验的同时, 记录下每个样本对应的 样本组号信息和引物标签信息。 具体方法如实施例 2所述。

PCR产物混合和纯化

对第 "X "组 ("X" 为 1/2/3/4/5/6/7/8/9/10)样本, 从 96 孔板 HLA-X-P-A2剩余的 PCR产物中 (阴性对照除外)各取 20 ul混 合在一个 3ml的 EP管中, 标记为 HLA-X-A2-Mix, 对第 "X"组 样本的其它 6 个 96 孔板进行同样的操作, 分别标记为 HLA-X-A3-Mix 、 HLA-X-A4-Mix 、 HLA-X-B2-Mix 、 HLA-X-B3-Mix、 HLA-X-B4-Mix和 HLA-X-D2-Mix, 震荡混勾, 从 HLA-X-A2-Mix 、 HLA-X-A3-Mix 、 HLA-X-A4-Mix 、 HLA-X-B2-Mix 、 HLA-X-B3-Mix 、 HLA-X-B4-Mix 和 HLA-X-D2-Mix中各取 200ul混合在一个 3ml的 EP管中, 标记 为 HLA-X-Mix。 从中各取 500ul DNA 混合物经 Qiagen DNA Purification kit过柱纯化(具体纯化步骤详见说明书) , 纯化所 得的 200ul DNA, 经 Nanodrop 8000(Thermo Fisher Scientific公 司)测定的 DNA浓度, 其他组操作相同, 最终测得 DNA浓分别 为:

具体方法如实施例 3所述。

其后根据实施例 4所述的方法进行 Illumina GA测序文库的构 建。 其中样本组与文库接头的对应关系如下

反应产物经 Ampure Beads(Beckman Coulter Genomics)纯化 后溶于 50ul去离子水, 经荧光定量 PCR ( QPCR )检测到 DNA摩 尔浓度结果如下:

6. 割胶回收

将 HLA-1-Mix、 HLA-2-Mix、 HLA-3-Mix , HLA-4-Mix、 HLA-5-Mix、 HLA-6-Mix, HLA-7-Mix、 HLA-8-Mix, HLA-9-Mix 和 HLA-10-Mix等摩尔混合 (终浓度 72.13nM/ul ) , 标记为 HLA-Mix-10, 取 30μί HLA-Mix-10用 2%低熔点琼脂糖股进行回 收。 电泳条件为 100V, 100min。 DNA marker为 NEB公司的 50bp DNA marker„ 割股回收 450-750bp长度范围的 DNA片段。 股回收 产物经 QIAquick PCR Purification Kit ( QIAGEN公司) 回收纯 化, 纯化后体积为 32ul, 经荧光定量 PCR ( QPCR )检测到 DNA 浓度结果为 9.96nM。

其后根据实施例 5和 6所述的方法进行测序和结果分析, 所 有 950个样本, 得到的分型结果与原已知分型结果完全相符。 实施例 8 用第二代测序技术(Illumina GA )进行 HLA-C基 因分型

1. 样本 DNA提取

步骤同实施例 1。

2. PCR扩增

步骤同实施例 2, 只是所使用 PCR引物是针对 HLA-C的 2、 3 和 4号外显子 PCR引物, 如表 3所示。

以 95套 PCR标签引物来分别扩增 95份 DNA样本, 每套 PCR标 签引物由用于扩增 HLA-C的 2、 3和 4号外显子的 PCR引物 (表 3 ) 和一对双向引物标签(如下所述)组成, 其中每个正向 PCR引物 的 5,末端上连接一对引物标签的正向引物标签 而反向 PCR引物 的 5,末端上连接一对引物标签的反向引物标签 引物标签在引物 合成时直接添加在 PCR引物的 5,末端。

把样本提取步骤中所得的 95份 DNA, 依次编号 1-95, PCR^ 应在 96孔板中进行, 共 3板, 编号分别为 HLA-P-C2、 HLA-P-C3, HLA-P-C4 ( C2/3/4表示扩增的位点), 板内设置一个不添加模板 的阴性对照, 阴性对照所用引物与引物 PI-96相同。 实验的同时, 记录下每对引物标签对应的样本编号信息。

所使用的引物标签同表 6所列的引物标签 PI-1至 PI-95 , 以及 如下的阴性对照引物标签 PI-96 (表 8 )

表 8, 所使用阴性对照引物标签的相关信息

将步骤 1中以 KingFisher自动提取仪提取的 DNA为模板, 以 5, 端带有标签的 HLA-C各外显子引物单管 PCR扩增, PCR程序如 下:

C2: 96。C 2分钟

95 °C 30s ->62V 30秒 72°C 20秒 (35个循环)

15°C 00

C3: 96。C 2分钟

95 °C 30秒 56°C 30秒 72°C 20秒 (35个循环)

15°C 00

C4: 96。C 2分钟

95 °C 30秒 60°C 30秒 72°C 20秒 (35个循环)

15°C 00

HLA-C的 PCR^应体系如下

其中 PI nf -C-F 2/3/4 表示引物 5,末端带有第 n号正向引物标签序 列 (表 2 )的 HLA-C的 F引物, PI nr -C-R 2/3/4 表示引物 5,末端带有第 n号反向引物标签序列的 HLA-C的 R引物(此处 η≤96 ) , 其它依次 类推。 且每个样本对应特定的一套 PCR引物。

PCR^应在 Bio-Rad公司的 PTC-200 PCR仪上运行。 PCR完 成后, 取 2 ul PCR产物经 1.5%的琼脂糖凝胶电泳检测。 图 6显示 了前 20个样本 HLA-C相应外显子 PCR产物电泳结果, DNA分子标 记为 DL 2000 ( Takara公司) , 胶图上有一系列片段大小为 400 bp-500 bp单一条带, 表明这部分样本的 HLA-C各外显子 ( C2、 C3、 C4 ) PCR扩增成功。 其它样品的结果与此类似。

PCR "物混合和纯化

从 96孔板 HLA-P-C2剩余的 PCR产物中 (阴性对照除外)各 取 20 ul混合在一个 3 ml的 EP管中, 标记为 HLA-C2-Mix,对其它 2 个 96孔板进行同样的操作, 分别标记为 HLA-C3-Mix和 HLA-C4-Mix , 震荡混匀, 从 HLA-C2-Mix、 HLA-C3-Mix和 HLA-C4-Mix中各取 200 ul混合在一个 1.5 ml的 EP管中, 标记为 HLA-Mix, 从 HLA-Mix中取 500 ul DNA混合物经 Qiagen DNA Purification kit ( QIAGEN公司) 过柱纯化(具体纯化步骤详见 说明书) , 純化所得的 200 ul DNA, 经 Nanodrop 8000(Thermo Fisher Scientific公司)测定 HLA-Mix DNA浓度为 50 ng/ul。

4. Illumina GA PCR-Free测序文库的构建

4.1 PCR产物的打断

从纯化后的 HLA-Mix中取总量 5 ug的 DNA 用 Covaris microTube with AFA fiber and Snap - Cap在 Covaris S2(Covaris 公司)上打断。 打断条件如下:

频率扫描 ( frequency sweeping ) 负载比 (Duty Cycle ) 10%

强度 3

循环 /脉冲 (Cycles/Burst ) 200

时间 (秒) 180

4.2 打断后的 PCR产物纯化

将 HLA-Mix的所有打断产物用 QIAquick PCR Purification Kit回收纯化, 分别溶于 37.5 ul的 EB ( QIAGEN Elution Buffer ) 中。

4.3 末端修复反应

对纯化的产物进行 DNA末端修复反应, 体系如下(试剂均购 自 Enzymatics公司 ) :

上一步骤纯化的产物 37.5 μL·

10 X多核苷酸激酶緩冲液(B904 ) 5

dNTP混合物 (每种 10mM ) 2

T4 DNA聚合酶 2.5

Klenow片段 0.5

T4多聚核苷酸激酶 2.5

总体积 50

反应条件为: 在 20。C下, 在 Thermomixer(Eppendorf公司)中 温浴 30分钟。

反应产物经 QIAquick PCR Purification Kit回收纯化, 溶于 32 μΐ的 EB ( QIAGEN Elution Buffer ) 中。

4.4 3,末端加 A反应

上一步回收 DNA的 3,末端加 A反应, 体系如下 (试剂均购自 Enzymatics公司 ) :

上一步所得 DNA 32

lOx 蓝色緩冲液 5

dATP(lmM, GE公司) 10 Klenow (3'-5'exo-) 3 μΐ^

总体积 50

反应条件为: 在 37。C下, 在 Thermomixer中温浴 30分钟。 反应产物经 MiniElute PCR Purification Kit ( QIAGEN公司) 回收纯化, 溶于 38 μΐ的 EB溶液( QIAGEN Elution Buffer ) 中。

4.5 连接 Illumina GA PCR-Free文库接头 ( adaptor )

加 A后的产物连接 Illumina GA PCR-Free文库接头, 体系如 下 (试剂均购自 Illumina公司) :

上一步的 DNA 38

lOx连接緩冲液 5

PCR-free寡核苷酸接头混合物 (3 OmM) 2

T4 DNA连接酶 (Rapid, L603-HC-L) 5

总体积 50

反应条件为: 在 16。C下, 在 Thermomixer中温浴过夜。

反应产物经 Ampure Beads(Beckman Coulter Genomics)纯化 后溶于 50 ul去离子水, 经荧光定量 PCR ( QPCR )检测到 DNA浓 度结果如下:

4.6 割胶回收

取 30μί HLA-Mix用 2%低熔点琼脂糖胶进行回收。 电泳条件 为 100V, 100分钟。 DNA标准分子量参照物为 NEB公司的 50 bp DNA Ladder„ 割胶回收 400-750 bp长度范围的 DNA片段(图 7 ) 。 股回收产物经 QIAquick PCR Purification Kit ( QIAGEN公司) 回收纯化, 纯化后体积为 32 ul, 经荧光定量 PCR ( QPCR )检测 到 DNA浓度结果为 17.16 nM。

5. Illumina GA测序

根据 QPCR检测结果,取 10 pmol DNA用 Illumina GA PE-100 程序测序, 具体操作流程详见 Illumina GA操作说明书 ( Illumina GA lI x ) 。

6. 结果分析

Illumina GA产出的测序结果是一系列 DNA序列 ,通过查找测 序结果中的正反引物标签序列和引物序列 , 建立各个引物标签对 应样本 HL A-C各外显子 PCR产物测序结果的数据库; 通过 B WA (Burrows-Wheeler Aligner)把各外显子的测序结果定位在相应外 显 子 的 参 考 序 列 上 ( 参 考 序 列 来 源 : http://www.ebi.ac.uk/imgt/hla/ ) , 并构建各个数据库的一致性 ( consensus )序列; 结合碱基测序质量值和测序序列与 consensus 序列的差异度, 对测序序列进行筛选和测序错误校正; 以及校正 后的 DNA序列通过序列重叠 (overlap )和连锁 ( Pair-End连锁) 关系可组装成 HLA-C 各外显子相应的序列。 图 8的截图示例性说 明了对 2号样品的 HLA-C位点的 2号外显子一致性序列进行构建 的过程。

将所测序的 HLA-C内含子的 DNA序列与 IMGT HLA专业数 据库中 HLA-C 相应各外显子的序列数据库比对, 序列比对结果 100%匹配的即为对应样本的 HLA-C基因型别。 所有 95个样本, 得到的分型结果与原已知分型结果完全相符, 其中 1-32号样本的 具体结果与样本原来分型结果对比如下: (如表 9, 全部检测结果 与原有检测结果相同) 。

表 9. 本次分型结果与样本原来分型结果对比

样本 原 HLA-C基因型别 本次检测结果 是否 编号 相同

1 C*08:01 C*15:05 C' ^08:01 C*15:05 是

2 C*01:02 C*07:02 C' ^01:02 C*07:02 是

3 C*08:01 C*16:02 C' ^08:01 C*16:02 是

4 C*01:02 C*03:02 01:02 C*03:02 是 5 ^01:02 ^02:02 C' ^01:02 C' "02:02 是

6 ^01:02 5:02 C' ^01:02 C' 45:02 是

7 ^01:02 ^03:04 C' ^01:02 C' ^03:04 是

8 ^03:02 ^07:02 C' ^03:02 C' ^07:02 是

9 ^06:02 6:02 C' ^06:02 C' 46:02 是

10 ^01:02 ^03:04 C' ^01:02 C' ^03:04 是

11 ^03:04 ^07:02 C' ^03:04 C' ^07:02 是

12 ^07:02 ^08:01 C' ^07:02 C' ^08:01 是

13 ^01:02 5:02 C' ^01:02 C' 45:02 是

14 ^01:02 ^03:04 C' ^01:02 C' ^03:04 是

15 ^01:02 ^03:04 C' ^01:02 C' ^03:04 是

16 ^07:02 2:02 C' ^07:02 C' "12:02 是

17 ^04:01 ^08:01 C' ^04:01 C' ^08:01 是

18 ^08:01 6:02 C' ^08:01 C' 46:02 是

19 4:02 5:02 C' "14:02 C' 45:02 是

20 ^01:02 ^03:03 C' ^01:02 C' ^03:03 是

21 ^03:03 ^08:01 C' ^03:03 C' ^08:01 是

22 ^03:04 ^07:02 C' ^03:04 C' ^07:02 是

23 ^07:02 ^08:01 C' ^07:02 C' ^08:01 是

24 ^07:02 2:02 C' ^07:02 C' "12:02 是

25 ^07:02 2:03 C' ^07:02 C' 42:03 是

26 ^03:04 ^08:01 C' ^03:04 C' ^08:01 是

27 ^01:02 ^03:04 C' ^01:02 C' ^03:04 是

28 ^07:02 2:02 C' ^07:02 C' "12:02 是

29 ^03:02 ^07:02 C' ^03:02 C' ^07:02 是

30 ^01:02 ^03:03 C' ^01:02 C' ^03:03 是

31 ^01:02 ^07:02 C' ^01:02 C' ^07:02 是

32 01:02 07:02 C' 01:02 C' ^07:02 是 注: HLA-C型别中的 C*0303不排除 C*0320N的可能性, C*0401不排除 C*0409N/0430的可能性, C*0702不排除 C*0750的 可能性, C*0801不 < 除( *0822的可能性, C*1505不 < 除( *1529 的可能性, 因为上述等位基因在 HLA-C 2、 3、 4号外显子的序列 完全相同。 实施例 9: 用 Sanger法测序进行 HLA-C基因分型

1. 样品 DNA提取

如实施例 1中所述, 以 KingFisher自动提取仪提取的 95例样本 中的 26例已知 HLA基因型别的 DNA。

2. PCR扩增

以上述 KingFisher自动提取仪提取的 DNA为模板, 以 ( ^2,( -112,( ^3,( -113,( ^4,( -114共3对?€11引物(表 3 )分别单管 PCR扩增, 各对引物 PCR程序如下:

C2: 96。C 2分钟

95 °C 30秒 62°C 30秒 ~>72。C 20秒 (35个循环)

15°C 00

C3: 96。C 2分钟

95 °C 30秒 56°C 30秒 72°C 20秒 (35个循环)

15°C 00

C4: 96。C 2分钟

95 °C 30秒 60°C 30秒 72°C 20秒 (35个循环)

15°C 00

HLA-C的 PCR 应体系如下:

PCR产物经琼脂糖凝胶电泳检测后 (图 9) , 准备纯化。

3. PCR产物纯化 利用 millipore纯化板进行 PCR产物纯化。 基本步骤是: 用记 号笔在 96孔 PCR产物纯化板上标记需要使用的孔, 并向需要使用 的孔中加入 50 ul超纯水, 剩余孔粘贴封口膜, 室温静置 15分钟或 连接到抽滤系统上, -10 Pa, 5分钟取下, 每次从抽滤系统上取下 纯化板时都要在吸水纸上吸干残留在纯化板底 部排液口的液体。

待纯化 PCR产物离心, 4000 rpm, 1分钟; 打开待纯化 PCR 产物的盖子或硅胶垫, 每个 PCR反应体系中加入 100 ul超纯水。 然后把加入待纯化 PCR产物的纯化板连接到抽滤系统上, 调节真 空度至气压表显示 -10帕,抽滤至纯化板底部的微孔再生纤维膜上 无液体, 光照下观察, 无完整液面反射光泽。

向有待纯化 PCR产物的孔中加 50 ul超纯水或 TE到微孔再生 纤维膜上; 室温下使用微量振荡器中档振荡纯化板 5分钟,转移相 应孔内全部液体至新的 96孔 PCR板对应的孔中。

4. 进行测序反应并纯化测序反应产物

以上述纯化后的 PCR产物为模板做测序反应

测序反应的条件

96 °C 2分钟

96 °C 10秒 55。C 5秒 60。C 2分钟 (25个循环)

15°C 00

测序反应的体系是

通过以下步骤纯化测序反应产物: 取下测序反应板配平, 在

3000 g下离心 1分钟。 96孔板每 5 反应体系加 2ul 0.125 mol/L EDTA-Na2溶液, 33 85%乙醇, 盖上硅胶垫, 充分振荡 3分 钟, 在 4。C下以 3000 g离心 30分钟。 离心结束后取出测序板, 打开 硅胶垫, 将测序反应板倒置吸水纸上, 倒离心至离心力达到 185 g 时立即停止。 96孔板每孔加 50 ul 70%乙醇, 盖上硅胶垫, 振荡 1.5分钟,在 4。C下以 3000 g离心 15分钟。测序反应板置避光通风处 30分钟, 风干至无乙醇气味。 96孔板每孔加 10 (384孔板每孔 加 8 μί) HI-DI甲酰胺, 盖封口膜, 振荡 5秒后离心至 1000 rpm。

5 测序和结果分析

纯化后的测序反应产物在 ABI 3730XL上进行毛细管电泳测 序, 测序峰图经过 uType软件 (Invitrogen)分析(图 10), 得到 HLA 分型结果。 全部检测结果与原有检测结果相同, 如表 10所示。

表 10. 本次分型结果与样本原来分型结果对比

样本 原 HLA-C基因型别 本次检测结果 是否 编号 相同

1 ^08:01 5:05 C' ^08:01 5:05 是

2 ^01:02 ^07:02 C' ^01:02 ^07:02 是

3 ^08:01 6:02 C' ^08:01 6:02 是

4 ^01:02 ^03:02 C' ^01:02 03:02 是

5 ^01:02 ^02:02 C' ^01:02 02:02 是

6 ^01:02 5:02 C' ^01:02 5:02 是

7 ^01:02 ^03:04 C' ^01:02 03:04 是

8 ^03:02 ^07:02 C' ^03:02 ^07:02 是

9 ^06:02 6:02 C' ^06:02 6:02 是

10 ^01:02 ^03:04 C' ^01:02 03:04 是

11 ^03:04 ^07:02 C' ^03:04 ^07:02 是

12 ^07:02 ^08:01 C' ^07:02 08:01 是

13 ^01:02 5:02 C' ^01:02 5:02 是

14 ^01:02 ^03:04 C' ^01:02 03:04 是

15 ^01:02 ^03:04 C' ^01:02 03:04 是

16 ^07:02 2:02 C' ^07:02 2:02 是

17 04:01 08:01 C'04:01 08:01 是 18 ^08:01 6:02 C' ^08:01 6:02 是

19 4:02 5:02 C' "14:02 5:02 是

20 ^01:02 ^03:03 C' ^01:02 03:03 是

21 ^03:03 ^08:01 C' ^03:03 08:01 是

22 ^03:04 ^07:02 C' ^03:04 ^07:02 是

23 ^07:02 ^08:01 C' ^07:02 08:01 是

24 ^07:02 2:02 C' ^07:02 2:02 是

25 ^07:02 2:03 C' ^07:02 2:03 是

26 01:02 ^07:02 C' 01:02 ^07:02 是 实施例 10 用第二代测序技术 ( Illumina Solexa ) 进行 HLA-DQBl因分型

根据实施例 8的方法, 对 94份已知 HL A-SBT分型结果的血样 进行 HLA-DQB1基因分型, 不同之处如下所述。

以 94套 PCR标签引物来分别扩增 94份 DNA样本, 每套 PCR标 签引物由用于扩增 HLA-DQB1的 2或 3号外显子的 PCR引物(表 5 ) 和一对双向引物标签(如下所述)组成, 其中每个正向 PCR引物 的 5,末端上连接一对引物标签的正向引物标签 而反向 PCR引物 的 5,末端上连接一对引物标签的反向引物标签 引物标签在引物 合成时直接添加在 PCR引物的 5,末端, 引物由上海英潍捷基 ( Invitrogen )公司合成。

把样本提取步骤中所得的 94份 DNA, 依次编号 1-94, PCR^ 应在 96孔板中进行, 每个样本的 DQB1 2,3外显子在同一个反应孔 中进行扩增。 板内设置两个不添加模板的阴性对照, 阴性对照所 用引物对应标签号为 PI-95和 PI-96。 实验的同时, 记录下每对引 物标签对应的样本编号信息。

所使用的引物标签同表 6所列的引物标签 PI-1至 PI-94, 以及 如下的阴性对照引物标签 PI-95和 PI-96 (表 11 ) 表 11 , 所使用阴性对照引物标签的相关信息

HLA-DQB1的 PCR程序如下:

96。C 2分钟

95 °C 30秒 60°C 30秒 72°C 20秒 (32个循环)

15。C 00

HLA-DQBl的 PCR^应体系如下

其中 PInf-Q-F2/3表示引物 5,末端带有第 n号正向引物标签序 列 (表 1 ) 的 HLA-DQB1的 F引物, PInf-Q-R 2/3表示引物 5,末端 带有第 n号反向引物标签序列的 HLA-DQB1的 R引物(此处 n≤96 ), 其它依次类推。 且每个样本对应特定的一套 PCR引物。

PCR^应在 Bio-Rad公司的 PTC-200 PCR仪上运行。 PCR完 成后, 取 2ul PCR产物经 1.5%的琼脂糖凝胶电泳检测。 图 11显示 了 94个样本 HLA-DQB1 2+3外显子 PCR产物电泳结果, DNA标准 分子量参照物 (M ) 为 DL 2000 ( Takara公司) 。 3. PCR产物混合和纯化

从 96孔板 HLA-P-DQB1剩余的 PCR产物中 (阴性对照除外) 各取 20 ul混合在一个 3 ml的 EP管中,标记为 HLA-Q-Mix并混合均 匀。 从 HLA-Q-Mix中取 500 ul DNA混合物经 Qiagen DNA Purification kit过柱纯化(具体纯化步驟详见说明书) , 纯化所 得的 200 ul DNA,经 Nanodrop 8000(Thermo Fisher Scientific公司 ) 测定 HLA-Q-Mix DNA浓度为 48 ng/ul。

打断条件如下:

频率扫描 ( frequency sweeping )

经末端修复反应后的反应产物经 QIAquick PCR Purification Kit回收纯化, 溶于 34 μΐ的 EB ( QIAGEN Elution Buffer ) 中。

3,末端加 A反应后的反应产物经 MiniElute PCR Purification Kit ( QIAGEN公司) 回收纯化, 溶于 13 μΐ的 EB溶液(QIAGEN Elution Buffer ) 中。

连接文库接头后的反应产物经 Ampure Beads(Beckman Coulter Genomics)纯化后溶于 50 ul去离子水, 经荧光定量 PCR ( QPCR )检测到 DNA浓度结果如下:

割胶回收 350-550bp的 DNA片段(图 12 ) , 胶回收产物纯化 后, 经荧光定量 PCR ( QPCR )检测到 DNA浓度结果为 18.83 nM。

6. 结果分析

Illumina GA产出的测序结果是一系列 DNA序列,通过查找测 序结果中的正反引物标签序列和引物序列, 建立各个引物标签对 应样本 HL A-DQBl各外显子 PCR产物测序结果的数据库; 通过 BWA (Burrows-Wheeler Aligner)把各外显子的测序结果定位在 相 应 外 显 子 的 参 考 序 列 上 ( 参 考 序 列 来 源 : http://www.ebi.ac.uk/imgt/hla/ ) , 并构建各个数据库的一致性 ( consensus )序列; 结合碱基测序质量值和测序序列与 consensus 序列的差异度, 对测序序列进行筛选和测序错误校正; 以及校正 后的 DNA序列通过序列重叠 (overlap )和连锁 ( Pair-End连锁) 关系可组装成 HLA-DQB1 2,3外显子相应的序列。 图 13的截图示 例性说明了对 7号样品的 HLA-DQB1位点的 2号外显子一致性序 列进行构建的过程。

将所测序的 HLA-DQB1 2,3外显子的 DNA序列与 IMGT HLA 专业数据库中 HLA-DQB1相应外显子的序列数据库比对, 序列比 对结果 100%匹配的即为对应样本的 HLA-DQB1基因型别。

所有 94个样本,得到的分型结果与原已知分型结果 全相符, 其中 1-32号样本的具体结果下表 12中。

表 12: 1-32号样本的分型结果。

13 DQB1*02:02 DQB1*04:02 DQB1*02:02 DQB1*04:02 是

14 DQB1*05:02 DQB1*02:01 DQB1*05:02 DQB1*02:01 是

15 DQB1*02:01 DQB1*06:02 DQB1*02:01 DQB1*06:02 是

16 DQB1*03:03 DQB1*04:01 DQB1*03:03 DQB1*04:01 是

17 DQB1*05:01 DQB1*03:02 DQB1*05:01 DQB1*03:02 是

18 DQB1*03:03 DQB1*06:01 DQB1*03:03 DQB1*06:01 是

19 DQB1*03:03 DQB1*06:10 DQB1*03:03 DQB1*06:10 是

20 DQB1*05:03 DQB1*04:01 DQB1*05:03 DQB1*04:01 是

21 DQB1*05:02 DQB1*04:01 DQB1*05:02 DQB1*04:01 是

22 DQB1*03:01 DQB1*03:03 DQB1*03:01 DQB1*03:03 是

23 DQB1*05:02 DQB1*05:03 DQB1*05:02 DQB1*05:03 是

24 DQB1*05:02 DQB1*03:02 DQB1*05:02 DQB1*03:02 是

25 DQB1*03:03 DQB1*06:01 DQB1*03:03 DQB1*06:01 是

26 DQB1*05:02 DQB1*06:09 DQB1*05:02 DQB1*06:09 是

27 DQB1*02:02 DQB1*06:02 DQB1*02:02 DQB1*06:02 是

28 DQB1*05:02 DQB1*03:01 DQB1*05:02 DQB1*03:01 是

29 DQB1*02:01 DQB1*03:01 DQB1*02:01 DQB1*03:01 是

30 DQB1*06:03 DQB1*06:09 DQB1*06:03 DQB1*06:09 是

31 DQB1*05:02 DQB1*02:02 DQB1*05:02 DQB1*02:02 是

32 DQB1*05:01 DQB1*06:01 DQB1*05:01 DQB1*06:01 是 实施例 11. 用 Sanger法测序进行 HL A-DQB1基因分型

1. 样品 DNA提取

如实施例 1中所述相似, 以 KingFisher自动提取仪提取的 94 例样本中的 20例已知 HL A基因型别的 DNA。

2. PCR扩增

以上述 KingFisher自动提取仪提取的 DNA为模板,以表 5所列 的 Q-F2和 Q-R2、 Q-F3和 Q-R3共 2对 PCR引物分别单管 PCR扩增, 各对引物 PCR程序如下:

96 °C 2分钟

95 °C 30秒 56°C 30秒 72°C 20秒 (35循环) 15°C oo

HLA-Q的 PCR^应体系如下:

PCR产物经琼脂糖凝胶电泳检测后, 准备纯化。

3. PCR产物纯化

方法步骤同实施例 9

4. 进行测序反应并纯化测序反应产物

方法步骤同实施例 9

5 测序和结果分析

纯化后的测序反应产物在 ABI 3730XL上进行毛细管电泳测 序,测序峰图经过 uType软件 (Invitrogen)分析 (附图 15),得到 HLA 分型结果。 全部检测结果与原有检测结果相同 (表 13 ) 。

表 13: 本次分型结果与样本原来分型结果对比

样本 是否 编号 原 DQB1基因型别 本次 DQB1检测结果 相同

1 DQB1*02:02 DQB1*03:01 DQB1*02:02 DQB1*03:01 是

2 DQB1*02:02 DQB1*04:01 DQB1*02:02 DQB1*04:01 是

3 DQB1*05:02 DQB1*02:02 DQB1*05:02 DQB1*02:02 是

4 DQB1*02:02 DQB1*06:03 DQB1*02:02 DQB1*06:03 是

5 DQB1*03:03 DQB1*04:02 DQB1*03:03 DQB1*04:02 是

6 DQB1*05:02 DQB1*03:17 DQB1*05:02 DQB1*03:17 是

7 DQB1*03:03 DQB1*06:02 DQB1*03:03 DQB1*06:02 是

8 DQB1*05:03 DQB1*04:02 DQB1*05:03 DQB1*04:02 是

9 DQB1*04:02 DQB1*06:01 DQB1*04:02 DQB1*06:01 是

10 DQB1*05:01 DQB1*06:10 DQB1*05:01 DQB1*06:10 是 11 DQB1*03:01 DQB1*03:03 DQB1*03:01 DQB1*03:03 是

12 DQB1*05:01 DQB1*05:01 DQB1*05:01 DQB1*05:01 是

13 DQB1*02:02 DQB1*04:02 DQB1*02:02 DQB1*04:02 是

14 DQB1*05:02 DQB1*02:01 DQB1*05:02 DQB1*02:01 是

15 DQB1*02:01 DQB1*06:02 DQB1*02:01 DQB1*06:02 是

16 DQB1*03:03 DQB1*04:01 DQB1*03;03 DQB1*04:01 是

17 DQB1*05:01 DQB1*03:02 DQB1*05:01 DQB1*03:02 是

18 DQB1*03:03 DQB1*06:01 DQB1*03:03 DQB1*06:01 是

19 DQB1*03:03 DQB1*06:10 DQB1*03:03 DQB1*06:10 是

20 DQB1*05:03 DQB1*04:01 DQB1*05:03 DQB1*04:01 是 实施例 12. 对 950个样本的 HLA-A/B/C 2, 3 , 4号外显子和 HLA-DQB1 2, 3号外显子的基因分型

在本发明的实施例中,采用基于引物标签、 DNA不完全打断、 文库标签及 PCR-FREE建库 Illumia GA Pair-End的测序方法, 对 950个样本的 HLA-A/B/C 2, 3, 4号外显子和 HLA-DQB1 2, 3 号外显子(PCR产物长度大小处于 300bp-500bp之间) 的基因分 型,证明该策略可以实现对超过测序仪本身测 长以上的基因片段进 行基因分型, 同时证明该发明能够实现低成本、 高通量、 高准确率 和高分辨率的 HLA基因分型。

原理: 将待分析的样本平均分成 10组, 对每组样本通过 PCR 反应在 HLA-A/B/C 2, 3, 4号外显子和 HLA-DQB1 2, 3号外显 子的 PCR产物两端引入引物标签, 使其特异的标记 PCR产物的 样本信息。 将各组内样品的 HLA-A/B/C/DQB1四个位点的 PCR 扩增产物等体积混合在一起, 获得 PCR产物文库; 所得 PCR产 物文库经过超声不完全打断后, 构建不同的 PCR-Free标签测序 文库(其中每一组样本的 PCR产物文库使用一种不同的接头,从 而构建 10个标签测序文库) ; 将 10个标签测序文库等摩尔混合 在一起构建混合标签测序文库, 混合标签测序文库经 2%低熔点 琼脂糖电泳, 割胶纯化回收位于 450-750p 长度范围之间的所有 DNA条带。 回收的 DNA经 Illumina GA PE-100测序。 通过文库 标签和引物标签序列可以找到所有所测样本的 序列信息, 再通过 已知 DNA片段的参考序列信息和 DNA片段序列之间的重叠和连 锁关系组装出整个 PCR产物的序列,再通过与 HLA-A/B/C/DQB1 相应外显子的标准数据库的比对结果可组装出 原 PCR产物的全 序列,实现 HLA-A/B/C/DQB1的基因分型。

1·样本提取

使用 KingFisher 自动提取仪(请提供供货商信息) (美国 Thermo公司)从 950份已知 HLA-SBT分型结果的血样(中国造 血干细胞捐献者资料库(以下称 "中华骨髓库" )) 中提取 DNA。 主要步骤同实施例 1.

2.PCR扩增

把样本提取步骤中所得的 950份 DNA依次编号 1-950, 均分 成 10组,每组 95份 DNA,分别标记为 HLA-1、 HLA-2、 HLA-3、 HLA-4、 HLA-5、 HLA-6、 HLA-7、 HLA-8、 HLA-9、 HLA-10。 对每组样本分别以 95 套带有双向引物标签 (表 6 ) 用于扩增 HLA-A/B2, 3, 4号外显子 (表 2 ) , HLA-C 2, 3, 4号外显子 (表 4 )和 HLA-DQB1 2, 3号外显子的 PCR引物 (表 5 ) 来分 别扩增 95份 DNA样本。 PCR反应在 96孔板中进行, 共 100板, 编号分别为 HLA-X-P-A2、 HLA-X-P-A3、 HLA-X-P-A4、 HLA-X-P-B2、 HLA-X-P-B3、 HLA-X-P-B4、 HLA-X-P-C2、 HLA-X-P-C3, HLA-X-P-C4以及 HLA-X-P-DQB1 ( "X"表示样 本组号信息 1/2/3/4/5/6/7/8/9/10 , "A2/3/4,B2/3/4,C2/3/4,DQBl" 表示扩增的位点) , 每板内设置一个不添加模板的阴性对照, 阴 性对照所用引物为 PI-1 (表 6 )标记的引物。 实验的同时, 记录 下每个样本对应的样本组号信息和引物标签信 息。 例如 PI-1 和

PI-2引物标签的相关信息如下, 其他依次类推。

HLA-A/B/C 的 PCR程序和 PCR反应体系同实施例 2,所使 用用于扩增 HLA-A/B相应外显子的 PCR引物如表 2所示, 所使 用用于扩增 HLA-C相应外显子的 PCR引物如表 4所示。

HLA-DQB1的 PCR程序如下:

96。C 2min

95 °C 30s^55°C 30s^72°C 20s (32cycles)

15。C oo

HLA-DQB1的多重(2,3外显子一起扩增) PCR反应体系同 实施例 10,所使用用于扩增 HLA-DQB1相应外显子的 PCR引物 如表 5所示。

其中 PI nr A/B/C-F 2/3/4 和 PI nf -Q-F2/F3表示引物 5,末端带有第 n号正向引物标签序列 (表 6 ) 的 HLA-A/B/C/DQB1的 F引物, PI nr -A/B/C-R 2/3/4 和 PI nr -Q-R2/R3表示引物 5,末端带有第 n号反向 引物标签序列的 HLA-A/B/C/DQB1的 R引物(此处 n < 95 ) , 其 它依次类推。 且每个样本对应特定的一套 PCR 引物 ( PInfA/B/C-F謂, PI nr -A/B/C-R謂, PI nf -Q-F2/F3 , PI nr -Q-R2/R3 ) 。 PCR反应在 Bio-Rad公司的 PTC-200 PCR仪上运行。 PCR完 成后, 取 3ul PCR产物经 2%的琼脂糖凝胶电泳检测。 图 16显示 了 1号样本 HLA-A/B/C/DQB1相应外显子 PCR产物电泳结果, DNA分子标记为 DL 2000 ( Takara公司) , 胶图上有一系列片段 大小为 300bp-500bp单一条带,表明 1号样本的 HLA-A/B/C/DQB1 各外显子(A2、 A3、 A4、 B2、 B3、 B4、 C2、 C3、 C4、 DQB1 ) PCR扩增成功, 阴性对照(N )无扩增条带。 其它样品的结果与此 类似。

3. PCR产物混合和纯化

对第 "X "组 ("X" 为 1/2/3/4/5/6/7/8/9/10)样本, 从 96 孔板 HLA-X-P-A2剩余的 PCR产物中 (阴性对照除外)各取 20 ul混 合在一个 3ml的 EP管中, 标记为 HLA-X-A2-Mix, 对第 "X"组 样本的其它 9 个 96 孔板进行同样的操作, 分别标记为 HLA-X-A3-Mix 、 HLA-X-A4-Mix 、 HLA-X-B2-Mix 、 HLA-X-B3-Mix 、 HLA-X-B4-Mix 、 HLA-X-C2-Mix 、 HLA-X-C3-Mix、 HLA-X-C4-Mix和 HLA-X-DQBl-Mix, 震荡混 勾, 从 HLA-X-A2-Mix、 HLA-X-A3-Mix、 HLA-X-A4-Mix、 HLA-X-B2-Mix 、 HLA-X-B3-Mix 、 HLA-X-B4-Mix 、 HLA-X-C2-Mix 、 HLA-X-C3-Mix 、 HLA-X-C4-Mix 和 HLA-X-DQBl-Mix中各取 200ul混合在一个 3ml的 EP管中, 标 记为 HLA-X-Mix, 从中各取 500ul DNA混合物经 Qiagen DNA Purification kit过柱纯化(具体纯化步骤详见说明书) , 纯化所 得的 200ul DNA, 经 Nanodrop 8000(Thermo Fisher Scientific公 司)测定的 DNA浓度, 其它 9组样本操作相同, 10组样本测定的 DNA浓度分别为: 浓度值 53.1 523 56.1 572 50.5 55.7 542 58.6 53.9 548

(ng^ul)

4. Illumina GA测序文库构建

如实施例 4所述的方法, 从纯化后的 HLA-X-Mix中各取总 量 5ug的 DNA分别进行 DNA打断,打断后纯化,末端修复反应, 3' 末端加 A 反应, 连接 Illumina GA PCR-Free 文库接头 ( adapter ) 。

样本组与文库接头的对应关系如下

反应产物经 Ampure Beads(Beckman Coulter Genomics)纯化 后溶于 50ul去离子水, 经荧光定量 PCR ( QPCR )检测到 DNA 摩尔浓度结果如下:

6. 割胶回收

将 HLA-1-Mix、 HLA-2-Mix、 HLA-3-Mix , HLA-4-Mix、 HLA-5-Mix、 HLA-6-Mix、 HLA-7-Mix、 HLA-8-Mix、 HLA-9-Mix 和 HLA-10-Mix 等摩尔混合 (终浓度 70.86nM/ul ) , 标记为 HLA-Mix-10, 取 30μί HLA-Mix-10用 2%低熔点琼脂糖胶进行回 收。电泳条件为 100V, 100min。 DNA marker为 NEB公司的 50bp DNA marker。 割胶回收 450-750bp长度范围的 DNA片段(附图 17 ) 。 胶回收产物经 QIAquick PCR Purification Kit ( QIAGEN 公司)回收纯化, 纯化后体积为 32ul, 经荧光定量 PCR(QPCR) 检测到 DNA浓度结果为 10.25nM。

5. IlluminaGA测序和结果分析

根据实施例 5和 6的方法, 进行测序和结果分析。

建立各个引物标签对应样本 HLA-A/B/C/DQB1 各外显子 PCR产物测序结果的数据库, 所得 DNA序列利用与 IMGTHLA 专业数据库中 HLA-A/B/C/DQB1 相应各外显子的序列数据库比 对 , 序 列 比对结 果 100% 匹 配 的 即 为 对应样本的 HLA-A/B/C/DQB1基因型别。 可参考图 18示例说明的 1号样品 的 HLA-C位点的 2号外显子一致性序列构建程序的截图。 所有 950 个样本, 得到的分型结果与原已知分型结果完全相符, 其中 1-32号样本的具体结果如下:

编号 原 HLA-A/B/C/DQB1型别

1 A*02: :07 A*03: :01 B*07 :02 B*46: :01 C*01 :02 C*07 :02 DQB1*03: :03 DQB1*06 :02

2 A*ll: :01 A*31: :01 B*15 :11 B*38: :02 C*03 :03 C*07 :02 DQB1*03: :03 DQB1*04 :01

3 A*02: :07 A*24: :02 B*13 :01 B*46: :01 C*01 :02 C*03 :04 DQB1*03: :02 DQB1*06 :01

4 A*24: :02 A*33: :03 B*40 :01 B*51: :01 C*01 :02 C*14 :02 DQB1*03: :03 DQB1*03 :03

5 A*31: :01 A*31: :01 B*15 :01 B*35: :01 C*04 :01 C*04 :01 DQB1*03: :02 DQB1*06 :02

6 A*02: :07 A*03: :01 B*44 :02 B*46: :01 C*01 :02 C*05 :01 DQB1*03: :01 DQB1*06 :02

7 A*02: :01 A*30: :01 B*07 :02 B*13: :02 C*06 :02 C*07 :02 DQB1*02: :02 DQB1*06 :01

8 A*02: :07 A*02: :07 B*46 :01 B*46: :01 C*01 :02 C*01 :02 DQB1*05: :02 DQB1*03 :03

9 A*01: :01 A*33: :03 B*49 :01 B*58: :01 C*03 :02 C*07 :01 DQB1*06: :04 DQB1*06 :09

10 A*02: :07 A*ll: :01 B*46 :01 B*48: :01 C*01 :03 C*08 :01 DQB1*05: :03 DQB1*03 :02

11 A*02: :06 A*30: :01 B*13 :02 B*15: :02 C*06 :02 C*08 :01 DQB1*03: :01 DQB1*03 :01

12 A*24: :02 A*31: :01 B*35 :01 B*51: :01 C*03 :03 C*14 :02 DQB1*03: :03 DQB1*06 :01

13 A*ll: :01 A*33: :03 B*46 :01 B*46: :01 C*01 :02 C*01 :02 DQB1*03: :02 DQB1*03 :03

14 A*01: :01 A*02: :03 B*38 :02 B*57: :01 C*06 :02 C*07 :02 DQB1*05: :02 DQB1*03 :03

15 A*02: :06 A*24: :02 B*13 :01 B*15: :25 C*03 :04 C*07 :02 DQB1*03: :01 DQB1*06 :01

16 A*ll: :01 A*24: :02 B*15 :02 B*15: :27 C*04 :01 C*08 :01 DQB1*03: :01 DQB1*03 :03

17 A*24: :02 A*24: :02 B*40 :01 B*46: :01 C*01 :02 C*03 :04 DQB1*03: :03 DQB1*06 :02

18 A*24: :02 A*24: :02 B*40 :01 B*46: :01 C*01 :02 C*03 :04 DQB1*03: :03 DQB1*06 :02

19 A*ll: :01 A*33: :03 B*40 :02 B*58: :01 C*03 :02 C*03 :04 DQB1*02: :01 DQB1*03 :02

20 A*24: :02 A*30: :01 B*13 :02 B*40: :01 C*03 :04 C*06 :02 DQB1*06: :02 DQB1*06 :03 -L9- ΐ0:90*幽 : εο*ΐ9θα L0*3 ZO- 10*3 ΐθ: 9 8 10: 0 8 zo: εο: ζο*ν ζ ΐ0:90*幽 ζο· :go*iaba zo- Zl*3 W- εο*ο ΐθ: zs*a 10: 10: Z *V ΐθ: ζο*ν εο:εο*幽 ΐθ: : εο*ΐ9θα w- £0*3 90: ΐ0*3 ζο· ss*a 10: εΐ*8 10: ΐΐ*ν ΐθ: ζο*ν fZ ΐο:εο*幽 ΐθ: : ζο*幽 10: 80*3 ZO- εο*ο ΐθ: 8S*g 10: εο: εε*ν ΐθ: 9Z*V ΐ,Ζ

,0:90*幽 ΐθ: : εο*ΐ9θα εο: W*3 ZO- ΐ0*3 εο: ff*Q 10: εο: εε*ν ΐθ: ζο*ν ζζ

Ζ0:90*幽 Ζ0'· :,0*幽 zo- W*3 ZO- Ζ0*3 ΐθ: Qf*Q 10: zo- fZ*V ΐθ: ζο*ν \ζ εο:9θ*幽 Ζ0'· :90*ΐ8ΰα zo- 90*3 W- εο*ο ΐθ: zo- εΐ*8 10: οε*ν ζο· οζ ζο:εο*幽 ΐθ: : ζο*幽 w- £0*3 ZO- εο*ο ΐθ: 8S*g zo- εο: εε*ν ΐθ: ΐΐ*ν 6ΐ

Ζ0:90*幽 εο: : εο*ΐ9θα w- £0*3 ZO- ΐ0*3 ΐθ: 10: zo- fZ*V 8ΐ

Ζ0:90*幽 εο: : εο*ΐ9θα w- £0*3 ZO- ΐ0*3 ΐθ: 10: 0 8 zo- fZ*V ζο· fZ*V L\ εο:εο*幽 ΐθ: : εο*ΐ9θα 10: 80*3 Ϊ0: ^0*3 LZ- zo- ST*a zo- fZ*V ΐθ: ΐΐ*ν 9ΐ ΐ0:90*幽 ΐθ: : εο*ΐ9θα zo- 0*3 W- εο*ο 92: 10: εΐ*8 zo- fZ*V 90: ζο*ν ST εο:εο*幽 ζο· :go*iaba zo- 0*3 ZO- 90*3 ΐθ: zs*a zo- 8£*g εο: zo*v ΐθ: το*ν η εο:εο*幽 ζο· : εο*ΐ9θα zo- T0*3 zo- ΐ0*3 ΐθ: 10: εο: εε*ν ΐθ: ΐΐ*ν ετ ΐ0:90*幽 εο: : εο*ΐ9θα zo- W*3 εο: εο*ο ΐθ: 10: ΐθ: τε*ν ζο· fZ*V ζ\ ΐο:εο*幽 ΐθ: : εο*ΐ9θα 10: 80*3 zo- 90*3 ζο· zo- ΐθ: οε*ν 90: ζο*ν π ζο:εο*幽 εο: :go*iaba 10: 80*3 εο: ΐ0*3 ΐθ: 10: 9 8 ΐθ: ΐΐ*ν L0- ζο*ν Οΐ

60 :90*幽 :90*ΐ8ΰα 10: 0*3 zo- εο*ο ΐθ: 8S*g 10: εο: εε*ν ΐθ: το*ν 6 εο:εο*幽 ζο· :go*iaba zo- T0*3 zo- ΐ0*3 ΐθ: 10: L0- ζο*ν L0- ζο*ν 8 ΐ0:90*幽 : zo*幽 zo- 0*3 zo- 90*3 ζο· εΐ*8 zo- zo*a ΐθ: οε*ν ΐθ: ζο*ν L

Ζ0:90*幽 ΐθ: : εο*ΐ9θα 10: S0*3 zo- ΐ0*3 ΐθ: zo- ΐθ: εο*ν L0- ζο*ν 9

Ζ0:90*幽 ζο· : εο*ΐ9θα 10: ^0*3 Ϊ0: ^0*3 ΐθ: 10: ΐθ: τε*ν ΐθ: τε*ν S εο:εο*幽 εο: : εο*ΐ9θα zo- W*3 zo- ΐ0*3 ΐθ: 10: εο: εε*ν ζο· fZ*V f ΐ0:90*幽 ζο· : εο*ΐ9θα w- £0*3 zo- ΐ0*3 ΐθ: 10: 20: fZ*V ζο*ν ε ΐ0: 0*幽 εο: : εο*ΐ9θα zo- 0*3 εο: εο*ο ζο· 8£*g π: ΐθ: ΐθ: ΐΐ*ν ζ

Ζ0:90*幽 εο: : εο*ΐ9θα zo- 0*3 zo- ΐ0*3 ΐθ: zo- zo*a ΐθ: εο*ν L0- ζο*ν ΐ

[^ ΐ9όα/ο/8/ν- ■V1H ΐο:εο*ΐ8ΰα ζο:ζο*幽 zo :91*3 zo :90*3 ΐθ : T9*g zo : εΐ*8 ΐθ :οε*ν ΐθ : εο*ν ΐο:9θ*ΐ8ΰα ΐ0:30*幽 TO :80*3 zo : εο*ο ΐθ :89*9 zo εο : εε*ν 90 ■ ζο*ν τε ΐο:εο*ΐ8ΰα ΐο:εο*幽 0 : £0*3 zo ■Ζ0*3 ζο :0 8 so ΐθ : εο*ν 90 ■ ζο*ν οε

60: 90* τ aba ΐΟ: 0*幽 0 ■L0*3 zo : εο*ο ΐθ :89*9 8ΐ εο : εε*ν ΐθ : τε*ν 6Ζ ΐο:9θ*ΐ8ΰα ζο:ζο*幽 zo ■L0*3 zo :90*3 so :6£*9 zo : εΐ*8 ΐθ :οε*ν ΖΟ 8Ζ ΐο:9θ*ΐ8ΰα εο:εο*幽 zo ■10*3 zo : ΐ0*3 ΐθ :9 8 TO L0 ■ ζο*ν 0 ■ ζο*ν LZ ΐο:9θ*ΐ8ΰα ζο:εο*幽 zo ■L0*3 zo : ΐ0*3 ΐθ TO L0 ■ ζο*ν εο ■ ζο*ν 9Ζ ΐο:9θ*ΐ8ΰα zo:so*幽 zo ■Zl*3 : εο*ο ΐθ : zg*g TO ΐθ ΐθ ■ ζο*ν SZ εο:εο*ΐ8ΰα ΐο:εο*幽 : £0*3 90 : ΐ0*3 ζο : sg*g TO : εΐ*8 ΐθ :π*ν ΐθ ■ ζο*ν ΐο:εο*ΐ8ΰα ΐΟ:ΖΟ*幽 TO :80*3 zo : εο*ο ΐθ :89*9 TO εο : εε*ν ΐθ ζζ ΐο:εο*幽 εο : W*3 zo : ΐ0*3 εο TO εο : εε*ν ΐθ ■ ζο*ν ζζ

Ζ0:90*應 ZO:W)*應 zo : W*3 zo ■L0*3 ΐθ TO ζο ΐθ ■ ζο*ν ιζ

8899.0/llOZN3/X3d Ζ OAV 27 A*02: :07 A*02: :07 B*46: :01 B*46: :01 C*01 :02 C*01: :02 DQB1*03:03 DQB1*06:01

28 A*24: :02 A*30: :01 B*13: :02 B*39: :05 C*06 :02 C*07: :02 DQB1*02:02 DQB1*06:01

29 A*31: :01 A*33: :03 B*15: :18 B*58: :01 C*03 :02 C*07: :04 DQB1*04:01 DQB1*06:09

30 A*02: :06 A*03: :01 B*27: :05 B*40: :02 C*02 :02 C*03: :04 DQB1*03:01 DQB1*03:01

31 A*02: :06 A*33: :03 B*15: :02 B*58: :01 C*03 :02 C*08: :01 DQB1*05:01 DQB1*06:01

32 A*03: :01 A*30: :01 B*13: :02 B*51: :01 C*06 :02 C*15: :02 DQB1*02:02 DQB1*03:01 注: 当遇到 HLA-A/B/C位点中 2、 3、 4号外显子序列完全相 同的结果时, 取常见型。

采用本发明的技术路线, 对 950份已知 HLA-SBT分型结果的 样本进行 HLA-A/B/C/DQB1位点的基因分型, 结果发现: 采用本 发明的技术路线所得的分型结果与原结果完全 一致。 尽管本发明的具体实施方式已经得到详细的描 述, 本领域技 术人员将会理解。 根据已经公开的所有教导, 可以对那些细节进 行各种修改和替换, 这些改变均在本发明的保护范围之内。 本发 明的全部范围由所附权利要求及其任何等同物 给出。 参考文献

[1]. http://www.ebi.ac.uk/imgt/hla/stats.html

[2]. Tiercy J M. Molecular basis of HLA polymorphism: implications in clinical transplantation. [J]. Transpl Immunol, 2002, 9: 173-180.

[3]. C.Antoine, S.Miiller, A.Cant, et al. Long-term survival and transplantation of haemopoietic stem cells for immunodeficiencies: report of the European experience.1968-99.

[J]. The Lancet, 2003,9357:553-560.

[4]. H. A. Erlich, G. Opelz, J. Hansen, et al. HLA DNA Typing and Transplantation. [J] .Immunity, 2001,14:347-356.

[5]. Lillo R 5 Balas A> Vicario JL, et al. Two new HLA class allele, DPBl*02014,by sequence-based typing. [J]. Tissue Antigens, 2002, 59: 47-48.

[6]. A. Dormoy, N. Froelich . Leisenbach, et al. Mono-allelic amplification of exons 2-4 using allele group-specific primers for sequence-based typing (SBT) of the HLA-A, -B and -C genes: Preparation and validation of ready-to-use pre-SBT mini-kits. [J]. Tissue Antigens, 2003, 62: 201-216.

[7]. Elaine R. Mardis. The impact of next-generation sequencing technology on genetics. [J]. Trends in Genetics.2008,24:133-141.

[8]. Christian Hoffmannl, Nana Minkahl, Jeremy Leipzig. DNA barcoding and pyrosequencing to identify rare HIV drug resistance mutations. [J]. Nucleic Acids Research, 2007,1-8.

[9]. Shannon J.Odelberg, Robert B.Weiss, Akira Hata.

Template-switching during DNA synthesis by Thermus aquaticus DNA polymerase I. [J]. Nucleic Acids Research.1995, 23:2049-2057.

[10] . Sayer D, Whidborne R, Brestovac B. HLA-DRB1 DNA sequencing based typing: an approach suitable for high throughput typing including unrelated bone marrow registry donors. [J]. Tissue Antigens. 2001, 57(l):46-54.

[11]. Iwanka Kozarewa, Zemin Ning, Michael A Quail. Amplification-free Illumina sequencing-library preparation facilitates improved mapping and assembly of (G+C)-biased genomes. [J]. Nature Methods. 2009, 6:291 - 295.

[12] Marsh, S.G.E., Parham, P. & Barber, L.D. The HLA Facts Book 3-91 (Academic Press, London, 2000).

[13]Campbell, K.J. et al. Characterization of 47 MHC class I sequences in Filipino cynomolgus macaques. Immunogenetics 61, 177-187 (2009).

[14]Goulder, P.J.R. & Watkins, D.I. Impact of MHC class I diversity on immune control of immunodeficiency virus replication. Nat. Rev. Immunol. 8, 619-630 (2008).

[15]0'Leary, C.E. et al. Identification of novel MHC class I sequences in pig-tailed macaques by amplicon pyrosequencing and full-length cDNA cloning and sequencing. Immunogenetics 61, 689-701 (2009).

[16]Robinson J, Malik A, Parham P, Bodmer JG, Marsh SGE.IMGT/HLA database-a sequence database for the human major histocompatibility complex. Tissue Antigens 55, 80-7 ( 2000 ) .

[17] Hoffmann C, Minkah N, Leipzig J, Wang G, Arens MQ, Tebas P, Bushman FD. DNA bar coding and pyrosequencing to identify rare HIV drug resistance mutations. Nucleic Acids Res. 2007;35(13):e91.

[18]. WU, D. L. et al. Comparative analysis of serologic typing and HLA-II typing by micro-PCR-SSP. Di Yi Jun Yi Da Xue Xue Bao, 2002, 22:247-249.

[19】. Al- Hussein K A, Rama N R, Butt A I, et al. HLA class II sequence based typing in normal Saudi individuals. Tissue Antigens, 2002, 60: 259- 261. [20]. D. C. Sayer, D. M. Goodridge. Pilot study: assessment of interlaboratory variability of sequencing-based typing DNA sequence data quality. Tissue Antigens, 2007, 69 Suppl: 66-68.

[21]. Horton V, Stratton I, Bottazzo G. F. et al. Genetic heterogeneity of autoimmune diabetes: age of presentation in adults is influenced by HLA DRBl and DQBl genotypes. Diabetologia, 1999, 42:608-616.

[22]. C.E.M. Voorter, M.C. Kikl, E.M. van den Berg-Loonen et al. High-resolution HLA typing for the DQBl gene by sequence-based typing. Tissue Antigens, 2008, 51:80-87.

[23]. G. Bentley, R. Higuchi, B. Hoglund et al. High-resolution, high-throughput HLA genotyping by next-generation sequencing. Tissue Antigens, 2009, 74: 393-403.