专利名称:异常线粒体dna、相关的融合转录本和翻译产物及其杂交探针的制作方法
技术领域:
本发明涉及线粒体基因组学和蛋白组学领域。在一个方面,本发明涉及线粒体基因组融合转录本和翻译产物的确定鉴定和应用,以及与其杂交的探针。
背景技术:
线粒体基因组线粒体基因组是小型而关键的核酸序列。相对于33亿bp的巨大核基因组(单倍的)而言,线粒体DNA或者"mtDNA"包括16,569个核酸碱基对(bp)的小基因组 (Anderson 等人,1981 ;Andrews 等人,1999)。它的遗传组(genetic complement)大大小于核细胞遗传组(0.0005% )。然而,单个细胞根据具体的细胞功能携带IO3至IO4个线粒体(Singh and Modica-Napolitano 2002)。通信和化学信号传导常规地发生于核和线粒体基因组之间(Sierratt等人,1997)。此外,特定的核组份负责线粒体序列的维持和完整性 (Croteau等人,1999)。给定个体中的全部mtDNA基因组是相同的,其原因在于在发生受精后卵子内线粒体的克隆扩增。然而突变事件可诱发反映为体细胞突变的序列多样性。在称为异序性(heteroplasmy)的情况下这些突变可在整个身体的不同组织中积累。线粒体蛋白质组需要大约3,000个核基因来构建、操作和维持线粒体,它们中仅有37个由线粒体基因组编码,表明线粒体极其依赖于核基因座。该线粒体基因组编码M个基因的组,包括 2个rRNA和22个tRNA,它们确保其余13个基因的正确翻译,这13个基因对于电子传递是至关重要的(参见图1)。除由该线粒体基因组提供的13个多肽外,该线粒体基因组依赖于 70个核编码的蛋白质以完成此种重要功能所需的氧化和还原反应。核和线粒体蛋白二者形成跨越线粒体内膜的复合物并总共产生80-90%的细胞代谢所需的化学燃料三磷酸腺苷或 ATP0除了产生能量以外,线粒体在其它代谢途径中也发挥重要作用。线粒体的关键功能是细胞死亡或者凋亡的介导(参见Green and Kroemer,2005)。本质上,存在有渗透线粒体外膜的信号通路,或者除此之外还渗透线粒体内膜。当特定的线粒体蛋白质释放进入细胞溶质中时,启动不可逆的细胞死亡。这一过程强调了一些线粒体蛋白质所具有的多功能作用。 这些多任务蛋白质暗示其它线粒体蛋白质也可能具有另外功能。线粒体融合转录组/蛋白质组线粒体基因组不寻常之处在于它是一种环状的、无内含子的DNA分子。该基因组散布有重复基序,该基序处于特定长度的序列的侧翼。这些重复之间的序列在尚未充分理解的情况下容易缺失。鉴于该线粒体基因组中重复基因的数目,有许多可能的缺失。最熟知的例子是4977 “共同缺失(common deletion)”。此缺失与有证据支持的若干病症和疾病有关,并且据认为随衰老而频率增加(Dai等人,2004 ;Ro等人,2003 ;Barron等人,2001 ; Lewis 等人,2000 ;MulIer-Hocker,1998 ;Porteous 等人,1998)(图 4)。线粒体基因组学领域目前的观点是,线粒体缺失仅仅是通过诸如活性氧簇和UVR的试剂损害线粒体基因组的有害副产物(Krishnan等人2008,Nature Genetics)。此外,尽管认识到高水平的mtDNA缺失可能对细胞产生ATP形式的能量的能力有严重的影响(其原因是缺少细胞呼吸所必需的基因序列),但是未预料到的是这些缺失的线粒体分子可以是下游通路的组分,具有预定的功能作用,并且可能更适合将其认为是已确定的线粒体基因的另外的天然形式。mtDNA的序列动力学是重要的诊断工具。mtDNA中的突变通常是发展成疾病的初期指示信号。例如,已经证实,线粒体基因组中的点突变是前列腺中肿瘤病灶的特征。这种趋势还延伸到了肿瘤组织近端和远端的表现正常的组织(Parr等人2006)。这表明线粒体突变在恶性转化通路早期即已发生。例如,3. 4kb线粒体缺失的频率在良性和恶性前列腺组织之间的区分中具有优良的效用(Maki等人2008)。此外,对与缺失有关的疾病和新序列(通过确定许多开放阅读框的分子的再接近而产生)的研究鉴定表明独特的线粒体融合蛋白的可能性。线粒体融合转录本此前在文献中已有报道,首次报道于大豆中(Morgens等人 1984),后来报道于两名卡恩斯-塞尔综合征(Kearns-Sayre Syndrome)患者中,该卡恩斯-塞尔综合征是一种罕见的神经肌肉障碍(Nakase等人1990)。重要的是,未发现这些转录本与任何人类癌症有关联(或者未被研究认为与任何人类癌症有关)。核融合蛋白质组融合蛋白及其对癌症产生的影响在核中已有重要的先例。核MLL基因对易位被充分确定与高风险急性白血病以及用靶向拓扑异构酶II的药剂治疗后的治疗相关急性髓细胞性白血病有关联(Libura等人,2005)。目前,已知人MLL基因的大约50种易位与这些癌症有关(Meyer等人,200 。在大部分这些事件中,这些突变的断裂点不论是部分串联重复还是易位都出现在核特异性重复基序例如Alu I中。这些突变的大多数是相互易位的 (84% ),并且包括大约40种不同基因(Libura等人2005)。已知影响恶性疾病进程的一些此类重排产生的功能性嵌合蛋白。例如,表达 MLL-ENL的蛋白质的鼠细胞加速了存活于依托泊苷暴露的细胞的普遍染色体异常(Eguchi 等人,2006)。尤其引人关注的是MLL-SMAP1和交互的SMAPI-MLL。SMAPl结合钙,并且因此参与细胞信号传导和运输。线粒体融合蛋白可以被假定与核融合蛋白具有相似作用,特别是由于线粒体和线粒体蛋白质在信号传导和凋亡中发挥类似作用。发明概述本发明的一个目的是提供异常线粒体DNA、相关的融合转录本和翻译产物及其杂交探针。根据本发明的一个方面,提供了与癌症有关的分离的线粒体融合转录本。根据本发明的另一方面,提供了编码本发明融合转录本的分离的mtDNA。根据本发明的另一方面,提供了一种杂交探针,其具有与本发明的线粒体融合转录本或mtDNA的至少一部分互补的核酸序列。
根据本发明的另一方面,提供了检测哺乳动物癌症的方法,该方法包括通过将哺乳动物组织样品与至少一种杂交探针杂交来分析该样品中与癌症有关的至少一种线粒体融合转录本的存在,所述杂交探针具有与本发明的线粒体融合转录本的至少一部分互补的核酸序列。根据本发明的另一方面,提供了检测哺乳动物癌症的方法,该方法包括通过将哺乳动物的组织样品与至少一种杂交探针杂交来分析所述样品中与癌症相关的至少一种异常mtDNA的存在,所述杂交探针具有与本发明的mtDNA的至少一部分互补的核酸序列。根据本发明的另一方面,提供了用于进行检测哺乳动物中癌症存在的分析的试剂盒,所述试剂盒包括至少一种与本发明的融合转录本或mtDNA的至少一部分互补的杂交探针。根据本发明的另一方面,提供了一种线粒体融合蛋白,该蛋白质具有由本发明线粒体融合转录本的翻译产生的氨基酸序列。根据本发明的另一方面,提供了检测哺乳动物癌症的方法,该方法包括分析哺乳动物的组织样品中至少一种线粒体融合蛋白的存在,该蛋白质具有由本发明线粒体融合转录本翻译产生的氨基酸序列。
现参照附图仅以示例的方式描述本发明的一些实施方案,其中图1是显示线粒体蛋白质编码基因的示意图。图2显示了前列腺样品中的聚腺苷酸化融合转录本,其由3. 41Λ缺失的丧失引起。图3显示了前列腺样品中的聚腺苷酸化融合转录本,其由49771Λ共同缺失的丧失引起。图4显示了乳腺样品中的聚腺苷酸化融合转录本,其由mt基因组的3. 4kb区段的丧失引起。图fe和恥显示基因剪接之前和之后的线粒体DNA区域的实例。图6a至6g说明了本发明转录本2,3,8,9,10,11和12在结直肠癌肿瘤鉴定中的结果。图7a至7d说明了本发明转录本6,8,10和20在肺癌肿瘤鉴定中的结果。图8a至8j说明了本发明转录本6,10,11,14,15,16和20在黑素瘤鉴定中的结果。图9a至9h说明了本发明转录本1,2,3,6,11,12,15和20在卵巢癌鉴定中的结果。图10至18说明了本发明转录本2,3,4,11,12,13,15,16和20在睾丸癌鉴定中的结果。图19说明了在融合蛋白发现期进行的RWPEl和WPE1-NA22细胞系的细胞溶质和线粒体级分的SDS PAGE凝胶。图 20a 说明了基于肽 ILYMTDEVNDPSLTIK 和 STPYECGFDPMSP 的融合转录本 P0026 的鉴定的蛋白质。图20b说明了检索人(SwissProt)数据库后图19的线粒体NA22细胞系凝胶切片 5中鉴定的野生型C02蛋白。图 21a 说明了基于肽 KGPNVVGPYGLLQPFADAMK、YDQLMHLLffK 和 LITTQQWLIK 的融合转录本P0062的鉴定的蛋白质。图21b说明了检索人(SwissProt)数据库后图19的凝胶切片5中鉴定的NDl的
鉴定肽。图 22 说明了基于肽 KGPNVVGPYGLLQPFADAMK 和 WAIIEEFTK 的融合转录本 P0064 的
鉴定的蛋白质。图 23a 说明了 基于肽 KGPNVVGPYGLLQPFADAMK、VFSffLATLHGSNMK 和 VLMVEEPSMNLEWLYGCPPPYHTFEEPVYMK的融合转录本P0176的鉴定的蛋白质。图2 说明了检索人(SwissProt)数据库后图19的线粒体NA22细胞系凝胶切片 4中鉴定的野生型COl蛋白。图2 至24d分别说明了融合转录本P0026、P0062、P0064和P0176的定量测定结^ ο
具体实施例方式本发明提供了用于预测、诊断和/或监测癌症的新颖的线粒体融合转录本、突变的亲本mtDNA分子和得到的翻译产物。本发明进一步提供了用于检测融合转录本和相关 mtDNA分子的杂交探针以及此类探针的应用。定义除非另有说明,用于本文的全部技术和科学术语均具有与本发明技术领域普通技术人员通常理解相同的含义。术语“包括”、“包含”或“含有”可用于本申请文件。如本文所述的(包括说明书和/或权利要求书),这些术语解释为说明存在所述特征、整体、步骤或组份,但是如对于相关领域普通技术人员显而易见的那样,不解释为排除存在一种或多种其它的特征、整体、步骤、组份或其组。如本文使用的,“异常”或“突变”包括会产生融合转录本的野生型线粒体DNA序列的任何修饰,并且包括但不限于,插入、易位、缺失、重复、重组、重排或其组合。如本文定义的,“生物样品”是指含有细胞的组织或体液,可以从其中可以获得感兴趣的分子。例如,该生物样品可得自组织例如前列腺,乳腺,结直肠,肺和皮肤,或者得自血液,唾液,脑脊液,痰液,尿液,粘液,滑液,腹腔液,羊水等。该生物样品可以是外科手术样品或生物活检样品。该生物样品可以从来源所得那样直接使用或者经预处理以改变样品性质之后再使用。因此该生物样品可以在使用前预处理,例如通过从血液中制备血浆或血清、 破坏细胞、从固体材料制备液体、稀释粘稠液体、过滤液体、蒸馏液体、浓缩液体、使干扰组分失活、添加试剂等。“连续的”转录本是一种融合转录本,其保留有两个剪剪接基因的起始到终点的阅读框。“末端”转录本是一种融合转录本,其会在第二剪剪接基因的原始终止密码子之前产生早熟的终止密码子。如本文使用的,“线粒体DNA”或“mtDNA”是存在于线粒体中的DNA。如本文使用的,措辞“线粒体融合蛋白”或“融合蛋白”是指通过突变线粒体DNA的转录和翻译产生的肽产物,其中此类突变包含缺失或者其它“大规模”线粒体DNA重排。此外或者可选择的,同框(in-frame)蛋白可以从在此序列中的另外的起始和终止密码子翻
6译而来。如本文使用的,措辞“线粒体融合转录本”或“融合转录本”是指由于突变线粒体 DNA序列的转录产生的RNA转录产物,其中此类突变可包含线粒体缺失和其它大规模线粒体DNA重排。如本文使用的,措辞“线粒体翻译产物”或“翻译产物”是指得自线粒体融合转录本的任何氨基酸链,包括肽、多肽和蛋白质。应当理解,“线粒体翻译产物”包括上文定义的 “融合蛋白”。计算机分析和序列靶向如上文讨论的,线粒体融合转录本已被报道于大豆(Morgens等人1984)中以及罹患罕见神经肌肉障碍的人(Nakase等人1990)中。然而与人类癌症有关的融合转录本未被披露。使用与癌症相关的人类线粒体基因组的大规模缺失绘图中获得的知识、此类缺失的高频率的观察,以及在转录活化突变的mtDNA分子的另一有机体和另一疾病类型中的证据,本发明人推测,此类缺失具有超越与癌症有关的DNA分子以及损伤和修复过程的重要性。为了检验此推测,进行了线粒体基因组的计算机分析,特别是对于重复元件,其提示许多潜在的缺失位点。在鉴定具有非邻近或非串联位置的线粒体序列中的独特重复的初始步步骤之后,进行以下筛选以鉴定这些重复,即通过在该DNA分子中启动缺失事件,其中这些 DNA分子可能重新接近或者重新连接以产生具有开放读码框(ORF)的融合DNA序列,并因此能够通过线粒体转录机制而被转录。然后选择这些分子的18个的亚组以用于靶向研究是否它们存在于人类的天然生物学状态中;它们被聚腺苷酸化并因此有望进行蛋白质合成;它们与恶性肿瘤有关联。这些研究的结果证实对于全部三个疑问均是肯定的,并且描述于下文。基因组突变线粒体DNA (mtDNA)动力学是一种重要的诊断工具。mtDNA中的突变体通常是疾病发生的初步指示并且可作为指示与疾病发生相关的风险因子的生物标志物。根据本发明, 线粒体基因组中的突变导致产生与癌症相关的融合转录本。因此,提供了编码此类转录本的mtDNA和针对它的探针在癌症的检测、诊断和监测中的用途。本领域技术人员一应理解,用于本发明方法的mtDNA分子可通过分离天然出现的突变而得到,或者可以基于本文所述任一融合转录本互补序列而得到。示例性的mtDNA序列和融合转录本公开于本申请人的共同待决美国申请No. 61/040,616和公开的PCT申请 PCT/CA2009/000351(以 WO 2009/117811 公开)中。突变基因组序列的检测本发明的突变体mtDNA序列可包括导致融合转录本生成的任何修饰。此类修饰的非限制性实例包括插入、易位、缺失、重复、重组、重排或其组合。虽然修饰或变化可以在大小上极大地变化,从仅几个碱基到几千个碱基,优选地,该修饰会造成大型缺失或者其它大规模基因组异常。提取DNA以检测此类突变体的存在可以使用本领域公知的方法、接着通过扩增线粒体基因组的全部或区域来进行,并且可以包括线粒体基因组的测序,如Current Protocols in Molecular Biology 所述。
检测该突变体的步骤可以从本领域的任何已知技术中选择。例如分析mtDNA可包括对 mtDNA 测序,通过 PCR 扩增 mtDNA,Southern、Northern、Western South-Western 印记杂交,变性HPLC,与微阵列杂交,生物芯片或基因芯片,分子标志物分析,生物传感器,熔解温度曲线或者上述任一方法的组合。可以使用任何适宜方法对线粒体DNA测序。优选地,mtDNA在测序之前通过PCR 扩增。PCR方法是本领域公知的,并且可以如Mullis和Faloona,1987,Methods Enzymo 1., 155 335中所述来执行。PCR产物可以被直接测序列,或者被克隆到载体中,然后将该载体置于细菌宿主中。DNA测序方法的实例可见于Brumley, R. L. Jr.和Smith, L. Μ.,1991, Rapid DNA sequencing by horizontal ultrathin gel electrophoresis,Nucleic Acids Res. 19 :4121-4126,以及 Luckey,J. A.,等人,1993,High speed DNA sequencing by capillary gel electrophoresis, Methods Enzymol. 218 :154—172。 mtDNA 的 PCR 禾口测序的组合应用描述于 Hopgood, R.,等人,1992, Strategies for automated sequencing of human mtDNA directly from PCR products,Biotechniques 13 :82-92,以及Tanaka,M.等人,1996, Automated sequencing of mtDNA, Methods Enzymol. 264 :407-421。选择适宜序列以用于制备各种引物的方法亦是本领域已知的。例如,该引物可使用常规固相合成法应用商购设备来制备,所述商购设备例如得自Applied Biosystems USA Inc. (Foster City,California)>DuPont, (Wilmington,Del.)或 Milligen(Bedford, Mass. ) ο根据本发明的一个方面,为了测定候选的基因组序列,首先鉴定序列缺失的连接点。序列缺失主要是通过直接或间接的重复元件来鉴定,该重复单元在待缺失序列的5’和 3’端侧翼。从该基因组中去除核苷酸的一部分,接着连接该基因组,结果产生新的连接点。在鉴定了该连接点以后,确定连接点侧翼的基因的核苷酸,以确定剪剪接基因。通常,该剪接基因包括来自第一基因的起始密码子以及第二基因的终止密码子,并且可以被表达为连续转录本,即,其从两个剪接基因的起始到终点保持读码框。表1提供了当重排序列在剪接位点重新接合时发现具有开放读码框(ORF)的一些已知的线粒体缺失。用于本发明方法的示例性的mtDNA分子提供于下文。这些mtDNA基于已知线粒体基因组(SEQ ID NO 1)的修饰,并已赋予融合或“FUS”名称。其中A:B表示第一剪接基因的最末线粒体核苷酸与第二剪接基因的第一线粒体核苷酸之间的连接点。剪接基因的出处提供于括弧内,其后是相应的序列标识。当以下面提供时,(AltMet)和(OrigMet)分别是指另外的和原始的翻译起始位点。FUS 8469 :13447 (AltMet) (ATP 合酶 FO 亚基 8 至 NADH 脱氢酶亚基)(SEQ ID No 2)FUS 10744 14124 (NADH 脱氢酶亚基 4L (ND4L)至 NADH 脱氢酶亚基 5(ND5)) (SEQ ID No 3)FUS 7974 :15496 (细胞色素 C 氧化酶亚基 II 0Χ)ΙΙ)至细胞色素 b (Cytb)) (SEQ ID No 4)FUS 7992 15730 (细胞色素 C 氧化酶亚基 II 0Χ)ΙΙ)至细胞色素 b (Cytb)) (SEQ ID No 5)FUS 8210 15339 (细胞色素 C 氧化酶亚基 II 0Χ)ΙΙ)至细胞色素 b (Cytb)) (SEQ IDNo 6)FUS 8828 14896 (ATP 合酶 FO 亚基 6 (ATPase6)至细胞色素 b (Cytb)) (SEQ ID No
7)FUS 10665 :14856 (NADH 脱氢酶亚基 4L(ND4L)至细胞色素 b (Cytb)) (SEQ ID No:
8)FUS 6075 13799 (细胞色素C氧化酶亚基I (COI)至NADH脱氢酶亚基5 (ND5)) (SEQ ID No 9)FUS 6325 13989 (细胞色素C氧化酶亚基I (COI)至NADH脱氢酶亚基5 (ND5)) (SEQ ID No 10)FUS 7438 :13476(细胞色素C氧化酶亚基I (COI)至NADH脱氢酶亚基5(ND5)) (SEQ ID No 11)FUS 7775 :13532 (细胞色素C氧化酶亚基II (COII)至NADH脱氢酶亚基5 (ND5)) (SEQ ID No 12)FUS 8213 :13991 (细胞色素C氧化酶亚基II (COII)至NADH脱氢酶亚基5 (ND5)) (SEQ ID No 13)FUS 9191 :12909 (ATP 合酶 FO 亚基 6 (ATPase6)至 NADH 脱氢酶亚基 5 (ND5)) (SEQ ID No 14)FUS 9574 :12972(细胞色素C氧化酶亚基III (COIII)至NADH脱氢酶亚基5(ND5)) (SEQ ID No 15)FUS 10367 :12829 (NADH 脱氢酶亚基 3 (ND3)至 NADH 脱氢酶亚基 5 (ND5)) (SEQ ID No 16)FUS 11232 :13980 (NADH 脱氢酶亚基 4 (ND4)至 NADH 脱氢酶亚基 5 (ND5) (SEQ ID No 17)FUS 8469 13447 (OrigMet) (ATP 合酶 FO 亚基 8 至 NADH 脱氢酶亚基)(SEQ ID No 18)FUS 9144 I38I6 ((ATP 合酶 FO 亚基 6 (ATPase6)至 NADH 脱氢酶亚基 5 (ND5)) (SEQ ID No 54)本发明还提供了这些序列的变体或片段在预测、诊断和/或监测癌症中的用途。“变体",如本文使用的,是指与本发明mtDNA序列不同但保留了它们的必需的性质的核酸。通常来说,变体总体上很相似,并且在许多区域,与所选的mtDNA序列相同。具体地说,本发明的变体包括剪接基因的连接点的至少一个核苷酸,并且可进一步包括一个或多个与其邻近的核苷酸。在本发明的一个实施方案中,该变体序列与任一本发明mtDNA 序列或者其互补链至少有80 %,85 %,90 %,95 %,96 %,97 %,98 %或99 %的同一性。在本发明中,“片段"是指一条短的核酸序列或与其互补的链,所述核酸序列是包含在公开的基因组序列中的一部分。此部分包括至少一个核苷酸(其包含剪接基因的连接点),并且可进一步包含一个或多个与其邻近的核苷酸。本发明的片段长度优选为至少约 15nt,更优选至少约20nt,还更优选至少约30nt,再更优选至少约40nt,至少约50nt,至少约75nt或至少约150nt。“长度至少20ng〃的片段,例如,将包括上文所列任一个mtDNA序列的20个或者更多个连续碱基。在本上下文中,“约”包括具体引述的数值,在任一末端或者两个末端大几个或小几个(5,4,3,2或1)核苷酸的数值。这些片段用途包括但不限于作为如本文讨论的诊断探针和引物。当然,还考虑更大的片段(例如,50,150,500,600,2000 个核苷酸)。因此,在本发明的一些具体实施方案中,该mtDNA序列选自SEQ ID NO :2(FUS 8469 :13447 ;AltMet)SEQ ID NO :3(FUS 10744 :14124)SEQ ID NO :4(FUS 7974 :15496)SEQ ID NO :5(FUS 7992 :15730)SEQ ID NO :6(FUS 8210 :15339)SEQ ID NO :7(FUS 8828 :14896)SEQ ID NO :8(FUS 10665 :14856)SEQ ID NO :9(FUS 6075 :13799)SEQ ID NO :10(FUS 6325 :13989)SEQ ID NO :11(FUS 7438 :13476)SEQ ID NO :12(FUS 7775 :13532)SEQ ID NO :13(FUS 8213 :13991)SEQ ID NO :14(FUS 9191 :12909)SEQ ID NO :15(FUS 9574 :12972)SEQ ID NO :16(FUS 10367 :12829)SEQ ID NO :17(FUS 11232 :13980)SEQ ID NO :18(FUS 8469 :13447 ;OrigMet)SEQ ID NO 54 (FUS 9144:13816),-及其片段或变体。泄本发明另一方面提供了能够识别本发明异常mtDNA序列的杂交探针。如本文使用的,术语"探针"是指一种寡核苷酸,其与靶核酸序列形成双链结构,原因是该探针中的至少一个序列与靶区域中的序列互补。可以根据本领域已知的方法标记该探针。一旦与特定疾病有关的异常mtDNA被鉴定,mtDNA与例如寡核苷酸阵列的杂交可用于鉴定特定的突变,然而,可以使用任一已知的杂交方法。与本发明引物用相同,可以产生直接针对本发明示例性的mtDNA融合分子或其片段或变体产生探针。例如,SEQ ID NO :2-18和M所述的序列和表1公开的序列可用于设计引物或探针,它们将检测包含目的融合序列的核酸序列。正如本领域技术人员所理解的, 与这些核酸分子杂交的引物或探针在高度严格杂交条件或者较低严格条件下可以杂交, 这些条件是本领域技术人员已知的,并且可例如见于Current Protocols in Molecular Biology (John Wiley & Sons, New York (1989)), 6. 3. 1-6. 3.6。在本发明的一些具体实施方案中,本发明探针含有与包含剪接基因的连接点的异常mtDNA的至少一部分互补的序列。此部分包括至少一个构成连接点A:B的核苷酸,并且可进一步包括一个或多个与其邻近的核苷酸。关于此方面,本发明包括任何适宜的靶向机制,该机制会使用构成和/或邻近于该连接点A:B的核苷酸来选择mtDNA分子。
本发明考虑本领域已知的多种类型的探针。例如,该探针可以是杂交探针,其与靶核苷酸序列的结合可以使用通用DNA结合染料例如溴化乙锭、SYBR Green, SYBR Gold等来检测。或者,该探针可以整合一个或多个可检测标记。可检测标记是分子或者部分,其性质或者特征可以直接或间接地被检测,并按照该探针与其靶序列杂交的能力不受影响来选择。标记核酸序列的方法是本领域公知的(参见,例如,Ausubel等人,(1997,和更新资料) Current Protocols in Molecular Biology, Wiley & Sons, New York)。适合用于本发明探针的标记包括可以直接检测的那些,例如放射性同位素、荧光团、化学发光团、酶、胶体颗粒、荧光微粒等。本领域技术人员理解,直接可检测标记可能需要另外的组分,例如底物、触发试剂、光等使得该标记能够检测。本发明还考虑间接检测的标记的用途。本发明探针长度优选至少约15nt,更优选至少约20nt,还更优选至少约30nt,再更优选至少约40nt,至少约50nt,至少约75nt或至少约150nt。“长度至少20nt〃的探针, 例如,将包括与本发明mtDNA序列互补的的20个或者更多个连续碱基。当然,可优选更大的探针(例如,50,150,500,600,2000个核苷酸)。本发明探针还将在生物样品中与核酸分子杂交,从而促成了本发明的方法。相应地,在本发明的一个方面,提供了用于检测癌症的杂交探针,其中该探针与异常mtDNA分子的至少一部分互补。在另一方面,本发明提供了探针以及此探针用于检测结直肠癌,肺癌, 乳腺癌,卵巢癌,睾丸癌,前列腺癌和/或黑素瘤皮肤癌的用途(或者使用方法)。分析法测定生物样品中异常mtDNA的水平可以确定受试者中一种或多种癌症的存在。因此,本发明包括用于预测、诊断或监测癌症的方法,该方法包括获得一种或多种生物样品, 从该样品中提取mtDNA,以及分析该样品中的异常mtDNA,其方式是对样品中的一种或多种异常mtDNA序列进行定量并与参比值比较检测的量。本领域技术人员理解,该参比值是基于该方法是否是旨在预测、诊断或监测癌症。因此,该参比值可以与从一种或多种已知的非癌性生物样品、一种或多种已知的癌性生物样品、和/或一种或多种随时间获取的生物样品中收集的mtDNA数据关联。在一个方面,本发明提供了检测哺乳动物癌症的方法,该方法包括分析哺乳动物的组织样品中上述异常线粒体DNA的存在。本发明还提供了包括通过使该样品与至少一种杂交探针杂交来分析哺乳动物的组织样品的方法。该探针可针对本文所述本发明突变线粒体DNA序列来产生。在另一方面,本发明提供了上文所述方法,其中该分析法包括a)使用至少一种探针进行杂交反应,使该至少一种探针与互补的异常线粒体DNA 序列杂交;b)通过对与该至少一种探针杂交的线粒体DNA定量,来定量样品中的至少一种异常线粒体DNA序列;和c)将样品中的线粒体DNA的量与至少一种已知参比值进行比较。本发明还包括用于预测、诊断或监测癌症的方法,该方法包括如下文所述的诊断显像分析。本发明的诊断分析可以容易地适用于高通量法。高通量分析法提供了同时处理许多样品并且显著减少了筛选大量样品所需的时间的益处。因此,本发明考虑本发明的核苷酸在高通量筛选法或者分析法中用于在许多测试样品中检测和/或定量靶核苷酸序列的用途。融合转录本本发明进一步提供了可用于预测、诊断和/或监测癌症的方法的融合转录本和相关杂交探针的鉴定。本领域技术人员将理解,此类分子可以通过分离天然转录本得到,或者,通过重组表达本发明方法分离的mtDNA而得到。如所讨论的,此类mtDNA通常包含剪接基因,该剪接基因具有来自第一基因的起始密码子和第二基因的终止密码子。因此,由此得到的融合转录本包括与该剪接基因相关的连接点。融合转录本的检测天然融合转录本可从生物样品中提。⑶腋荼玖煊蛞阎娜魏问室朔椒ǎ蛘呖梢愿菔凳├龇椒ń。在本发明的一个实施方案中,稳定的聚腺苷酸化融合转录本是使用靶向具有聚腺苷酸尾的转录本的寡聚(dT)引物,接着使用设计为针对该靶转录本的引物对进行RT-PCR而鉴定的。使用此类方法检测以下示例性的融合转录本,并且发现其如实施例中所述可用于预测、诊断和/或监测癌症。同样,得自表1所示ORF序列的融合转录本可用于预测、诊断
和/或监测癌症t
SEQIDNO:19(转录本 1 ;8469 13447 ;AltMet)
SEQIDNO:20(转录本 2 ; 10744:14124)
SEQIDNO:21(转录本 3 ;7974 15496)
SEQIDNO:22(转录本 4 ;7992 15730)
SEQIDNO:23(转录本 5 ;8210 15339)
SEQIDNO:24(转录本 6 ;8828 14896)
SEQIDNO:25(转录本 7 ;10665:14856)
SEQIDNO:26(转录本 8 ;6075 13799)
SEQIDNO:27(转录本 9 ;6325 13989)
SEQIDNO:28(转录本 10 ;7438:13476)
SEQIDNO:29(转录本 11 ;7775:13532)
SEQIDNO:30(转录本 12 ;8213:13991)
SEQIDNO:31(转录本 14 ;9191:12909)
SEQIDNO:32(转录本 15 ;9574:12972)
SEQIDNO:33(转录本 16 ;10367 12829)
SEQIDNO:34(转录本 17 ;11232 13980)
SEQIDNO:35(转录本 20 ;8469:13447 ;OrigMet)
SEQIDNO:53(转录本 13 ;9144:13816)融合转录本还可以通过本领域已知的重组技术来制备。通常地,它包括用包含目的mtDNA序列的表达载体转化(包括转染、转导或感染)适宜的宿主细胞。还提供了本文鉴定的融合转录本的变体或片段。此类序列可符合上文所述关于基因组变体和片段的或者熟练技术人员所确定的适当的大小限度和百分比同一性。探针
一旦表征了融合转录本,则引物或探针可以被开发成靶向生物样品中的转录本。 此类引物和探针可以使用任何已知方法(如上文所述的)或者下文提供的实施例中所述的方法来制备。例如,针对该融合转录本可以产生探针,并且例如Panomics 的QuantiGene 2. 0 的检测技术用于检测样品转录本的存在。可以针对本发明示例性的融合转录本或其片段或变体而直接产生引物和探针。例如,SEQ ID NO :19-35和53所述以及表1所公开的序列可用于设计探针,该探针将检测包含目的融合序列的核酸序列。本领域技术人员将理解,设计用于与本发明融合转录本杂交的探针含有与表达剪接基因的连接点的该转录本的至少一部分互补的序列。该部分包括与该表达的连接点互补的至少一个核苷酸,并且可进一步包含与其邻接的一个或多个互补的核苷酸。在此方面,本发明包括任何适宜的选择融合转录本的靶向机制,该融合转录本使用构成并邻近剪接基因的连接点的核苷酸。本领域已知的各种类型的探针和标记方法均考虑用于制备转录探针。这些类型和方法已就基因组序列的检测描述于上文。本发明的转录探针长度优选至少约15nt,更优选至少约20nt,还更优选至少约30nt,再更优选至少约40nt,至少约50nt,至少约75nt或者至少约150nt。“长度至少20nt"的探针,例如,将包括与本发明mtDNA序列互补的的20个或者更多个连续碱基。当然,可优选更大的探针(例如,50,150,500,600,2000个核苷酸)。在一个方面,本发明提供了用于检测癌症的杂交探针,其中该探针与上文提供的线粒体融合转录本的至少一部分互补。在另一方面,本发明提供了探针以及此探针在检测结直肠癌,肺癌,乳腺癌,卵巢癌,睾丸癌,前列腺癌或黑素瘤皮肤癌中的用途。分析法测定生物样品中线粒体融合转录本水平可以确定在受试者中一种或多种癌症的存在。因此,本发明提供了用于预测、诊断或监测癌症的方法,该方法包括获得一种或多种生物样品,从该样品中提取线粒体RNA,以及通过下列方式分析该样品中的融合转录本对样品中的一种或多种融合转录本进行定量,再将检测的量与参比值进行比较。本领域技术人员理解,该参比值是基于该方法是否旨在预测、诊断或监测癌症。因此,该参比值可以与从一种或多种已知的非癌性生物样品、一种或多种已知的癌性生物样品、和/或一种或多种过去获取的生物样品中收集的转录本数据关联。在一个方面,本发明提供了检测哺乳动物癌症的方法,该方法包括通过使所述样品与至少一种杂交探针杂交来分析来自所述哺乳动物的组织样品中至少一种本发明融合转录本的存在,所述杂交探针具有与线粒体融合转录本的至少一部分互补的核酸序列。在另一方面,本发明提供了上文所述方法,其中该分析法包括a)使用至少一种上述探针进行杂交反应,使该至少一种探针与互补的线粒体融合转录本杂交;b)通过对与该至少一种探针杂交的转录本定量,来定量样品中的至少一种线粒体融合转录本;和c)将样品中的线粒体融合转录本的量与至少一种已知参比值进行比较。如上文讨论的,本发明的诊断分析还包括如本文所述的诊断显像方法,并且可以容易地适用于高通量法。因此,本发明考虑本发明的融合转录本及相关探针在高通量筛选法或分析法中检测和/或定量多个测试样品中的靶核苷酸序列的用途。翻译产物迄今为止,线粒体融合蛋白尚未被检测或分离。然而,下文提供的实施例中观察到的线粒体融合转录本的水平以及它们是聚腺苷酸化的证据进一步提供了支持此类线粒体融合蛋白存在的证据。因此,本发明提供了用于预测、诊断和/或监测癌症的融合蛋白的鉴定。考虑用于本发明方法的融合蛋白可通过从天然多肽的分离获得或者通过基因表达获得。此类多肽可以通过本领域已知的方法制备,例如从细胞提取物中纯化或者使用重组技术。与转录本1-17和20相应的推测蛋白序列连同它们各自的序列标识提供下于文。 这些以及公开于表1中的与缺失序列相应的推测蛋白序列在本文考虑用于本发明方法。SEQIDNO:36(转录本1)
SEQIDNO:37(转录本2)
SEQIDNO:38(转录本3)
SEQIDNO:39(转录本4)
SEQIDNO:40(转录本5)
SEQIDNO:41(转录本6)
SEQIDNO:42(转录本7)
SEQIDNO:43(转录本8)
SEQIDNO:44(转录本9)
SEQIDNO:45(转录本10)
SEQIDNO:46(转录本11)
SEQIDNO:47(转录本1
SEQIDNO:48(转录本14)
SEQIDNO:49(转录本15)
SEQIDNO:50(转录本16)
SEQIDNO:51(转录本17)
SEQIDNO:52(转录本20)
SEQIDNO:55(转录本1 融合蛋白的检测本发明的融合蛋白可以从生物样品中通过公知方法来回收和纯化,所述方法包括硫酸铵或乙醇沉淀法、酸提取法、阴离子或阳离子交换色谱法、磷酸纤维素色谱法、疏水相互作用色谱法、亲合色谱法、羟基磷灰石色谱法、疏水荷电相互作用色谱法和凝集素色谱法。最优选高效液相色谱法(“HPLC “)用于纯化。分析生物样品中的融合蛋白水平可以使用诸多技术来进行。例如,组织中的蛋白质表达可以用经典免疫组织学方法来研究(Jalkanen等人,J. Cell. Biol. 101 976-985(1985) Jalkanen,Μ.,等人,J. Cell. Biol. 105 :3087-3096 (1987))。用于检测蛋白质表达的其它方法包括免疫分析法,例如酶联免疫吸附法(ELISA)和放射免疾分析法 (RIA)。适宜的抗体分析标记是本领域已知的并且包括酶标记(例如葡萄糖氧化酶)以及放射性同位素例如碘(<125>1、<121>1)、碳(<14>C)、硫(<35>S)、氚(<3>H)、铟(<112>In) 和锝(<99m>Tc),以及荧光标记例如荧光素和若丹明,以及生物素。本发明的多肽还可通过本领域已知的重组技术来制备。通常地,它包括用包含目的编码多核苷酸的蛋白质或多肽的表达载体转化(包括转染、转导或感染)适宜的宿主细胞。Si^用于本发明分析方法的蛋白质特异性抗体可以针对本发明的野生型或表达的线粒体融合蛋白或者其抗原多肽片段产生,其可以与载体蛋白例如白蛋白一起提供给动物系统(例如兔或小鼠),或者如果其长度足够(至少约25个氨基酸)可以没有载体。如本文使用的,术语“抗体”(Ab)或“单克隆抗体”(Mab)表示包括完整的分子以及抗体片段,或者其抗原结合片段(例如,Fab和F(ab' ) 2片段),其能够特异地结合到线粒体融合蛋白,或者对线粒体融合蛋白具有“特异性”。Fab和F(ab' ) 2片段缺少完整抗体的Fc片段,更容易从循环中清除,并且可具有较低的完整抗体的非特异性组织结合(Wahl 等人,J. Nucl. Med. 24 :316-325 (1983))。因此,这些片段是优选的。本发明的抗体可通过众多方法的任一种来制备。例如,表达线粒体融合蛋白或其抗原片段的细胞可以被施用于动物以便诱导产生含有多克隆抗体的血清。在一个方法中, 制备和纯化线粒体融合蛋白的制品,使其基本上不含有天然污染物。然后将此制品引入动物中以便产生更高特异活性的多克隆抗血清。在一个相关的方法中,本发明的抗体是单克隆抗体。此类单克隆抗体可以使用杂交瘤技术来制备(Kohler 等人,Nature 256 :495(1975) ;Kohler 等人,Eur. J. Immunol. 6 511(1976) ;Kohler 等人,Eur. J. Immunol. 6 :292(1976) ;Hammerling 等人,于=Monoclonal Antibodies and T-Cell Hybridomas, Elsevier, N. Y. , (1981) pp. 563-681)。通常,这些操作法包括用线粒体融合蛋白抗原或者用表达线粒体融合蛋白的细胞对动物(优选小鼠)免疫。本发明包括免疫分析法,该方法使用对本文所述融合蛋白具有特异性的抗体或抗原结合片段。此类免疫分析法可以借助于试剂盒,该试剂盒包括抗体或抗原结合片段以及任何其它必需的试剂、试片、材料和说明书等等。分析法测定生物样品中翻译产物例如融合蛋白水平可以确定受试者中一种或多种癌症的存在。因此,本发明提供了用于预测、诊断或监测癌症的方法,该方法包括获得一个或多个生物样品,从该样品中提取线粒体融合蛋白,以及通过下列方式分析该样品的此分子对样品中的一种或多种分子进行定量,再将检测的量与参比值进行比较。本领域技术人员理解,该参比值是基于该方法是否旨在预测、诊断或监测癌症。因此,该参比值可以与从一种或多种已知的非癌性生物样品、一种或多种已知的癌性生物样品、和/或一种或多种过去获取的生物样品中收集的蛋白质数据关联。对样品中的蛋白质定量的技术是本领域已知的,并且包括,例如,经典的免疫组织学方法(Jalkanen 等人,J. Cell. Biol. 101 :976-985(1985) Jalkanen, Μ.,等人,J. Cell. Biol. 105 :3087-3096(1987))。用于检测蛋白质表达的其它方法包括免疫分析法,例如放射免疫分析法(RIA)和酶联免疫吸附法(ELISA)。
在一个方面,本发明提供了检测哺乳动物癌症的方法,该方法包括分析哺乳动物的组织样品中至少一种线粒体融合蛋白的存在。在另一方面,本发明提供了结直肠癌,肺癌,乳腺癌,卵巢癌,睾丸癌,前列腺癌和/或黑素瘤皮肤癌的诊断中线粒体融合蛋白的检测。诊断成像诊断设备本发明包括用于诊断特定疾病或鉴定特定突变的诊断设备,如生物芯片、基因芯片或微阵列。对所有测序的线粒体基因组进行评估从而得到碱基对排列的共有结构,并对与特定疾病或病症相关的碱基对缺失和突变的比例赋予禁止指数(prohibiting index) 0 其后所述诊断性排列用于制造生物芯片、基因芯片或微阵列。一旦鉴定出与特定疾病、疾病状态或病症有关的序列,可使用将线粒体核苷酸样品与寡核苷酸阵列进行杂交从而鉴定特定的突变。可以使用任何已知的杂交方法。优选地, 使用具有与野生型或突变区匹配的寡核苷酸探针以及对照探针的阵列。市售的阵列如微阵列或基因芯片是适合的。这些阵列在载片或微芯片上含有数千匹配的以及对照探针对,并能够非常迅速地进行全基因组测序。描述微阵列在基因组和DNA序列分析中的应用的综述文献可在线获得。微阵列多核苷酸阵列提供了能在包含一种或多种靶核酸序列的样品中测定大量多核苷酸的高通量技术。本发明的阵列可用于基因表达分析、疾病诊断和疾病预后(例如,监测患者对治疗的反应等)。指示疾病或疾病进展的mtDNA多核苷酸序列的任何组合均可用于构建微阵列。使用微阵列进行分析的靶核酸样品来自如上述包含足量mtDNA的任何人组织或体液。在足以产生互补核酸成员/靶标复合体的杂交模式的杂交条件下使靶核酸样品接触多核苷酸成员。微阵列的构建所述微阵列包含附着在固体支持物一个表面的许多独有多核苷酸,其中每种多核苷酸附着在所述固体支持物表面上不相同的预选区中。阵列上每种相关样品包含身份已知 (通常序列已知)的多核苷酸组合物,这在下面有更详细的描述。任何可能的基质都可以应用在本发明中。使用任何已知的方法构建所述阵列。可以使用已建立的技术生产所述核酸成员, 如聚合酶链式反应(PCR)和逆转录(RT)。这些方法与本领域目前已知的方法类似(参阅如,PCR Strategies, Michael A. Innis (编者),等人(1995),以及 PCR introduction to Biotechniques Series, C. R. Newton, A. Graham(1997))。经扩增的多核苷酸通过本领域熟知的方法纯化(例如柱纯化)。当多核苷酸已被分离从而基本上不含引物以及所需多核苷酸的合成期间产生的不完整产物时,则认为多核苷酸是纯的。优选地,纯化的多核苷酸还将基本上不含可能阻碍或以其他方式掩盖所述分子的结合活性的污染物。在本发明的阵列中,所述多核苷酸组合物与固体支持物的表面稳定结合,其中该支持物可以是柔性或刚性固体支持物。本发明中可以使用核酸成员可附着于其上的任何固体支持物。适宜的固体支持物材料的实例包括但不限于硅酸盐如玻璃和硅胶、纤维素和硝酸纤维素纸、尼龙、聚苯乙烯、 聚甲基丙烯酸酯、胶乳、橡胶和碳氟树脂如TEFLON 。可以使用各种形状的固体支持物材料,包括但不限于载片和珠。载片提供了一些功能上的优势,因此是优选的固体支持物形式。由于其表面扁平,因此使用玻璃载片将探针和杂交试剂减至最少。载片还使得试剂能靶向应用,易于保持恒定的温度,易于清洗并且便于直接观察固定在固体支持物上的RNA和/或DNA。使用载片还便于去除固定在固体支持物上的RNA和/或DNA。选择作为固体支持物的具体材料对于本发明不是关键的,只要其提供所述功能。 通常实施或使用本发明的人会基于成本节约和可获得性、最终产品的预期应用需求以及整个制造过程的需要而选择最佳的市售材料。使用许多方法用于将本发明的核酸成员附着在基质上(称作点样的过程)。例如, 使用如美国专利No. 5,807,522中的技术附着多核苷酸,其为教导聚合物附着方法而通过引用并入本文。或者使用接触压印技术进行点样。每个组合物中存在的多核苷酸量将足以在使用该阵列的测定中提供充分的靶多核苷酸序列的杂交和检测。通常,与阵列的固体支持物稳定结合的每一核酸成员量为至少约0. lng,优选至少约0. 5ng并且更优选至少约lng,其中所述量可以高至IOOOng或更高, 但是通常不超过约20ng。可以将对照多核苷酸点样在该阵列上,并用作靶标表达对照多核苷酸和错配对照核苷酸,从而监测与所述样品中除靶标外(探针所指向的靶标)的多核苷酸进行的非特异性结合或交叉杂交。因此,错配的探针指示杂交是否特异。例如,如果存在靶标,则完全匹配的探针应该始终比错配的探针更亮。另外,如果存在所有主要错配,则使用错配探针检测突变。制备靶标所述微阵列的靶标可以来源于一种或多种生物样品。可能希望在杂交之前对靶核酸样品进行扩增。本领域的技术人员会了解,无论使用何种扩增方法,如果需要定量结果的话,则必需注意使用维持或控制所述扩增多核苷酸的相对频率的方法。“定量” 扩增的方法对于本领域技术人员是熟知的。例如,定量PCR包括使用相同的引物同时共同扩增已知量的对照序列。这提供了可以用于校准该PCR反应的内标。然后高密度阵列可以包括内标特异性探针,以定量所扩增的多核苷酸。PCR Protocols, A Guide to Methods and Applications, Innis ^X, Academic Press, Inc. N. Y. , (1990)巾IK共了定量PCR的详细方案。其它适当的扩增方法包括但不限于聚合酶链式反应(PCR) (Irmis, 等人,PCR Protocols. A guide to Methods and Application. Academic Press, Inc. San Diego, (1990))、连接酶链式反应(LCR)(参见 Wu and Wallace, Genomics, 4 560 (1989), Landegren,等人,Science, 241 :1077(1988)以及 Barringer,等人,Gene,89 :117 (1990)、 转录扩增(Kwoh,等人,Proc. Natl. Acad. Sci. USA,86 :1173(1989))以及自主序列复制 (Guatelli,等人,Proc. Nat. Acad. Sci. USA, 87 :1874 (1990))。本发明提供了上文所述标记的靶标或标记的探针。对于微阵列,任何附着于或掺入于分子中的可分析检测的标记均可用于本发明。可分析检测的标记指任何被分析检测和定量的分子、部分或原子。适用于本发明的检测标记包括任何可通过光谱、光化学、生物化学、免疫化学、电、光学或化学方法检测的组合物。可用于本发明的标记包括用标记的链霉抗生物素蛋白缀合物染色的生物素、磁珠(例如,Dynabeads )、荧光染料(例如,荧光素、 得克萨斯红、罗丹明、绿色荧光蛋白等)、放射性标记(例如,3H,1251,35S,14C或32P)、酶 (如辣根过氧化物酶、碱性磷酸酶及其它普遍用于ELISA的酶)和比色标记如胶体金或有色玻璃或塑料(例如聚苯乙烯、聚丙烯、胶乳等)珠。教导该标记用途的专利包括美国专利 No. 3,817,837 ;3,850,752 ;3,939,350 ;3,996,345 ;4,277,437 ;4,275,149 和 4,366,241。检测这些标记的方法对于本领域的技术人员是熟知的。因此,例如,可以使用胶片或闪烁计数器检测放射性标记,可使用检测发射光的光检测器检测荧光标记。酶标记通常通过为酶提供底物并检测该酶对底物的作用所产生的反应产物来检测,而比色标记通过简单地观察有色标记进行检测。可以通过本领域技术人员所熟知的许多方法掺入所述标记。然而,在一个优选的实施方案中,所述标记在制备样品多核苷酸的扩增步骤中同时掺入。因此,例如,带有标记引物或标记核苷酸的聚合酶链式反应(PCR)将提供标记的扩增产物。在一个优选的实施方案中,如上述使用标记的核苷酸(如荧光素标记的UTP和/或CTP)的转录扩增将标记掺入转录的多核苷酸中。或者,可以将标记直接加入原始多核苷酸样品(例如,mRNA,聚腺苷酸化mRNA,cDNA等)或在扩增完成之后加入扩增产物。将标记附着在多核苷酸上的方法对于本领域的技术人员是熟知的,包括如切口平移或末端标记(例如使用标记的RNA),通过用激酶处理多核苷酸并随后附着(连接)连接多核苷酸样品与标记(例如,荧光团)的多核苷酸接头。在一个优选的实施方案中,所述靶标将包括一种或多种对照分子,其与微阵列上的对照探针杂交,从而将该微阵列得到的信号归一化。标记的归一化靶标是与如上述点样在所述微阵列上的对照寡核苷酸完全互补的多核苷酸序列。杂交后得自归一化对照的信号提供了对杂交条件、标记强度、“读数”效率及其可造成完全杂交的信号在阵列间变化的其他因素的变化的对照。图像采集和数据分析在杂交和任何洗涤步骤和/或常规的后续处理之后,检测得到的杂交模式。在杂交模式的检测或成像中,标记的强度或信号值将不仅被检测而且还被定量,这意味着将对来自每个杂交点的信号进行测量并与已知数目的末端标记靶多核苷酸所发射信号相应的单位值进行比较,从而获得杂交模式中与阵列上的特定点杂交的每种末端标记靶标的拷贝数的计数或绝对值。分析从阵列杂交收集的数据的方法在本领域是熟知的。例如,当杂交检测涉及荧光标记时,数据分析可包括如下步骤从收集的数据确定作为基质位置的函数的荧光强度, 除去异常值,即偏离预定统计分布的数据,以及从剩余的数据计算测试多核苷酸的相对结合亲和力。将得到的数据展示为图像,其中每个区域中的强度根据相关寡核苷酸和/或多核苷酸与测试多核苷酸之间的结合亲和力而发生变化。诊断测试检测或成像后,所述杂交模式用于确定与该阵列接触从而得到杂交模式的标记靶多核苷酸样品的遗传谱的定量信息,以及样品所源自的组织、体液、器官、细胞等的状态或情况。就此而言,本发明进一步提供了用于检测癌症的诊断测试。本发明还提供了针对患者状况进行检测。根据本发明的方法,癌症的存在是通过从患者获得生物样品来检测的。包含核酸的测试样品是从该生物样品制备的。从该样品中提取的核酸与包含固体基质和多个核酸成员的阵列杂交,其中每个核酸成员指示存在疾病或者有癌症倾向。根据此诊断测试, 包含核酸的样品与该阵列上的一个或多个核酸成员杂交指示着癌症或者有癌症倾向。诊断性监测本发明方法可进一步包括基于一种或多种分析法的结果来推荐监测状态或治疗进程的步骤。这让临床医生能够实施个体化给药;例如通过监测患者癌症进程(例如通过识别何时起始和或后续的突变发生)或者治疗进程(例如通过识别何时突变稳定)而治疗癌症。有了序列变化范围的知识,该信息可用于诊断癌前状况或者癌存在时的状况。此外,通过对随时间的连续样品中异常mtDNA的定量,可以监测癌症状况的进展。例如通过在某一时间点分析患者组织以检测第一组从野生型的突变而获得数据,该数据可以与后续分析所提供的数据进行比较,以确定在该异常中是否发生了变化。当在尚未发展成癌症症状的个体中发现突变时,该突变可能指示有发展为癌症状况的遗传易感性。其疾病易感性的确定或其存在的诊断可以进一步基于以下信息量化评价,该信息是关于患者家族史中癌症状况(如果有)的普遍性以及其它风险因子的存在 (例如暴露于环境因素)以及患者细胞是否还携带另一类突变。生物样品本发明提供了诊断测试法,其包括获得或采集一种或多种生物样品。在本发明的上下文中,“生物样品”是指含有细胞的组织或体液,从该细胞中可以获得mtDNA、mtRNA和翻译产物或者融合蛋白。例如,该生物样品可以得自包括但不限于下列的组织皮肤,肺,乳腺,前列腺,神经,肌肉,心脏,胃,结肠,直肠组织等;或者得自血液,唾液,脑脊液,痰液,尿液,粘液,滑液,腹腔液,羊水等。该生物样品可以得自癌性或非癌性组织,并且可以,但不限于外科手术样品或生物活检样品。该生物样品可以以从来源获得的那样直接使用或者预处理以改变样品性质后使用。因此,该生物样品在使用前进行预处理,预处理的方式例如是,从血液制备血浆或血清, 破坏细胞,从固体材料制备液体,稀释粘稠液体,过滤液体,蒸馏液体、浓缩液体,使干扰组分失活,添加试剂等。本领域技术人员将理解,可以单次分析一种以上的样品类型(即,对于检测一种以上的癌症)。此外,当需要一系列采集时例如对于癌症经时监测时,给定样品可以单独被诊断,或者整个试验期获得的其它样品一起被诊断。就此而言,生物样品可以仅一次获。 或者以规则间隔获。缌街芤淮、一月一次、半年一次或每年一次。试剂盒本发明提供了用于在临床环境下检测癌症的诊断/筛查试剂盒。此试剂盒可包括一个或多个取样工具,以及一种或多种本发明的探针。或者,或除此以外,该试剂盒可包括用于检测本发明翻译产物的工具。该试剂盒可任选包括进行诊断分析所需的试剂,例如缓冲剂、盐、检测试剂等。其它成分例如用于分离和/或处理生物样品的缓冲剂和溶液亦可包含在该试剂盒中。该试剂盒的一种或多种组分可以被冷冻干燥,并且该试剂盒可进一步包括适用于使该冷冻干燥组分复溶的试剂。如果适宜,则该试剂盒还可包含反应容器,混合容器以及其它有助于制备测试样品的组件。该试剂盒还任选可包括使用说明书,其可以纸质形式提供,或者以计算机可读形式例如磁盘、⑶、DVD等提供。在本发明的一个实施方案中,提供了用于诊断癌症的试剂盒,其包括取样工具以及本发明的杂交探针。在另一实施方案中,本发明的试剂盒可包括免疫分析。在此情况下,该试剂盒可包括对本文所述融合蛋白具有特异性的抗体或抗原结合片段。可以理解,此免疫分析所需的各种其它试剂、试片等将被包含在该试剂盒中,所需要的用户说明书也被包含在该试剂盒中。实施例本发明的多个方面将通过使用以下实施例来示意性描述。本文提供的实施例仅用于说明本发明某些具体的实施方案,而不是用于以任何方式限定本发明范围。实施例1 线粒体融合转录本的检测先前本申请人在PCT申请号PCT/CA2007/001711(公开号WO 2009/039601,其全部内容通过引用并入本文)中鉴定的线粒体4977 “共同缺失”和3. 41Λ缺失产生了独特的开放读码框,其具有前列腺组织中寡-dT筛选所鉴定的活性转录本(图2和幻。乳腺组织样品的检查亦揭示存在从3. 4kb缺失产生的稳定的聚腺苷酸化融合转录本(图4)。用于缺失转录本检测的逆转录酶-PCR方案RNA 分离 cDNA 合成总RNA是从快速冷冻的前列腺和乳腺组织样品(恶性和邻近于肿瘤的正常样品两者)分离的,其中使用 Aurum Total RNAi^atty 和 Fibrous Tissue 试剂盒(Bio-I ad, Hercules,CA)并遵照用户说明书。由于在此试验中应避免基因组DNA污染,所以包括DNase I处理步骤,其使用本领域公知的方法。用ND-1000分光光度计(NanoDrop technologies) 对RNA定量和定性。来自约IOOg的起始材料,总RNA浓度变化范围为lOO-lOOOng/ul, 260/280比率为1. 89-2. 10。将RNA浓度调节到lOOng/ul,将2ul的每个模板用于第一链 DNA合成,其中使用的superscript 第一链DNA合成系统(Invitrogen)并遵照用户说明书进行RT-PCR。为了鉴定稳定的聚腺苷酸化融合转录本,使用了靶向具有聚-A尾的转录本的寡聚(dT)引物。PCR每个cDNA模板使用5ul进行实时PCR,其中在DNA Engine 0pticon 2连续荧光检测系统(Bio-Rad, Hercules, CA)上使用 iQ SYBR Green Supermix(Bio-Rad, Hercules, CA)进行。靴向 4977bp 缺失的引物对为;8416F 5,-CCTTACACTATTCCTCATCAC-3,, 13637R 5,-TGACCTGTTAGGGTGAGAAG-3,,而靴向 3. 4kb 缺失的引物对为;ND4LF 5 ‘ -TCGCTCACACCTCATATCCTC-3 ‘,ND5R 5 ‘ -TGTGATTAGGAGTAGGGTTAGG-3 '。反应混合液包括2X SYBR Green Supermix(IOOmM KCL,40mM Tris-HCl, pH 8.4,0.4mM 的各种 dNTP[dATP,dCTP, dGTP 禾口 dTTP],iTaq DNA 聚合酶,50 单位 /ml,6mM MgCl2, SYBR Green 1,20nM荧光素,以及稳定剂),每种引物250nM,以及ddH20。PCR循环参数如下 (1) 95 V 2min, (2) 95 V 30sec, (3) 55 V (对于 4977bp 缺失)和 63 V (对于 3. 4kb 缺失)30sec,(4)72°C45sec, (5)读板,接着步骤3至5进行39个循环,最终在4°C下孵育。除了循环阈值以及熔解曲线分析以外,针对扩增产物的特异性显影使样品跑琼脂糖凝胶(参见图2至4)。图2是显示由线粒体基因组失去3. 4kb引起的前列腺样品中的聚腺苷酸化融合转录本的琼脂糖凝胶。图2的图例B-空白,泳道l-6cDNA中检测的转录本;泳道7-12泳道 1-6样品的无逆转录酶(RT)对照。图3显示了由失去49771Λ共同缺失引起的前列腺样品中的聚腺苷酸化融合转录本。图3的图例B-空白,泳道l-6cDNA中检测的转录本;泳道7_12泳道1_6样品的的无 RT对照。图4显示了由失去3. 41Λ mt基因组引起的乳腺样品中的聚腺苷酸化融合转录本。 图4的图例泳道2-8来自乳腺cDNA的转录本;泳道9阴性(水)对照;泳道10和11,阴性,无RT,泳道2和3样品的对照。这些结果证实了存在稳定的线粒体融合转录本。实施例2 融合产物的鉴定和靶向设计多种杂交探针以检测并进一步证实由突变的线粒体基因组得到的新转录本的存在,例如3. 41Λ缺失。为此目的,使用单重分支DNA平台(single-plex branched DNA platform)进行定量基因表达分析(QuantiGene 2. 0 ,Panomics )。本实施例中所列举的特异性缺失和序列基于它们与整个mtDNA基因组(其描述于SEQ ID NO :1)的相对位置。 针对四种转录本的核酸序列设计的本实施例探针在本文中标识如下转录本1 (SEQ ID NO 19),转录本 2 (SEQ ID NO 20),转录本 3 (SEQ ID NO 21)和转录本 4 (SEQ ID NO :22)。来自3. 4kb线粒体基因组缺失的连续转录本的实例在基因ND4L (NADH脱氢酶亚基 4L)和ND5(NADH脱氢酶亚基5)之间发生。具有对SEQ ID NO :20的互补序列的探针用于检测转录本2。重复元件出现位置为ND4L中的10745-10754以及ND5中的14124-14133。3. 4kb缺失导致去除ND4L的3,端、全部的ND4基因、tRNA组氨酸、tRNA丝氨酸2、 tRNA亮氨酸2以及ND5的5,端的大部分(参见图fe),造成ND4L和ND5的基因剪接,连接点为 10744 (ND4L) 14124 (ND5)(图 5b)。通过启动第一基因ND4L的原始起动密码子,翻译该氨基酸序列直到出现终止密码子。在此实施例中,该终止密码子是ND5的原始的终止密码子。因此,尽管将两个基因剪接在一起,该读码框保持完整,导致一种假设或预测的转录本,其长度为100个氨基酸(或者300bp)。此融合蛋白转录本产物在本文标识为SEQ ID N0:37。编码此蛋白质的核苷酸序歹丨J (SEQ ID NO 3)与线粒体基因组位置10470-10744 :14124-14148相对应。SEQ ID NO 3是与上文所述方式检测的RNA转录本(SEQ ID NO 20)互补的DNA序列。类似地,转录本1是AIPase 8和ND5之间对应位置8469 :13447的融合转录本(SEQ ID NO 19)。转录本 3 禾口 4 (分别为 SEQ ID NO 21 和 SEQ ID NO 22)是 COII 和 Cytb 之间分别对应核苷酸位置7974 15496和7992 :15730的融合转录本。表3提供了本实施例使用的各种序列之间关系的汇总。表3包括检测的融合转录本、与检测的融合转录本互补的 DNA序列以及针对每种转录本的推测翻译产物。实施例3 应用于前列腺癌使用4种融合转录本,即上文讨论的转录本1至4,分析来自一名患者的两个前
21列腺组织样品,以评价新预测的融合转录本的定量差异。试验结果提供于以下表2。其中“Homog 1,,是指来自患者的冷冻前列腺肿瘤的勻浆物,“Homog 2”是指与该患者肿瘤邻近的冷冻的正常前列腺组织的勻浆物。根据制造商方案(用于新鲜或冷冻的动物组织的 QuantiGene 样品样品处理试剂盒;以及QuantiGene 2. 0试剂系统用户手册)处理这些样品,以25. 8mg的Homog 1和28. 9mg的Homog 2开始(该分析方案显示于表fe和5b)。清楚证明的是,与正常邻近的前列腺组织相比,前列腺癌组织中线粒体融合转录本存在增加。该融合转录本存在于正常组织中,尽管水平很低。探针与靶转录本杂交产生的相对发光单位(RLU)直接与每种转录本的丰度成比率。表2还标明了以百分数表示的样品读数的变异系数CV。该CV由标准偏差除以该数值的均值得到。这些癌症组织中稳定转录的线粒体基因产物的显著性暗示了疾病演化和进展。实施例4 应用于乳腺癌使用与实施例3相同的方案,但是仅针对转录本2 (与3. 4kb mt基因组缺失相关的新融合转录本)在两个乳腺肿瘤组织样品上两个与这些肿瘤邻近无肿瘤组织的样品上, 以及三个前列腺肿瘤组织样品、一个包含邻近的无肿瘤组织的样品进行分析。本实施例的结果提供于表4。具有相应的正常组织部分的前列腺肿瘤组织样品证实与实施例3分析的前列腺样品有相似模式,即,该肿瘤组织比正常邻近的组织具有约2倍量的融合转录本。当与邻近非-肿瘤组织相比时,证实该乳腺肿瘤样品有显示增加的融合转录本水平。勻浆物的1 100稀释液用于本分析,因为它在实施例3的试验进行中最具重现性。因此,上文讨论的结果说明本发明转录本在前列腺和乳腺组织肿瘤检测中的应用。实施例5 应用于结盲肠癌本研究旨在测定本发明若干转录本在检测结直肠癌中的效力。制备了总计19个样品,它们包括9个对照(良性)组织样品(样品1至9)和10个肿瘤(恶性)组织样品 (样品10至19)。根据制造商建议(用于新鲜或冷冻的动物组织的QimntiGene 样品样品处理试剂盒;以及QuantiGene 2. O试剂系统用户手册)将该样品勻浆。以上文前面实施例所述方式制备7个靶转录本和一个看家基因转录本。该转录本的特征汇总如下表7 乳腺癌转录本的特征
权利要求
1.一种分离的线粒体融合蛋白,该蛋白质具有的氨基酸序列得自与线粒体DNA中的突变相应的线粒体融合转录本的翻译。
2.权利要求1的线粒体融合蛋白,其中所述融合蛋白具有SEQID NO =36-52,55,58, 61,64或67的任一个所述的氨基酸序列。
3.检测哺乳动物癌症的方法,该方法包括分析哺乳动物的组织样品中至少一种线粒体融合蛋白的存在,该蛋白质具有的氨基酸序列得自与线粒体DNA中的突变相应的线粒体融合转录本的翻译。
4.权利要求3的方法,其中所述癌症选自前列腺癌,睾丸癌,卵巢癌,乳腺癌,结直肠癌,肺癌和黑素瘤皮肤癌。
5.权利要求3的方法,其中所述融合蛋白具有SEQID NO :36-52,55,58,61,64或67的任一种所述的氨基酸序列。
6.对权利要求1或2的蛋白质具有特异性的抗体或其抗原结合片段。
7.权利要求6的抗体,其中所述抗体是多克隆的或单克隆的。
8.权利要求3的方法,其中所述分析包括免疫分析。
9.权利要求8的方法,其中所述分析是用权利要求7所述抗体或抗原结合片段进行的。
10.用于进行检测哺乳动物中癌症存在的分析法的试剂盒,所述试剂盒包括权利要求 6的抗体或抗原结合片段。
11.一种分离的线粒体融合转录本,其具有SEQ ID NO :56,59,62或65所述的核酸序列。
12.编码权利要求11的融合转录本的分离的mtDNA。
13.权利要求12的分离的mtDNA,其具有SEQID NO =57,60,63或66的任一个所述的序列。
14.一种杂交探针,其具有与权利要求9的线粒体融合转录本或者权利要求12或13的 mtDNA的至少一部分互补的核酸序列。
15.检测哺乳动物癌症的方法,该方法包括通过使哺乳动物的组织样品与至少一种杂交探针杂交来分析该样品中与癌症有关的至少一种线粒体融合转录本的存在,所述杂交探针具有与权利要求11的线粒体融合转录本的至少一部分互补的核酸序列。
16.权利要求15的方法,其中该癌症选自前列腺癌,睾丸癌,卵巢癌,乳腺癌,结直肠癌,肺癌和黑素瘤皮肤癌。
17.用于执行检测哺乳动物中癌症存在的分析法的试剂盒,所述试剂盒包括至少一种与权利要求11的融合转录本的至少一部分互补的杂交探针。
全文摘要
本发明提供了用于预测、诊断和/或监测癌症的新线粒体融合转录本、突变的亲本mtDNA分子以及得到的翻译产物(蛋白质)。还提供了与其互补的用于本发明方法的杂交探针。
文档编号G01N33/50GK102388140SQ201080014122
公开日2012年3月21日 申请日期2010年3月29日 优先权日2008年3月28日
发明者丹尼尔·克莱因, 凯丽·鲁滨逊, 加布里埃尔·达库波, 安德鲁·哈博特尔, 布赖恩·赖古伊, 珍妮弗·克里德, 瑞安·帕尔 申请人:米托米克斯公司