专利名称:利用克隆型谱监测健康和疾病状态的制作方法
技术领域:
本发明一般地涉及通过分子测量来监测个体的健康和疾病状况,更具体地涉及通过利用高通量DNA测序测量免疫系统分子谱(profile)来监测个体的健康和疾病状况。
背景技术:
适应性免疫系统,包括体液(或B细胞介导的)应答和细胞毒性(或T细胞介导的)应答,已经进化为可以攻击其各自靶标上的特异性分子特征。出现一次针对特异性靶标的应答就能给宿主提供“记忆”,使其能够在相同目标再次出现时产生更强的应答。任何蛋白质或多糖通常都可作为某些适应性免疫应答细胞亚群或其产物的靶标,这些适应性免疫应答细胞亚群或其产物能识别靶标上特异性分子特征或表位。由于自身免疫疾病涉及到适应性免疫系统的某些成分对自身靶标的识别,因此已检查了适应性免疫系统的各方面,来帮助此类疾病的诊断和预后。使用标准免疫学技术,通过寻找循环自身抗体,已对体液免疫系统进行了研究。已针对多种疾病鉴定了自身抗体,如抗核抗体、抗dsDNA抗体及类风湿因子。这些抗体可能本身不具有病理性,它们在体内识别的靶标也不一定与在体外检测的靶标相同;但是,它们的水平的检测有助于诊断,并且在一些情况下具有一定的预后和治疗意义。另一种研究自身免疫性疾病和淋巴疾病中的适应性免疫系统的方法是基于适应性免疫细胞多样性的分析。适应性免疫细胞的激活导致其克隆增殖。通常通过从血液RNA或DNA扩增编码抗原识别区的核酸序列的部分来获得这种克隆增殖的证据。例如,用于扩增具有T细胞受体β链(类似于抗体重链)的特定V区段的序列的PCR引物可以用于扩增连接到特定V区段的J区段或J和D区段。当存在多样化的细胞群时,本来应该扩增具有大小略微不同的扩增子分布的片段,但克隆增殖会导致特定大小的扩增子被富集,并因此在凝胶上显示为更强烈的条带。在被称为“谱型分析(spectratyping)”的技术中,每个V区段与J和D区段一起扩增,来评估这些扩增子中的任一种是否表现为克隆增殖。谱型分析方法的一个问题是许多不同的序列可能具有相同的长度而因此无法区分。因此,只有显著的克隆增殖才能通过谱型分析识别。需要改进自身免疫性疾病和自身免疫性疾病状态以及免疫系统在其中发挥核心作用的其他疾病的诊断和辅助预后的方法。尽管在免疫系统谱分析(profiling)中额外的特异性可能有利于更好地预测免疫系统对人类健康的影响,但是如果开发出方法,使得即使以前从未观察到那些特定序列也能鉴定出参与疾病过程的特定T细胞和B细胞,将具有更大的实用性。免疫系统的极大的多样性为其提供了可能有用的细胞的巨大储备,但同时也对尝试将这种组库(repertoire)用于预测性目的的研究人员提出了挑战。任意靶向于抗原的单一序列是可能参与给定个体的疾病过程和/或与之相关的广大序列中的一个。能确定给定个体的许多细胞中的哪些细胞参与疾病过程的方法将对人类健康具有很大价值。免疫细胞谱分析在癌症的诊断和治疗中也具有实用性。癌症的治疗经常涉及评估对治疗的响应以及监测疾病的复发。监测响应和癌症复发的最常用的方法是放射照相评估及血液生物标记。例如,在包括结肠癌在内的多种疾病中常用CT扫描来监测癌症的复发。同样,蛋白质生物标记,如PSA和CEA,是用于追踪前列腺癌和结肠癌的血液生物标记。特定基因组重排形成了另一种用于追踪癌细胞的引人注意的靶标。例如,在绝大多数慢性髓性白血病(CML)患者中存在的BCR-ABL易位已成为评估疾病状态的分析物。用PCR技术测定白血病细胞中的特异性易位及其顺从性允许产生高度特异性和灵敏性的检验,该检验现在常规用于监测CML患者。免疫细胞(或克隆型)谱分析可用于产生淋巴肿瘤的标记物。淋巴细胞谱系的癌症是一组多样化的临床疾。庑┘膊⊥ǔ7从骋炎┫赴南赴姆⒂锥。急性淋巴细胞性白血病(ALL)最常出现在未成熟的淋巴细胞中。另一方面,多发性骨髓瘤(MM)出现在已分化为产生抗体的浆细胞中。同样,不同类型的淋巴瘤通常反映了不同细胞发育阶段。这些疾病发生在不同的年龄群体中,具有不同的预后和死亡率,并可以采用不同的方案进行治疗。这些疾病通常采用化疗、放疗和/或骨髓移植进行治疗。随后根据具体临床情况通过不同的方法监测疾病的复发。这些方法包括使用标准血细胞计数及形态观察对血液和/或骨髓进行评估,使用细胞表面标记物的流式细胞术(FCM),蛋白质电泳,以及分子技术,如PCR和FISH。此外,通常利用如CT和PET扫描的放射照相研究来监测某些淋巴癌的复发。这些方法具有侵袭性(骨髓)、高费用及辐射风险,和/或缺乏灵敏性。在一部分淋巴肿瘤中,存在对癌细胞具有特异性的某些分子标记,可用PCR以灵敏方式检测。例如,BCR-ABL存在于一部分ALL患者中,并且可作为监测肿瘤复发的标记物。遗憾的是,大多数患者不存在这类可灵敏且特异地检测复发的标记物。FCM可用于检测最小残留疾病(MRD),其对预后用途是有用的。在这种使用多色流激活细胞分选(FACS)的技术中,可借助于癌细胞具有的特定细胞表面标记物来鉴定癌细胞。在专家操作下,该技术的灵敏度局限在< 10_4 (10,000个正常细胞中有I个癌细胞),并且在某一时间点出现的标记物稍后可能会消失。因此,FCM通常无法用于在血液样品中检测早期复发。PCR提供了一种用于检测特定序列的灵敏性方法,且已将其用于检测癌细胞的B细胞受体(BCR)或T细胞受体(TCR)的特定重排。此技术利用了在针对不同淋巴细胞产生独特序列的不完美重组事件后产生了淋巴细胞中的B细胞受体或T细胞受体这一事实。例如,TCR是由TCRa链和TCRii链组成的。TCRa是通过将多个不同V区中的一个连接到多个J区中的一个而重组生成的。同样,TCRii是通过先后产生一个V、D和J区段的重组而生成的。在这两种情况下,重组通常不是完美的,而且一些碱基可能被从种系区段序列中删除,并且可能添加其他碱基(称为N碱基和P碱基)。V区段和J区段之间的序列被称为NDN 区。于是这些序列可作为这些淋巴细胞及其子代的标签。由于这些重组事件也发生在最终变为恶性的细胞中,所以B细胞受体和T细胞受体的独特序列可作为检测癌细胞的标签。标签序列是患者特异性的,而且实际上由于克隆进化,同一患者的标签序列也可能发生变化。为了从患者的白血病细胞中确定T细胞受体或B细胞受体的序列,使用通常白血病克隆高度富集的诊断白血病样品。例如,从诊断样品中扩增T细胞受体DNA和/或B细胞受体DNA,并将产物在凝胶上电泳,该凝胶可基于大小分离DNA (有时称为“谱型分析”);或者备选地,可进行异源双链体分析。观察到的大小分布的很大程度的偏移表示单克隆增殖,随后可以通过对偏移的分离峰处的样品进行测序对其进行证实。如果没有这种随后的测序,往往很难确定这种偏移是具有单克隆起源还是多克隆起源,例如Van Dongen等人的美国专利公开 2006/0234234。一旦确定了序列标签,就可以利用使用Taqman探针的实时PCR来监测该序列的水平。NDN区的长度一般不足以包括PCR引物以及检测用寡核苷酸。因此,通常使用与V区和J区互补的PCR弓丨物以及包括白血病克隆的某些NDN碱基的Taqman探针。这些弓I物提供了一定的特异性,因为他们只扩增了整个组库中的一部分。Taqman探针的杂交提供了针对特定克隆型的特异性。因此该试验的灵敏度通常不像其中引物对(使用或不使用Taqman探针)提供特异性的典型PCR(例如,BCR-ABL)中那样好。已经表明,对于某些序列的灵敏度可以高达10_5,但由序列与NDN区的至少一部分互补的Taqman探针所提供的杂交特异性可能显著地变差。考虑到某些探针的低灵敏度,该试验可能对特定患者中的任何重排都无效。先前还提到了克隆进化问题,这进一步降低了检测低水平白血病的可能性。此外,该技术还要求产生患者特异性Taqman探针以及将用作标准的模板,因此比较繁琐。这些患者特异性标准需要在每次检测患者样品时使用。患者间灵敏度的不一致、繁琐性以及获得对试验的适当控制的辅助工作大大限制了该技术的应用。因此需要产生可用于监测淋巴肿瘤患者复发的标记物。在一些实施方案中,在此公开的本发明允许开发一组非常通用、灵敏且特异的标记物,以使用免疫细胞测序来管理淋巴癌患者。如果有用于评估个体克隆型谱的可用的试验,该试验比现有技术更灵敏且更全面,并且通常不需要制备个体化试剂就可应用,则对于许多领域来说将是有利的,尤其包括自身免疫性癌症和淋巴癌领域。
发明内容
本发明涉及使用基于序列的免疫组库谱或克隆型谱来检测并监测疾病或非疾病状况的方法。本发明在许多实施方案和应用中得到例证,其中一些总结如下并贯穿于整个说明书中。一方面,本发明涉及一种监测疾病的方法,该方法包括以下步骤:(a)通过从疾病相关组织中的淋巴细胞样品确定克隆型谱来鉴定一种或多种与疾病相关的患者特异性克隆型,该样品包含来自于疾病相关组织的克隆型的组库;(b)从外周血细胞样品确定克隆型谱以确定一种或多种与疾病相关的患者特异性克隆型的存在、不存在和/或水平,该外周血样品包含克隆型的组库;以及(C)重复步骤(b)以监测患者的疾病或病状。在一个实施方案中,鉴定步骤进一步包括从同一患者的非疾病相关组织的淋巴细胞样品确定克隆型谱,并比较该克隆型谱与来自所述疾病相关组织的克隆型谱,以鉴定所述一种或多种患者特异性克隆型。可监测的疾病包括但不限于淋巴增生性疾病、实体瘤、感染性疾病以及自身免疫性疾病。组库的大小可取决于具体应用而变化很大;但在一个实施方案中,组库有99 %的可能性包括以0.01 %或更闻的频率存在的来自个体的样品中的每一种克隆型。在其他实施方案中,组库有99%的可能性包括以0.001%或更高的频率存在的来自个体的样品中的每一种克隆型,另一方面,本发明涉及一种监测患者中的疾病的方法,该方法包括以下步骤:(a)确定来自患有疾病的个体的淋巴细胞样品的克隆型谱,以及来自同一个体的、基于与疾病相关的细胞表面标记而富集的淋巴细胞样品的克隆型谱,从而鉴定一种或多种与该疾病相关的患者特异性克隆型,其中每个样品包含富集的或非富集的淋巴细胞群的克隆型的组库;(b)确定来自外周血细胞样品的克隆型谱中一种或多种患者特异性克隆型中的每一种的水平,该样品具有确定的体积且包含其克隆型的组库;以及(C)重复步骤(b)以监测该患者的疾病或病状。在上述方法的进一步的实施方案中,从外周血细胞样品中确定组库的相应步骤进一步包括包含任何以前未记录的克隆型作为一种或多种患者特异性克隆性,该以前未记录的克隆型是该一种或多种患者特异性克隆型的系统发生克隆型。只要疾病是淋巴增生性疾。庑┦凳┓桨傅囊恢只蚨嘀只颊咛匾煨钥寺⌒涂山徊桨ǘ钔獾陌┲⑾喙赝槐浜突蛑嘏牛钊缤ü痉⒚鞯姆椒ㄈ菀椎丶ǖ腣区替换(下文将更充分地描述)。在另一方面,本发明进一步提供了一种同时测定样品中的淋巴细胞数量和克隆型表达水平的方法,该方法包括以下步骤:(i)从个体中获得包含T细胞和/或B细胞的样品;( )对源自所述细胞的基因组DNA的空间分离的个体分子进行测序,这些空间分离的个体分子包含与样品中的许多淋巴细胞相对应的许多克隆型;(iii)对源自所述细胞的RNA的空间分离的个体分子进行测序,这些空间分离的个体分子包含与它们在样品的淋巴细胞中的表达水平相对应的许多克隆 型;以及(iv)对于每种克隆型,通过比较从源自所述细胞的基因组DNA的分离的个体分子确定的数量和从源自所述细胞的RNA的分离的个体分子确定的数量,来确定该样品的淋巴细胞中的克隆型表达水平。除其他优势外,本发明通过提供基于序列的、以更高灵敏度测定与疾病或健康状况相关的克隆型的方法,克服了现有技术中的一些缺陷。本发明进一步提供了此类可应用于任何患者而无需制备个体化的或患者特异性的试剂的通用型试验。这些进步在自身免疫性和淋巴癌领域中具有特别有用的应用。在后一领域中,本发明还提供了试验和监测方法,这些试验和监测方法不仅能检测和追踪极低水平的疾病相关克隆型,还能检测和追踪经过修饰从而将会逃过现有方法的检测的此类克隆型。后一特征极具价值,例如,在监测淋巴癌中的最小残留疾病中。以上表述的本发明的这些方面以及其他方面,在所说明的许多实施方案和应用中得到例证,其中一些在附图中示出,并在随后的权利要求书部分进行描述。然而上述概述并非旨在描述所说明的本发明的每个实施方案或每个实施方式。
本发明的新颖特征在随附的权利要求中具体阐述。通过参考以下对在其中利用到本发明原理的示例说明性实施方案加以阐述的详细描述和附图,获得对本发明的特征及优点的更好的理解,在附图中:图1A是本发明的一种用于确定克隆型谱的方法的一个实施方案的流程图。图1B图示了发生在由B细胞产生的免疫球蛋白中的体细胞突变的相对分布。图2A-2B示出了用于扩增TCR^基因的两阶段PCR方案。图3A图示了使用图2A-2B的方案扩增的PCR产物,该PCR产物将要进行二次PCR,以添加用于基于Solexa的测序的桥接扩增和测序引物结合位点。图3B图示了确定图3A的PCR产物的核苷酸序列的一个实施方案的细节。图3C图示了确定图3A的PCR产物的核苷酸序列的另一实施方案的细节。图4A图示了在一个反应中从一条IgH链产生三个测序模板的PCR方案。图4B-4C图示了在三个独立反应中从一条IgH链产生三个测序模板的PCR方案,之后将产生的扩增子组合在一起进行二次PCR以插入P5和P7引物结合位点。图4D图示了针对IgH链产生的序列阅读的位置。图4E图示了使用V区和J区的密码子结构来改善NDN区中的碱基判定。图5示出了证实本发明的多重PCR的再现性的数据。图6示出了证明本发明的多重PCR引入最小扩增偏差(bias)的数据。图7A示出了使用Accuprime和对应于500ng RNA的cDNA作为输入模板,两个重复样品中每种克隆型的频率的1glO值。图7B描述了使用对应于500ng RNA的cDNA作为输入模板以及Accuprime (X轴)或高保真度Taq (Y轴),每种克隆型的频率的1glO值。图7C示出了使用对应于50ng RNA的cDNA作为输入模板以及Accuprime (X轴)或高保真度Taq (Y轴),每种克隆型的频率的1glO值。图8示出了来自样品的TCRP分子的数量。图8A和8B示出了从基因组DNA扩增IgH的数据。图9示出了表明根据本发明的多重扩增具有最小扩增偏差的数据。图10示出了对比两个个体的克隆型的数据。发明详沭本发明的一个方面利用新一代测序技术评估淋巴细胞群中TCR或BCR重排的水平。这些测序技术能够以合理的成本从样品中获得100万或更多的阅读。使用这些技术以特定的方式仍可检测到以1/1,000,000或更低频率存在的克隆型。从血液或骨髓DNA样品可以完成多重扩增,以扩增基因或转录本的特定部分的所有不同类型序列。例如,为了扩增IgH序列,与所有已知V区段及等位基因互补的数种引物可以和与所有J区段及等位基因互补的数种引物一同使用。图1A图示了这样一种方法的步骤,该方法用于采用一类DNA测序仪(例如Solexa合成测序法,如下所述)对样品的克隆型进行谱分析的实施方案。获得含有B细胞或T细胞的样品(100),之后提取DNA或RNA,并在反应中进行扩增(102),该反应优先扩增克隆型并为后续扩增和测序而连接末端序列。被扩增的克隆型的个体分子随机分布在固体表面(104),如玻璃表面上,该固体表面已配置为允许在原位进行第二次扩增以产生各个体分子的克隆群(或聚合酶克隆(polonies)) (106)。随后,例如,使用合成测序技术对各聚合酶克隆分子进行测序(108),之后将序列的类型和丰度制成表格以形成克隆型谱(110),或相应的组库谱。可在不同序列之间几乎没有扩增偏差地执行该方法。可以扩增来自TCRii和IgH基因的RNA,在不同V引物的效率方面仅有很小的差异,从而验证了对DNA进行相同操作的可能性。该方案可以改善用于检测低水平TCR和/或BCR重排的实时读出的问题。通过计数统计学(即,通过增加细胞和测序样品大小来增强灵敏度)以及等效扩增(即,具有不同序列的克隆型可在多重扩增反应如PCR中进行无显著偏差的扩增,如下文中所述)来确定灵敏度。由于灵敏度最终受计数统计学的限制,所以为了获得更高的灵敏度,可获得更多的细胞(即更大的样品)以及更多的测序阅读。当有足够的测序阅读时,灵敏度受样品中淋巴细胞数量的限制。相比之下,实时PCR测定的灵敏度受背景的限制。此夕卜,可以通过对诊断用白血病样品或淋巴瘤样品进行测序来确定患者特异性克隆。一旦确定了克隆型,就可在后续时间点确定其在样品中的水平。在一些优选的实施方案中,不需要患者特异性探针或引物,或不需要利用患者特异性模板作为标准。而是在患者特异性克隆之后,为每个患者存储关于相关序列的数据,且同样的试验适用于所有患者。一般来说,本发明的一些实施方案包括将核酸测序技术应用于监测适应性免疫细胞的组库从而对免疫系统进行谱分析的任务的方法。生成的免疫系统谱可用于疾病和病症的诊断,以及用于疾病和病症状态的诊断。本发明的免疫谱分析方法可用于监测疾病和病症以及评估对疾病和病症的治疗。适用于本发明的方法的疾病和病症包括自身免疫性疾。ㄏ低承院彀呃谴(SLE)、多发性硬化症(MS)、类风湿关节炎(RA)和强直性脊柱炎(AS)。本发明的方法可用于移植排斥及免疫老化的诊断、监测和治疗。此外,本发明的免疫谱分析方法可用于诊断、监测和治疗与免疫系统相关的其他疾。ò┲⒑痛静。对个体扩增分子进行测序可以区分不同序列,并因此具有检测克隆增殖中的定量变化的灵敏性。一般来说,在本发明的一个实施方案中,提供了一种用于确定T细胞和/或B细胞中的重组DNA序列谱的方法。该方法可包括以下步骤,包括从受试者中分离样品、一轮或多轮核酸扩增、空间分离个体核酸以及对核酸进行测序。所述核酸可以是DNA或RNA。T细胞和/或B细胞中的重组DNA序列可称为克隆型。—方面,提供了一种用于确定受试者或个体中的一种或多种相关克隆型的方法。另一方面,提供了一种用于开发可预测来自患病受试者的任意样品中的一种或多种相关克隆型的算法的方法。另一方面,提供了一种使用可预测来自受试者的任意样品中的一种或多种相关克隆型的算法来发现个体的一种或多种相关克隆型的方法。另一方面,提供了一种用于产生计算疾病活动性评分的算法的方法。另一方面,提供了一种用于监测个体的疾病状态的方法。T细胞和B细胞组库的谱分析对于具有炎症性方面的疾病是有价值的。这种炎症通常是由自身免疫和/或超敏反应引起的。这些疾病包括心血管疾病、阿尔茨海默病和先兆子痫。炎症还与包括肥胖症和糖尿病在内的异常代谢状态相关。还存在其他炎症相关性疾病。在本发明的一个方面中,利用多个正向引物或多个反向引物,通过PCR扩增重组B细胞核酸的区段,以产生一组嵌套模板(参见图4A和图4B及其以下说明)。来自该组的模板可在表面上进一步扩增以形成独立的扩增子(例如通过使用cBot仪器(Illumina,San Diego, CA)的桥接PCR)。来自同一嵌套组的模板可通过在它们的共同末端产生的序列阅读彼此相互关联。嵌套组模板允许将错误率相对较高的测序化学用于分析比其他方式所允许的更长的序列,而同时在整个序列长度上保持高平均质量评分。即使V区经历体细胞超突变,嵌套组也能确保从V区获得至少一次序列阅读。在一个实施方案中,测序化学可用于分析高度可变的核酸,诸如IgH分子,其错误率不好于以下数据:0.2%的序列阅读在位置1-50含有至少一个错误;0.2-1.0 %的序列阅读在位置51-75含有至少一个错误;0.5-1.5%的序列阅读在位置76-100含有至少一个错误;1_5%的序列阅读在位置101-125含有至少一个错误。在另一个实施方案中,对测序引物结合位点进行定位,以便在延伸时它们生成一系列序列阅读,其中除了最后一个以外,每个序列阅读与其紧邻的下游引物结合位点和/或序列阅读重叠,从与使用单个长模板产生单个长序列阅读相比,提供更高质量评分的连续序列覆盖。1、本发明的进一步的方面及实施方案本发明的其他方面及实施方案包括以下各项:提供了一种用于确定T细胞和/或B细胞中的重组DNA序列谱的方法,该方法包括:从受试者获得含有T细胞和/或B细胞的样品,空间分离来自所述细胞的基因组DNA的个体分子,对所述空间分离的基因组DNA的个体分子进行测序,以及确定来自所述样品的不同序列的水平从而产生所述重组DNA序列谱。提供了一种用于确定T细胞和/或B细胞中的重组DNA序列谱的方法,该方法包括:从受试者获得含有T细胞和/或B细胞的样品,空间分离来自所述细胞的基因组DNA的个体分子,扩增所述基因组DNA的个体分子,对所述扩增的DNA进行测序,以及确定来自所述样品的不同序列的水平从而产生所述重组DNA序列谱。提供了一种用于确定T细胞和/或B细胞中的重组DNA序列谱的方法,该方法包括:从受试者获得含有T细胞和/或B细胞的样品,扩增来自所述细胞的基因组DNA,空间分离所述扩增的DNA的个体分子,对扩增的DNA的所述空间分离的个体分子进行测序,以及确定来自所述样品的不同序列的水平从而产生所述重组DNA序列谱。提供了一种用于确定T细胞和/或B细胞中的重组DNA序列谱的方法,该方法包括:从受试者获得含有T细胞和/或B细胞的样品,扩增来自所述细胞的基因组DNA,空间分离所述扩增的DNA的个体分子,再扩增所述扩增的DNA分子,对所述再扩增的DNA分子进行测序,以及确定来自所述样品的不同序列的水平从而产生所述重组DNA序列谱。提供了一种用于确定T细胞和/或B细胞中重组的DNA序列谱的方法,该方法包括:从受试者获得含有T细胞和/或B细胞的样品,将来自所述细胞的RNA逆转录为cDNA,空间分离所述cDNA的个体分子,任选地再扩增所述空间分离的cDNA的个体分子,对所述cDNA和/或再扩增的cDNA进行测序,以及确定来自所述样品的不同序列的水平从而产生所述重组DNA序列谱。提供了一种用于确定T细胞和/或B细胞中的重组DNA序列谱的方法,该方法包括:从受试者获得含有T细胞和/或B细胞的样品;空间分离所述样品中的个体细胞;对来自所述细胞的个体核酸分子进行测序;以及确定来自所述样品的不同序列的水平从而产生所述重组DNA序列谱。在一个实施方案中,所述扩增和/或再扩增包含PCR、多重PCR、TMA, NASBA或LAMP。在另一实施方案中,所述空间分离包括在固相支持体上以两个维度分离所述DNA或cDNA,在含有微团的溶液中以三个维度分离所述DNA或cDNA,或使用微反应室分离分子。在另一实施方案中,所述扩增和/或再扩增是通过含有亚克隆的DNA或cDNA的细菌的生长、DNA或cDNA在玻片上的扩增或DNA或cDNA在微珠上的扩增而实现的。在另一实施方案中,所述测序包括双脱氧测序。在另一实施方案中,所述测序包括利用可逆末端标记的核苷酸进行的合成测序。在另一实施方案中,所述测序包括对核苷酸掺入时的焦磷酸释放的检测。在另一实施方案中,所述测序包括与标记的寡核苷酸探针库的等位基因特异性杂交。在另一实施方案中,所述测序包括利用与标记的寡核苷酸探针库的等位基因特异性杂交及随后连接所述探针的合成测序。在另一实施方案中,所述测序包括实时监测聚合步骤中标记的核苷酸的掺入。在另一实施方案中,所述重组DNA序列包含T细胞受体基因和/或免疫球蛋白基因。在另一实施方案中,所述测序包括对免疫球蛋白和/或T细胞受体基因的全部克隆序列的亚群进行测序。在另一实施方案中,所述全部克隆序列的亚群包含免疫球蛋白或T细胞受体基因的V-D连接、D-J连接、免疫球蛋白或T细胞受体基因的全部可变区、抗原识别区或互补决定区3 (CDR3)。在另一实施方案中,所述T细胞受体基因包含T细胞受体β基因。在另一实施方案中,所述免疫球蛋白基因包含免疫球蛋白重链基因。在另一实施方案中,所述扩增或再扩增包含多个与V区段互补的引物以及一个与C区段互补的引物。在另一实施方案中,所述扩增或再扩增包含多个与V区段互补的引物以及多个与C区段互补的引物。在另一实施方案中,所述多个与V区段互补的引物包含针对每个V区段的至少三个不同的引物,并且所述多个与C区段互补的引物包含至少I个、至少2个、至少3个、至少4个、至少5个或至少6个引物。在另一实施方案中,所述T细胞或B细胞是总T细胞和B细胞的亚群。在另一实施方案中,所述T细胞的亚群是⑶4+、⑶8+细胞或⑶27高细胞。在另一实施方案中,所述样品包含至少10,000个、至少500,000个、至少750,000个或至少1,000,000个T细胞。在另一实施方案中,所述测序包括每运行一次有至少1000次阅读、每运行一次有至少10,000次阅读、每运行一次有至少100,000次阅读或每运行一次有至少1,000,000次阅读。在另一实施方案中,所述测序包括每次阅读产生约 30bp、约 40bp、约 50bp、约 60bp、约 70bp、约 80bp、约 90bp、约 IOObp、约 I IObp 或约 120bp。在另一实施方案中,所述样品是当受试者处于自身免疫性疾病的爆发状态时采集的。在另一实施方案中,所述样品是从患有或疑似患有系统性红斑狼疮的受试者中采集的。另一方面,提供了一种用于确定受试者中的一种或多种相关克隆型的方法,该方法包括:通过对来自受试者的至少一种样品的空间分离的个体分子进行核酸测序,产生一种或多种克隆型谱,其中所述至少一种样品与疾病的第一状态相关,以及基于该一种或多种克隆型谱来确定该受试者中的一种或多种相关克隆型。在一个实施方案中,所述至少一种样品来自疾病累及的组织。在另一实施方案中,所述一种或多种相关克隆型的确定包括比较来自至少两种样品的克隆型谱。在另一实施方案中,所述疾病的第一状态是疾病的高峰状态。在另一实施方案中,所述一种或多种相关克隆型在疾病的闻峰状态存在。在另一实施方案中,所述一种或多种相关克隆型在疾病的高峰状态不存在。在另一实施方案中,所述一种或多种相关克隆型在疾病的闻峰状态很闻。在另一实施方案中,所述一种或多种相关克隆型在疾病的高峰状态很低。在另一实施方案中,所述样品包含T细胞和/或B细胞。在另一实施方案中,所述T细胞和/或B细胞包含T细胞和/或B细胞的亚群。在另一实施方案中,通过与标记物相互作用而富集所述T细胞和/或B细胞的亚群。在另一个实施方案中,所述标记物是T细胞和/或B细胞的亚群上的细胞表面标记物。在另一实施方案中,所述T细胞和/或B细胞的亚群与在疾病中特异性存在的抗原相互作用。在另一实施方案中,所述疾病是系统性红斑狼疮或多发性硬化症。另一方面,提供了一种用于开发能够预测来自患病受试者的任意样品中的一种或多种相关克隆型的算法的方法,该方法包括:a)从一组样品产生多个克隆型谱,其中所述样品与该疾病相关,b)鉴定来自该组样品的一种或多种克隆型,c)使用在b)中鉴定的一种或多种克隆型的序列参数和/或功能数据来开发能够预测来自患病受试者的任意样品中的相关克隆型的算法。在一个实施方案中,该组样品取自一种或多种受疾病累及的组织。在另一实施方案中,所述一种或多种相关克隆型的鉴定包括比较来自至少两种样品的克隆型谱。在另一实施方案中,所述功能数据包括T细胞和/或B细胞表面上的标记物的结合能力,或T细胞和/或B细胞与抗原的相互作用。在另一实施方案中,所述序列参数包含核酸序列和预测的氨基酸序列。在另一实施方案中,所述样品来自处于疾病的高峰阶段的一个或多个个体。在另一实施方案中,所述一种或多种相关克隆型在疾病的高峰状态存在。在另一实施方案中,所述一种或多种相关克隆型在疾病的高峰状态处于高水平。在另一实施方案中,所述一种或多种相关克隆型在疾病的高峰状态处于低水平。在另一实施方案中,所述一种或多种相关克隆型在疾病的高峰状态不存在。在另一实施方案中,所述疾病是系统性红斑狼疮或多发性硬化症。在另一实施方案中,提供了一种用于发现个体的一种或多种相关克隆型的方法,该方法包括:将来自个体的样品的克隆型谱输入算法中,并使用该算法来确定该个体的一种或多种相关克隆型。在一个实施方案中,提供了一种能够预测来自患病受试者的任意样品中的一种或多种相关克隆型的算法,所述算法是通过以下步骤开发得到的:a)从一组样品产生多个克隆型谱,其中所述样品与所述疾病相关,b)鉴定来自该组样品的一种或多种相关克隆型,c)使用在b)中鉴定的一种或多种相关克隆型的序列参数和/或功能数据来开发能够预测患病受试者的任意样品中的相关克隆型的算法。在一个实施方案中,所述样品是在疾病的高峰状态时采集的。在另一实施方案中,所述样品取自受疾病累及的组织。另一方面,提供了一种用于产生计算疾病活动性评分的算法的方法,该方法包括:开发一种使用一组因素将相关克隆型的水平组合为疾病活动性评分的算法,比较该疾病活动性评分和关于疾病状态的临床数据,并优化所述因素以便最大化临床数据与疾病活动性评分之间的关系。在一个实施方案中,提供了用于监测个体的疾病状态的方法,该方法包括:a)确定来自个体的样品的克隆型谱,b)将来自a)的克隆型谱信息输入计算疾病活动性评分的算法中,其中所述算法是通过开发一种使用一组因素将相关克隆型的水平组合为疾病活动性评分的算法而产生的,比较该疾病活动性评分和关于疾病状态的临床数据,并优化所述因素以便最大化临床数据与疾病活动性评分之间的关系,以及c)使用计算疾病活动性评分的算法来产生能预测个体的疾病状态的评分。在另一实施方案中,用于监测个体的疾病状态的方法还包括确定个体中的一种或多种相关克隆型,以及将该一种或多种相关克隆型的信息输入算法中。在另一实施方案中,所述确定个体中的一种或多种相关克隆型包括:a)通过对来自受试者的至少一种样品的空间分离的个体分子进行核酸测序产生一种或多种克隆型谱,其中所述至少一种样品与疾病的第一状态相关,以及b)基于该一种或多种克隆型谱来确定受试者中的一种或多种相关克隆型。在另一实施方案中,所述确定个体中的一种或多种相关克隆型包括:a)将来自个体的样品的克隆型谱输入可预测一种或多种相关克隆型的算法中,其中所述可预测一种或多种相关克隆型的算法通过以下步骤开发得到:i)从一组样品产生多个克隆型谱,其中所述样品与疾病相关,ii)鉴定来自该组样品的一种或多种相关克隆型,iii)使用在ii)中鉴定的一种或多种相关克隆型的序列参数和/或功能数据来开发可预测来自患病受试者的任意样品中的相关克隆型的算法,以及c)使用可预测一种或多种相关克隆型的算法来确定该个体的一种或多种相关克隆型。在另一实施方案中,所述疾病是系统性红斑狼疮或多发性硬化症。在另一实施方案中,提供了一种确定一种或多种相关的T细胞或B细胞克隆型的方法,该方法包括:a)将来自受试者的细胞样品分成至少两个样品,b)通过对来自受试者的一个细胞样品的单独空间分离的分子进行核酸测序而产生一种或多种克隆型谱,
c)基于细胞的至少一个分子参数来富集来自该受试者的另一细胞样品,d)通过对来自受试者的富集样品的单独空间分离的分子进行核酸测序而产生一种或多种克隆型谱,以及e)基于其在样品中的丰度已在富集的样品和未富集的样品中发生改变的克隆型来确定至少一种克隆型。在另一实施方案中,分子参数为细胞表面标记物。在另一个实施方案中,通过使用固相固定的亲和性标记物捕获细胞来实现富集。在另一实施方案中,所述固体表面是一组微珠。在另一实施方案中,固体表面是柱。在另一实施方案中,用突光部分标记标记物。在另一实施方案中,通过采用荧光标记的流式细胞术来实现富集。在另一实施方案中,所述细胞是B淋巴细胞,并且通过使用与B细胞受体结合的抗原来实现富集。在另一实施方案中,通过其上固定有抗原的固体表面的捕获来实现富集。在另一实施方案中,所述抗原用于标记B淋巴细胞,并且通过使用该标记的流式细胞术来实现富集。在另一个实施方案中,所述细胞是T淋巴细胞,并且使用允许标记和用流式细胞术富集与特异性抗原反应的T细胞的方法来实现富集。在另一实施方案中,T细胞用细胞内细胞因子染色法进行标记。在另一实施方案中,T细胞用细胞因子捕获法进行标记。在另一实施方案中,分子参数是能够结合至少一种特异于病原体的抗原的B细胞受体。在另一实施方案中,分子参数是能够结合至少一种特异于病原体的抗原的T细胞受体。在另一实施方案中,所述样品取自在第一时间点暴露于病原体的患者。另一方面,提供了一种用于确定个体中与对病原体的免疫反应相关的一组克隆型的方法,该方法包括:a)将来自受试者的细胞样品分成至少两个样品,b)通过对来自受试者的一个细胞样品的单独空间分离的分子进行核酸测序而产生一种或多种克隆型谱,c)基于细胞与至少一种病原体抗原相结合的能力来富集来自该受试者的另一个细胞样品,d)通过对来自受试者的富集样品的单独空间分离的分子进行核酸测序而产生一种或多种克隆型谱,以及e)基于其在样品中的丰度已在富集样品和未富集样品中发生改变的克隆型来确定至少一种相关克隆型。另一方面,提供了一种用于确定个体中与对肿瘤的免疫反应相关的一组克隆型的方法,该方法包括:a)将来自受试者的细胞样品分成至少两个样品,b)通过对来自该受试者的一个细胞样品的单独空间分离的分子进行核酸测序而产生一种或多种克隆型谱,c)基于细胞与存在于肿瘤中的至少一种自身抗原结合的能力来富集来自该受试者的另一细胞样品,d)通过对来自该受试者的富集样品的单独空间分离的分子进行核酸测序而产生一种或多种克隆型谱,e)基于其在样品中的丰度已在富集样品和未富集样品之间发生改变的克隆型来确定至少一种克隆型。在另一实施方案中,相关克隆型的水平用于评估个体患有肿瘤的风险。在另一实施方案中,已知所述抗原存在于已在该个体中出现的肿瘤中,并且所述相关克隆型用于评估肿瘤复发的风险。在另一实施方案中,已知所述抗原存在于其他个体的肿瘤中,并且所述相关克隆型用于评估在之前未检查出肿瘤的患者中癌症的风险。另一方面,提供了一种用于确定个体中的一组克隆型的方法,所述克隆型与针对因器官受损而释放到血流中的物质的免疫反应相关,该方法包括:a)将来自受试者的细胞样品分成至少两个样品,b)通过对来自该受试者的一个细胞样品的单独空间分离的分子进行核酸测序而产生一种或多种克隆型谱,c)基于细胞与至少一种存在于受损器官中的自身抗原结合的能力来富集来自该受试者的另一个细胞样品,d)通过对来自该受试者的富集样品的单独空间分离的分子进行核酸测序而产生一种或多种克隆型谱,以及e)基于其在样品中的丰度已在富集样品和未富集样品之间发生改变的克隆型来确定至少一种克隆型。在另一实施方案中,相关克隆型的水平用于评估个体的器官损伤的风险。另一方面,提供了一种用于确定个体中与对治疗剂的免疫反应相关的一组克隆型的方法,该方法包括:a)将来自受试者的细胞样品分成至少两个样品,b)通过对来自该受试者的一个细胞样品的单独空间分离的分子进行核酸测序而产生一种或多种克隆型谱,c)基于细胞与治疗剂中含有的至少一种抗原结合的能力来富集来自该受试者的另一个细胞样品,d)通过对来自该受试者的富集样品的单独空间分离的分子进行核酸测序而产生一种或多种克隆型谱,以及e)基于其在样品中的丰度已在富集样品和未富集样品之间发生改变的克隆型来确定至少一种克隆型。在另一实施方案中,相关克隆型的水平用于评估个体对治疗剂表现出超敏反应的风险。另一方面,提供了一种用于确定个体中与对动脉斑块的免疫反应相关的一组克隆型的方法,该方法包括:a)将来自受试者的细胞样品分成至少两个样品,b)通过对来自该受试者的一个细胞样品的单独空间分离的分子进行核酸测序而产生一种或多种克隆型谱,c)基于细胞与至少一种存在于动脉斑块中的抗原结合的能力来富集来自该受试者的另一细胞样品,d)通过对来自该受试者的富集样品的单独空间分离的分子进行核酸测序而产生一种或多种克隆型谱,以及e)基于其在样品中的丰度已在富集样品和未富集样品之间发生改变的克隆型来确定至少一种克隆型。在另一实施方案中,相关克隆型的水平用于评估个体患心血管疾病的风险。在另一实施方案中,相关克隆型的水平用于评估动脉斑块不稳定的风险。另一方面,描述了一种用于确定在淋巴肿瘤相关的细胞中发现的序列识别符的方法,该方法包括:a)从已知存在癌细胞的受影响的个体中获得细胞样品,b)通过对来自该样品中细胞的单独空间分离的分子进行核酸测序而产生一种或多种与至少一种免疫细胞基因组重排相关的克隆型谱,c)将与肿瘤相关的克隆型的序列确定为序列识别符。在另一实施方案中,样品来自患者的骨髓。在另一实施方案中,样品来自患者的血液。在另一实施方案中,样品来自实体淋巴瘤的活组织检查。在另一实施方案中,免疫细胞基因组重排是B细胞中IgH的VDJ重排。在另一实施方案中,免疫细胞基因组重排是B细胞中IgH的DJ重排。在另一实施方案中,免疫细胞基因组重排是B细胞中IgK的VJ重排。在另一实施方案中,免疫细胞基因组重排是B细胞中IgL的VJ重排。在另一实施方案中,免疫细胞基因组重排是T细胞中TCRii的VDJ重排。在另一实施方案中,免疫细胞基因组重排是T细胞中TCRii的DJ重排。在另一个实施方案中,免疫细胞基因组重排是T细胞中TCRa的VJ重排。在另一实施方案中,免疫细胞基因组重排是T细胞中TCRX的VJ重排。在另一个实施方案中,免疫细胞基因组重排是T细胞中TCRS的VDJ重排。在另一实施方案中,免疫细胞基因组重排是T细胞中TCRS的VD重排。在另一实施方案中,免疫细胞基因组重排是T细胞中TCRS的VD重排。在另一实施方案中,免疫细胞基因组重排是IgH的J区段易位到基因组的另一区域。在另一实施方案中,免疫细胞基因组重排是任意J区段易位到基因组的另一区域。在另一实施方案中,根据克隆型频率进行对肿瘤相关克隆型的鉴定。在另一实施方案中,根据克隆型频率对肿瘤相关克隆型进行鉴定。在另一实施方案中,通过检测交叉谱系重排进行对肿瘤相关克隆型的鉴定。在另一实施方案中,通过鉴定无功能重排进行对肿瘤相关克隆型的鉴定。在另一个实施方案中,通过将细胞克隆型与至少一种肿瘤相关分子标记物相关联进行对肿瘤相关克隆型的鉴定。另一方面,描述了一种确定个体中的循环淋巴瘤细胞水平的方法,所述个体的肿瘤已经与独特的序列识别符在涉及到的第一时间点相关联,该方法包括:a)从患者获得细胞样品,b)通过对来自该样品中的细胞的单独空间分离的分子进行核酸测序而产生一种或多种与至少一种免疫细胞基因组重排相关的克隆型谱,c)根据与序列识别符相关的克隆型水平确定肿瘤细胞的水平。另一方面,描述了一种用于确定个体中的循环淋巴瘤细胞水平的方法,所述个体的肿瘤已经与独特序列识别符在涉及到的第一时间点相关联,该方法包括:a)从患者获得细胞样品,b)基于至少一种分子标记物富集细胞,c)通过对来自该样品中的细胞的单独空间分离的分子进行核酸测序而产生一种或多种与至少一种免疫细胞基因组重排相关的克隆型谱,d)根据与序列识别符相关的克隆型水平确定肿瘤细胞的水平。在另一实施方案中,样品是血液样品。在另一实施方案中,样品是骨髓样品。在另一实施方案中,样品是淋巴样品。在另一实施方案中,样品是组织样品。在另一实施方案中,荧光标记细胞并用流式细胞术富集。在另一实施方案中,通过结合到固相支持体来富集细胞。在另一实施方案中,所述克隆型被定义为含有独特序列识别符的克隆型。在另一实施方案中,所述克隆型被确定为可能由序列识别符突变和重排得到的那些克隆型。在另一实施方案中,循环肿瘤细胞水平和/或循环肿瘤细胞水平的变化用于一算法中以产生与具有临床肿瘤复发的风险相关的评分。在另一实施方案中,循环肿瘤细胞水平和/或循环肿瘤细胞水平的变化用于作出治疗决定。I1、确定克隆型谱的方法本发明的方法可用于产生来自受试者的样品中的重组DNA序列谱或克隆型谱。在一个实施方案中,提供了一种用于确定T细胞和/或B细胞中的重组DNA序列谱的方法,该方法包括从受试者获得含有T细胞和/或B细胞的样品,从所述细胞中分离基因组DNA的个体分子,对分离的基因组DNA的个体分子进行测序,以及确定样品中不同序列的水平以产生所述重组DNA序列谱。在另一个实施方案中,提供了一种用于确定T细胞和/或B细胞中的重组DNA序列谱的方法,该方法包括从受试者获得含有T细胞和/或B细胞的样品,从所述细胞中分离基因组DNA的个体分子,扩增基因组DNA的个体分子,对扩增的DNA进行测序,以及确定样品中不同序列的水平以产生所述重组DNA序列谱。在另一实施方案中,提供了 一种用于确定T细胞和/或B细胞中的重组DNA序列谱的方法,该方法包括从受试者获得含有T细胞和/或B细胞的样品,从细胞扩增基因组DNA,分离扩增的DNA的个体分子,对分离的扩增DNA的个体分子进行测序,以及确定样品中不同序列的水平以产生所述重组DNA序列谱。在另一实施方案中,提供了一种用于确定T细胞和/或B细胞中的重组DNA序列谱的方法,该方法包括从受试者获得含有T细胞和/或B细胞的样品,从细胞扩增基因组DNA,分离扩增的DNA的个体分子,对扩增的DNA分子进行再扩增,对再扩增的DNA分子进行测序,以及确定样品中不同序列的水平以产生所述重组DNA序列谱。在另一实施方案中,提供了一种用于确定T细胞和/或B细胞中的重组DNA序列谱的方法,该方法包括从受试者获得含有T细胞和/或B细胞的样品,从所述样品中分离RNA,逆转录来自所述细胞的RNA以形成cDNA,分离所述cDNA的个体分子,任选地再扩增所述cDNA,对所述分离的所述cDNA或再扩增DNA的个体分子进行测序,以及确定样品中不同序列的水平以产生所述重组DNA序列谱。在另一实施方案中,提供了 一种用于确定T细胞和/或B细胞中的重组DNA序列谱的方法,该方法包括从受试者获得含有T细胞和/或B细胞的样品,从所述样品中分离RNA,对RNA个体分子进行测序,以及确定样品中不同序列的水平以产生所述重组DNA序列谱。受试者及样品本发明的方法可使用来自受试者或个体(例如,患者)的样品。受试者可以是患者,例如,患有自身免疫性疾病的患者。受试者可以是患有传染病或癌症(诸如白血病或淋巴瘤)的患者。受试者可以是哺乳动物,例如人类。受试者可以是雄性或雌性。受试者可以是婴儿、儿童或成年人。在一些实施方案中,受试者不再存活。在一些实施方案中,受试者是活着的。受试者可以是曾经暴露于生物武器的个体。受试者还可以是非人类动物。所述非人类动物可以是家养宠物或农场动物。所述非人类动物可以是狗、猫、牛、马、羊或猪。所述非人类动物可以是克隆的动物。所述非人类动物可能涉及药物生产。本发明的方法中所用的样品可包括,例如,来自受试者的体液,包括环绕胎儿的羊水、房水、胆汁、血液及血浆、耵聍(耳垢)、考珀液或射精前液、乳糜、食糜、女性喷射液、间隙液、淋巴、经血(menses)、母乳、黏液(包括鼻涕和痰)、胸膜液、脓液、唾液、皮脂(皮肤油)、精液、血清、汗液、泪液、尿液、阴道润滑液、呕吐物、水、粪便、包括环绕脑的脑脊液和脊髓在内的内部体液、环绕骨关节的滑液、细胞内液即细胞内的液体以及眼球中的液体玻璃体液。在一个实施方案中,样品是血液样品。血液样品可以为约0.1,0.2,0.3,0.4,0.5,0.6、0.7,0.8,0.9,1.0,1.5,2.0,2.5,3.0,3.5,4.0,4.5 或 5.0mL0 当受试者患有多发性硬化症时,样品可以是脑脊液(CSF);当受试者患有类风湿关节炎时,样品可以是滑液;当受试者患有系统性狼疮,样品可以是皮肤(或其他器官)活检组织。在一个实施方案中,可从最可能反映病理学的可获得的体液/组织鉴定克隆型,随后监测来自不同体液,例如,血液的克隆型的水平。样品还可包括在其中已经溶解了生物材料的溶剂。可在疾病不活动时对样品进行分析。可在疾病活动时对样品进行分析。可在疾病不活动时获得样品。可在疾病活动时获得样品。样品可由医疗服务人员,例如,内科医师、内科医师助理、护士、兽医、皮肤科医生、风湿科医生、牙医、医务辅助人员或外科医生来获得。样品可由研究技术员获得。样品可由受试者提供。样品可匿名提供。样品可通过邮寄提供。样品可由执法机构或调查员提供。可从受试者获得不只一种样品。样品可以是活检组织,例如皮肤活检组织。所述活检组织可以来自,例如,脑、肝脏、肺、心脏、结肠、肾脏或骨髓。本领域技术人员所用的任何活检技术都可用于从受试者分离样品。例如,活检可以是开放性活检,其中采用全身麻醉。活检可以是闭合性活检,其中形成比开放性活检更小的切口。活检可以是中心活检或切开活检,其中切除组织的一部分。活检可以是切除活检,其中尝试切除整个病变。活检可以是细针抽吸活检,其中用针移除组织样品或液体样品。样品可以从受试者遗留的身体物质获得。这种丢弃的物质可包括人类废弃物。丢弃的物质还可包括脱落的皮肤细胞、血液、牙齿或毛发。样品可包括免疫细胞,例如,免疫细胞可包括T细胞和/或B细胞。T细胞(T淋巴细胞)包括,例如,表达T细胞受体的细胞。T细胞包括辅助型T细胞(效应型T细胞或Th细胞)、细胞毒性T细胞(CTL)、记忆T细胞和调节性T细胞。样品在一些应用(例如确定相关T细胞的校准试验)中可包括单个细胞,或更普遍地包括至少1,000个、至少10,000个、至少100,000个、至少250,000个、至少500,000个、至少750,000个或至少I, 000,000个T细胞。B细胞包括,例如,血浆B细胞、记忆B细胞、B I细胞、B2细胞、边缘区B细胞以及滤泡B细胞。B细胞可表达免疫球蛋白(抗体,B细胞受体)。样品在一些应用(例如确定相关B细胞的校准试验)中可包括单个细胞,或更普遍地包括至少1,000个、至少10,000个、至少100,000个、至少250,000个、至少500,000个、至少750,000个、或至少I, 000,000个B细胞。样品可包括核酸,例如,DNA(例如,基因组DNA或线粒体DNA)或RNA(例如,信使RNA或微小RNA)。所述核酸可以是无细胞DNA或RNA,例如从循环系统提取的,Vlassov等人,Curr.Mol.Med.,10: 142-165 (2010) ;Swarup 等人,FEBS Lett.,581:795-799 (2007)。在本发明的方法中,来自受试者的可进行分析的RNA或DNA的量包括,例如,在一些应用(例如校准试验)中少至单个细胞,以及多达I千万个细胞或更多,相当于6pg-60 μ g的DNA,和约 Ipg-1O μ g 的 RNA0如下文更充分地讨论的(“定义”部分),淋巴细胞样品足够大,使得基本上每个具有独特克隆型的T细胞或B细胞在其中都有代表,从而形成组库(本文中使用该术语)。在一个实施方案中,采集样品,该样品有99%的概率包含以0.001%或更高的频率存在的群体的每一种克隆型。在另一个实施方案中,采集样品,该有99%的概率包含以0.0001 %或更高的频率存在的群体的每一种克隆型。在一个实施方案中,B细胞或T细胞样品包括至少50万个细胞,而在另一实施方案中,该样品包括至少100万个细胞。每当取样材料来源(诸如,临床研究样品或类似样品)稀缺时,可通过非偏差技术,诸如全基因组扩增(WGA)和多重置换扩增(MDA)或类似技术来扩增来自材料的DNA,例如,Hawkins 等人,Curr.0pin.Biotech., 13:65-67 (2002) ;Dean 等人,Genome Research,11:1095-1099(2001) ;Wang 等人,Nucleic Acids Research,32:e76 (2004) ;Hosono 等人,Genome Research, 13:954-964(2003)等等。特别感兴趣的是血液样品,尤其是在监测诸如淋巴瘤、白血病等淋巴样肿瘤中,且血液样品可用常规技术获得,例如Innis等人编,PCR Protocols (Academic Press, 1990)等。例如,可用常规技术,例如RosetteSep试剂盒(Stem Cell Technologies,Vancouver,力口拿大),从血液样品中分离白细胞。血液样品的体积范围可为IOOyL-1OmL ;在一个方面,血液样品的体积范围是200或100 μ L-2mL。随后可用用于本发明方法的常规技术例如DNeasy血液和组织试剂盒(Qiagen,Valencia,CA)从该血液样品中提取DNA和/或RNA。任选地,白细胞的亚群,例如淋巴细胞,可用常规技术进一步分离,例如荧光激活细胞分选(FACS)(Becton Dickinson, San Jose, CA)、磁激活细胞分选(MACS) (Miltenyi Biotec, Auburn,CA)等。在其他实施方案中,分析来自细胞亚群样品的核酸。可采用例如通过细胞表面标记分离细胞的方法。例如,可通过细胞分选流式细胞术、流式分选、荧光激活细胞分选(FACS)、基于微珠的分离诸如磁性细胞分选(MACS,例如,利用抗体包被的磁性颗粒)、基于大小的分离(如筛子、障碍物阵列或过滤器)、微流体装置分选、基于抗体的分离、沉降、亲和吸附、亲和提取或密度梯度离心来分离细胞。可通过激光捕获显微切割来纯化细胞。分选可以基于细胞大小、形态学或细胞内部标准记物或细胞外标记物进行。分离或分选肿瘤细胞的方法在以下文献中都有描述,例如,Nagrath S.等人(2007)Nature 450 =1235-1239 ;美国专利号6008002,7232653和7332288 ;PCT公开号W02008157220A1 ;以及美国专利申请号 US20080138805A1 和 US20090186065 ;以及 Rosenberg R.等人(2002) Cytometry 49:150-158,其中每一个都通过引用全文并入本文。所述细胞亚群可以是T细胞和/或B细胞的亚群。所述T细胞的亚群可以是⑶4+细胞、CD8+细胞或0027胃细胞。用于标记和/或分离众多的T细胞和B细胞亚群的抗体混合物可从供应商处购得,如 Quest Diagnostic (San Juan Capistrano, CA) ;Dako (丹麦)等。以下为疾病相关亚群可用的试剂盒的实例(其中列出了抗体的抗原特异性:B淋巴细胞性白血病 / 淋巴瘤前体(CD 19、CD79a (细胞质的)、CD20、CD 10、TDt、HLADR、CD34、IgM(细胞质的));弥漫性大B细胞淋巴瘤(CD20、CD 19、⑶22、⑶79a、⑶30);滤泡性淋巴瘤(CD20、CD 10、CD 10、BCL2、BCL6);套细胞白血病(CD19、CD20、CD5、CD23-、BCL1);等等。荧光激活细胞分选(FACS)利用光散射和荧光特性来分选细胞。使用例如与荧光染料偶联的核酸探针或抗体可赋予细胞荧光性质。细胞悬液可形成流动的液流。细胞流形成每滴含有大约一个细胞的液滴。在液流形成液滴之前,测量每个细胞的荧光特性。在荧光强度测量前,充电环上具有一种电荷,而当液滴从液流中分离时,在液滴上携带了相反的电荷。带电的液滴通过两个高电压偏转板,该高电压偏转板将液滴根据他们的电荷转至不同容器中。电荷可直接施加于液流,且分离的液滴保留了与液流相同符号的电荷。之后在液滴分离后液流回到中性。直接或间接免疫荧光法可用于FACS中。在直接免疫荧光法中,抗体与免疫染料直接偶联。在间接免疫荧光法中,不标记第一抗体,而第二抗体与免疫染料偶联。由于在每个个体的适应性免疫细胞的DNA以及与之相关的RNA转录本鉴定重组中,在本发明的方法中可对RNA或DNA 二者之一进行测序。来自编码T细胞受体或免疫球蛋白分子的T细胞或B细胞重组序列或其一部分被称为克隆型。所述DNA或RNA可对应于T细胞受体(TCR)基因或编码抗体的免疫球蛋白(Ig)基因的序列。例如,所述DNA和RNA可对应于编码TCR的α、β、Υ或δ链的序列。在大多数T细胞中,所述TCR是由α链和β链组成的异二聚体。TCRa链是通过VJ重组产生的,而β链受体是通过V(D) J重组产生的。对于TCRP链而言,人类有48个V区段、2个D区段和13个J区段。在两个连接点中的每一个都可以删除多个碱基,而添加其他碱基(称为N核苷酸和P核苷酸)。在少数T细胞中,TCR由Y链和δ链组成。TCRy链是通过VJ重组产生的,而TCRS链是通过V (D)J 重组产生的(Kenneth Murphy, Paul Travers 和 Mark Walport, Janeway' s Immunology第7版,Garland Science, 2007,通过引用全文并入本文)。在本发明方法中所分析的DNA或RNA可对应于编码具有恒定区(α、δ、ε、Y或μ)的重链免疫球蛋白(IgH)或具有恒定区λ或K的轻链免疫球蛋白(IgK或IgL)的序列。每个抗体具有两个相同的轻链和两个相同的重链。每个链由恒定(C)区和可变区组成。对重链而言,可变区由可变(V)区段、多样性(D)区段和连接(J)区段组成。编码这些区段中每种类型的几个独特序列存在于基因组中。特定VDJ重组事件发生在B细胞发育期间,使该细胞产生特定重链。轻链的多样性以相似的方式产生,只是没有D区,所以只是VJ重组。体细胞突变经常发生在重组位点附近,导致多个核苷酸的添加或删除,进一步增加了由B细胞产生的重链和轻链的多样性。由B细胞产生的抗体的可能的多样性是不同重链和轻链的产物。重链和轻链的可变区有助于形成抗原识别(或结合)区或位点。可在出现针对某表位的特异性应答之后发生的体细胞超突变过程增加了这种多样性。如上所述,根据本发明,可以选定引物以产生从淋巴细胞中提取的重组核酸亚群的扩增子。此类亚群在此可被称为“体细胞重排区”。体细胞重排区可包含来自发育中的或发育完全的淋巴细胞的核酸,其中发育中的淋巴细胞是免疫基因重排未完成从而未形成具有完整V(D)J区的分子的细胞。典型的不完全体细胞重排区包括不完全IgH分子(诸如,仅包含D-J区的分子)、不完全TCRS分子(诸如,仅包含D-J区的分子)以及无活性的IgK (例如,包含Kde-V区)。在第一条染色体形成了有效重排的发育完全的免疫细胞中,也可以见到与第二条染色体相关的不完全重排。控制样品量并估算细胞数如下文在“克隆型”和“组库”的定义中进一步描述的,足够的细胞采样是解释组库数据的一个重要方面。例如,从1000个细胞开始,产生试验灵敏的最低频率,该频率与测序阅读数目无关。因此,本发明的一方面是开发对输入免疫受体分子的数量进行定量的方法。该方法已应用于TCR和IgH序列。在任何一种情况下,采用一组能扩增所有不同序列的引物。为了获得绝对拷贝数,与具有已知免疫受体拷贝数的标准物一起执行使用多重引物的实时PCR。与小鼠疫苗接种实施例相关的实时PCR数据的实例在图9中示出。这种实时PCR测量可从扩增反应开始进行,所述扩增反应随后被测序,或者可对同一样品的另一份进行这种实时PCR测量。至于DNA,重排免疫受体分子的绝对数可以很容易地转换为细胞数(2倍内,因为某些细胞将会评估特异性免疫受体的2个重排拷贝而其他细胞只评估I个)。至于cDNA,可对所测量的实时样品中重排分子的总数进行推断,以确定在同一样品的另一个扩增反应中使用的这些分子的总数。此外,可将该方法与确定RNA总量的方法相结合,从而假设特定的cDNA合成效率,确定单位量(假设I μ g)的RNA中重排免疫受体分子的数量。如果测定cDNA的总量,则无需考虑cDNA合成的效率。如果细胞数也是已知的,则可计算每个细胞的重排免疫受体拷贝。如果细胞数是未知的,则可从总RNA估算细胞数,因为特定类型的细胞通常产生相似量的RNA。因此,从每I μ g中重排免疫受体分子的拷贝,可以估算每个细胞中这些分子的数量。与测序反应分开进行实时PCR的一个缺点是可能存在抑制效果,该抑制效果在实时PCR中与另一个反应中不同,因为可能使用不同的酶、输入DNA以及其他条件。针对测序而处理实时PCR产物可以改善该问题。然而,实时PCR的低拷贝数可能是因为拷贝数低或由于抑制效果或反应中其他欠佳的条件。可以利用的另一方法是将已知量的序列已知的独特免疫受体重排分子,即,已知量的一种或多种内部标准,加入到未知量的样品的cDNA或基因组DNA中。将添加的已知序列与同一样品中的其余序列相比较,获得相对分子数,可以估算最初cDNA样品中重排免疫受体分子的数量(这种分子计数技术是众所周知的,例如,Brenner等人,美国专利号7,537,897,通过引用并入本文)。如果还采用了实时PCR校准,则添加的独特序列的测序数据可用于区分不同的可能性。DNA(或cDNA)中低拷贝数的重排免疫受体将会产生掺入序列(spikedsequence)与样品其余序列的分子数之间的高比例。另一方面,如果通过实时PCR所测的低拷贝数是因为反应的效率低,该比例则不会高。一方面,本发明提供了用于在细胞水平上测量克隆型表达的方法。S卩,如上文所述,克隆型可用于淋巴细胞计数,因此,通过测量来源于基因组DNA的克隆型以及来源于RNA的相同克隆型,可以确定基于细胞的克隆型表达。一种用于同时测量样品中的淋巴细胞数和克隆型表达水平的方法可包括以下步骤:(a)从个体获得含有T细胞和/或B细胞的样品;(b)对来自所述细胞的基因组DNA的空间分离的个体分子进行测序,这些空间分离的个体分子包含与样品中的许多淋巴细胞相对应的许多克隆型;(c)对来源于所述细胞RNA的空间分离的个体分子进行测序,这些空间分离的个体分子包含与其在样品的淋巴细胞中的表达水平相对应的许多克隆型;以及(d)对于每种克隆型,通过比较从来源于所述细胞基因组DNA的分离的个体分子所确定的数量和从来源于所述细胞RNA的分离的个体分子所确定的数量,来确定在样品淋巴细胞中的克隆型表达水平。采用市售的试剂盒,诸如AllPrepDNA/RNA小型试剂盒(Qiagen GmbH,德国),可以很容易地从同一样品中提取基因组DNA和RNA。如上所述,在一个实施方案中,确定步骤还包括通过将已知量的内部标准加至所述基因组DNA来确定所述样品中淋巴细胞的所述数量。在另一实施方案中,例如其中样品是外周血,样品有确定的体积,使得能够确定所述淋巴细胞在所述样品中的浓度。通常,这一确定体积的范围是lmL-50mL,更通常是lmL-10mL。在另一实施方案中,将从来源于RNA的分离的个体分子确定的克隆型数量除以从来源于所述基因组DNA的分离的个体分子确定的克隆型的数量,比较来源于基因组DNA和RNA的相同克隆型的数量。通过使用标记,尤其是在样品制备过程中连接的寡核苷酸标签,可在同一测序运行中很容易地将该两组克隆型区分开来。对基于Solexa的测序而言,这些标记可与用于鉴定不同样品的标签合并,所述鉴定例如是通过将单个核苷酸加入标签中以指示DNA或RNA,或简单地使用额外的标签,使得每个患者样品都被两个标签标记,一个是针对基因组DNA部分,另一个是针对RNA部分。因此,对所述来源于所述RNA的空间分离的个体分子进行测序的步骤可包括用指示其RNA来源的第一标记物标记每个所述空间分离的个体分子;并且对所述来源于所述基因组DNA的空间分离的个体分子进行测序的步骤可包括用指示其基因组DNA来源的第二标记物标记每个所述空间分离的个体分子,以使第一标记物能与第二标记物区别开来。在一个实施方案中,此类标记物是通过测序鉴定的独特的寡核苷酸标签。同样,本发明可用于同时(即,基于对单个样品的测量)提供淋巴细胞数和克隆性。这样的实施方案可通过以下步骤实施:(a)从个体获得含有T细胞和/或B细胞的样品;
(b)对来源于所述细胞的核酸的空间分离的个体分子进行测序,这些空间分离的个体分子包含与样品中的许多淋巴细胞相对应的许多克隆型;(c)从空间分离的个体分子的数量来确定淋巴细胞的数量;(d)确定空间分离的个体分子的不同序列的丰度,从而生成克隆型谱以及基于此的克隆性的度量。来自淋巴细胞的核酸可以是基因组DNA和/或RNA ;然而优选地,所述核酸是基因组DNA。与上述类似地,在一个实施方案中,确定所述数量的步骤还包括通过将已知量的内部标准加至所述基因组DNA来确定所述样品中淋巴细胞的所述数量。同样,当样品是外周血样品时,其有确定的体积,从而可以确定所述样品中所述淋巴细胞的浓度。在上述的一些实施方案中只采用B细胞,而在其他实施方案中只采用T细胞。核酸群的扩增如下文所述,可通过多种扩增技术产生目标核酸群的扩增子。在本发明的一个方面,用多重PCR来扩增核酸混合物的成员,特别是含有重组免疫分子诸如T细胞受体、B细胞受体或其部分的混合物。在以下通过引用并入本文的参考文献中可以找到进行此类免疫分子的多重PCR的指导=Morley的美国专利5,296,351 ;Gorski的美国专利5,837,447 ;Dau的美国专利6,087, 096 ;Von Dongen等人的美国专利公开2006/0234234 ;欧洲专利公开EP1544308B1 ;等等。上述参考文献描述了称为“谱型分析”的技术,该技术中通过多重PCR扩增免疫分子群,之后,例如,通过电泳将得到的扩增子的序列进行物理分离,以确定是否存在占优势的大小的类别。这一类别可能指示淋巴细胞的主要克隆群,后者又可指示疾病状态。在谱型分析中,重要的是选择具有很少或没有交叉反应性的引物(即,不会退火到其他引物的结合位点上的引物);否则,扩增子中会出现错误的大小类别表现形式。在本发明中,只要群体的核酸被一致地扩增,则引物的交叉反应性是可以允许的,因为在本发明中分析了所扩增的核酸的序列,而不只是它们的大小。如下文更充分描述的,在一方面,空间上分离个体核酸分子的步骤如下实现:使用各自具有不与靶序列互补的尾部的正向及反向引物对预选的体细胞重排区或其部分(即靶序列)进行初次多重扩增,从而产生第一扩增子,该第一扩增子的成员序列在各末端具有允许进一步操作的共同序列。例如,所述共同末端可包括引物结合位点用于连续扩增或用于个体分子在固体表面上的桥接扩增,该连续扩增仅使用一种正向引物及一种反向引物而不是使用多种正向引物和反向引物。此类共同末端可加到如上所述的单个扩增中,或可将它们加到两步程序中,从而避免与用长引物(例如,50-70个碱基或更长)混合物进行制备和运行质量控制有关的困难。在这样的两步法(下文将更充分地描述,并在图4A-4B中说明)中,如上所述进行初次扩增,不同之处是限制引物尾部的长度以仅在第一扩增子序列末端提供正向和反向引物结合位点。之后,使用特异于这些引物结合位点的二次扩增引物进行二次扩增,以将进一步的序列加至第二扩增子的末端。二次扩增引物具有不与靶序列互补的尾部,该尾部形成第二扩增子的末端,并可与第二扩增子的克隆型测序一起使用。在一个实施方案中,此添加的序列可包括用于产生测序阅读的引物结合位点,以及用于在固体表面上进行桥接PCR以产生空间分离的个体分子的克隆群的引物结合位点,例如,在使用基于Solexa的测序时。在后一种方法中,将来自第二扩增子的序列样品置于附着有能够退火到样品序列的互补寡核苷酸的固体表面,之后实施引物延伸、变性、退火的循环直至形成模板的克隆群。优选地,选定样品的大小以便(i)使其包括原样品中克隆型的有效表现形式,和(ii)使固体表面上克隆群的密度在允许对克隆型进行明确序列确定的范围内。除了确保样品含有足够的细胞以代表原样品以外,通过多重PCR反应产生的扩增子能代表反应中的细胞也很重要。为了实现这一目的,应选定引物条件以便在反应中每个细胞的都发生扩增。TCR或BCR序列或其部分可在多重反应中从核酸扩增出来,所述多重反应使用至少一种退火到C区的引物以及一种或多种能退火到一个或多个V区段的引物(如图2A-2B和图4A-4B所示,以及如下文更充分讨论的)。在多重反应中退火到V区段的引物数可为,例如,至少 1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、
26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、
51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79或80。在多重反应中退火到V区段的引物数可为,例如10-60、20-50、30_50、40-50、20-40、30-40或35-40。引物可退火到不同V区段。对于IgH基因,由于V区段中体细胞突变的可能性,可以使用能退火到各V区段的多种引物;例如每个V区段1、2、3、4或5个引物。在多重反应中退火到C区段的引物数可包括,例如,至少1、2、3、4、5、6、7、8、9、10、11、12、13、14或15。在多重反应中退火到C区段的引物数可为1-10、2-9、3-8、4-7、3_8或3-6。可如实施例3或实施例4所述发生TCR或免疫球蛋白基因的扩增。要扩增的区域可包括全部克隆序列或克隆序列的亚群,包括免疫球蛋白或T细胞受体基因的V-D连接和D-J连接、免疫球蛋白或T细胞受体基因的全部可变区、抗原识别区或⑶R,例如互补决定区3 (⑶R3)。
TCR或免疫球蛋白序列可用初次和二次扩增步骤进行扩增。每个不同的扩增步骤可包含不同的引物。不同引物可引入免疫基因序列中原来不存在的序列。例如,扩增过程可将新的引物结合位点加至靶序列的末端,以将多重扩增转换为单重扩增,或者扩增过程可将一种或多种标签加至扩增的TCR或免疫球蛋白序列的5’端和/或3’端(如图3A-3C所示)。标签可以是促进扩增的DNA的后续测序的序列。标签可以是促进扩增的序列结合到固相支持体上的序列。其他扩增方法可不采用V区中的任何引物。而是可使用来自C区段的特异性引物,而在另一侧(5,)使用通用引物。可在cDNA合成中通过不同方法附加通用引物例如已有详细描述的链交换法。类似地,可在cDNA生成后通过包括连接在内的不同方法附加通用引物。可用于本发明的方法中的扩增核酸的其他手段包括,例如,逆转录PCR、实时PCR、定量实时PCR、数字PCR (dPCR)、数字乳液PCR (dePCR)、克隆PCR、扩增片段长度多态性PCR(AFLP PCR)、等位基因特异性PCR、组装PCR、不对称PCR (其中对所选链使用大大过量的引物)、菌落PCR、解旋酶依赖型扩增(HDA)、热启动PCR、反向PCR(IPCR)、原位PCR、长PCR(DNA延伸大于约5千个碱基)、多重PCR、嵌套式PCR(使用一对以上的引物)、单细胞卩0 、降落?0 、环介导等温?0 (1^1^)以及基于核酸序列的扩增(NASBA)。其他扩增方案包括:连接酶链反应、分支DNA扩增、滚环扩增、环到环扩增、SPIA扩增、通过捕获和连接的目标扩增(TACL)以及RACE扩增。
可通过使用逆转录将样品中的RNA信息转化为cDNA。根据常规方案,在逆转录反应中可使用PolyA引物、随机引物和/或基因特异性引物。扩增基因组DNA(或通过逆转录RNA扩增cDNA形式的核酸)之后,可分离个体核酸分子,任选地进行再扩增,然后进行单独测序。示例性的扩增方案可见于van Dongen等人,Leukemia,17:2257-2317(2003)或 van Dongen 等人美国专利公开 2006/0234234,这些都通过引用并入本文。简单来说,示例性的方案如下:反应缓冲液:ABI缓冲液II或ABIGold 缓冲液(Life Technologies, San Diego, CA);最终反应体积为 50L ; IOOng 样品 DNA ;各IOpmol的引物(需进行调整来平衡如下所述的扩增);终浓度为200 μ M的dNTPs ;终浓度为1.5mM的MgCl2 (需根据靶序列及聚合酶进行优化);Taq聚合酶(1_2U/管);循环条件:在95°C预活化7min ;在60°C退火;循环时间:变性30s ;退火30s ;延伸30s。在本发明的方法中,可用于扩增的聚合酶是市售的,包括,例如,Taq聚合酶、AccuPrime聚合酶或Pfu。可以基于是优选保真度还是效率,来选择要使用的聚合酶。用于从合并物中分离核酸的方法包括在固体基质(例如,载玻片)上在两个维度上空间分离分子,在具有微团的溶液中在三个维度上空间分离分子(例如可以在将或不将分子固定在诸如微珠之类的固体表面上的情况下使用油乳剂来实现),或者使用例如在微流体或纳米流体芯片中的微反应室。可利用稀释来确保在给定体积、空间区域、微珠或反应室内平均存在一个分子。关于这些分离个体核酸分子的方法的指导可在以下文献中找到:Sambrook, Molecular Cloning:ALaboratory Manual(Cold Spring Harbor LaboratoryPress, 2001s) ;Shendure 等人,Science,309:1728-1732 (包括增补材料)(2005);美国专利 6,300,070 ;Bentley 等人,Nature, 456:53-59 (包括增补材料)(2008);美国专利7, 323, 305 ;Matsubara 等人,Biosensors&Bioelectronics, 20: 1482-1490 (2005);美国专利 6,753,147 ;等等。可在起始步骤中利用实时PCR、picogreen染色、纳米流电泳(如LabChip)或紫外吸收测量来判断可扩增材料的发挥功能的量。用于核酸再扩增的方法包括用核酸转化的分离菌落的细菌生长、玻片上的扩增(例如,PCR集落(聚合酶克隆))以及微珠上的扩增(如在乳液PCR中)。可利用相同的方法扩增和再扩增核酸,或者可利用不同的方法扩增和再扩增核酸。在某些实施方案中,亚克隆步骤包括通过扩增或连接步骤将通用引物连接到DNA或RNA上的步骤。之后该引物用于扩增克。⒆魑庑蛞镌咏坏氖侗鹦蛄(例如,如图2A-2B和图4A-4B所示,以及如下文中更充分讨论的)。在一个方面,进行多重扩增,以使起始群中序列的相对量与扩增群或扩增子中的相对量基本上相同。也就是说,在一个样品群的成员序列间进行最小扩增偏差的多重扩增。在一个实施方案中,如果扩增子中各相对量是其在起始样品中的数值的五倍以内,那么这些相对量基本上相同。在另一实施方案中,如果扩增子中各相对量是其在起始样品中的数值的两倍以内,那么这些相对量基本上相同。如下文更充分讨论的,PCR中的扩增偏差可以用常规技术检测并修正,以便可选择一组PCR引物用于预定的可提供任何样品的无偏差扩增的组库。对于许多基于TCR或BCR序列的组库,多重扩增任选地使用所有V区段。对反应进行优化以试图使得扩增反应保持由不同V区段引物扩增的序列的相对丰度。一些引物是相关联的,并因此许多引物可能“串扰”,扩增与其不完全匹配的模板。优化条件,以便各模板可以相似的方式扩增,而不论是用那个引物扩增。换言之,如果有两个模板,那么经过1,000倍扩增后,两个模板可被扩增约1,000倍,并且对于其中一个模板,一半的扩增产物由于“串扰”而携带不同的引物也不要紧。在对测序数据的后续分析中,从分析中消除引物序列,因此在扩增时使用何种引物都没有关系,只要模板同等地得到扩增。由于mRNA生成的cDNA群中每个模板的量是未知的,所以可使用克隆型的cDNA群的单重PCR产生一组标准物。对于TCRP克隆型的组库执行该操作。34次该PCR(在单独的反应中,使用实施例3中的引物)的每一次的产物包括多种具有一个V引物的序列。对不同产物进行仔细定量以产生一组相同浓度的标准物。使用所有34种引物的合并物,并用此引物合并物和每种标准物序列作为模板进行34次实时PCR。理想地,不存在偏差,所有34种标准物显示同等的实时PCR扩增效率。这提示,即使串扰的存在使人们不清楚何种引物执行了该扩增,但每个序列都同等地得到扩增。这种优化与不论引入到扩增产物中的实际引物如何都具有同等扩增的目标是一致的。提高总引物合并物浓度显著地减低提高扩增效率可能导致的变化范围。此外,对于看起来可比平均值更高效扩增的模板,其完全匹配的弓I物在合并物中的浓度降低。相反地,对于无法高效扩增的模板,其完全匹配的弓I物的浓度升高。这种优化表明所有模板的扩增在平均扩增的两倍以内。还可以通过进行两阶段扩增(如图2A-2B中所示)来避免扩增偏差,其中在第一阶段或初次阶段,利用尾部不与靶序列互补的引物进行少量扩增循环。该尾部包括被添加到初级扩增子序列末端的弓I物结合位点,以便这些位点在仅使用一个正向弓I物和一个反向引物的第二阶段扩增中使用,从而消除引起扩增偏差的主要原因。优选地,初次PCR将进行足够少的循环数(例如5-10)以最小化不同引物造成的差异扩增。二次扩增用一对引物完成,因此差异扩增的问题是最少的。I %的初次PCR直接进入二次PCR。两次扩增中使用的35个循环(相当于无100倍稀释步骤的约28个循环)足以显示稳健的扩增,而不论循环是否分解为如下循环:1个初次循环和34个二次循环,或25个初次循环和10个二次循环。尽管理想的是在初次PCR中只运行一次循环就可降低扩增偏差,但是还有其他考虑因素。其中一个方面是代表性。这在起始输入量不超过最终获得的阅读数时起作用。例如,如果获得1,000, 000个阅读,并起始于1,000, 000个输入分子,则从100,000个分子中仅取一个代表进行二次扩增会降低估算原样品中不同种类的相对丰度的精确度。两步之间的100倍的稀释意味着代表性降低,除非初次PCR扩增产生显著多于100个的分子。这表明可采用最少8个循环(256倍),但更适合的是10个循环(约1000倍)。该方法的备选方案是取多于I %的初次PCR进行二次PCR,但由于初次PCR所用的弓I物浓度高,可以利用高稀释倍数来确保这些引物不会干扰扩增并恶化序列间的扩增偏差。另一备选方案是增加纯化或酶促步骤,以消除来自初次PCR的引物,以允许其较少的稀释。在此实例中,初次PCR为10个循环,而二次PCR为25个循环。多重PCR的重现性可用以下方式评估,正如实施例2的测试引物组所例证的。使用测试引物组,例如,合并的TCRP引物和C引物(实施例2中的)以及一个作为模板的cDNA样品,进行两个初次PCR反应。利用实时PCR评估每个扩增的模板的相对丰度。用两种扩增产物的每一种作为模板,在每个反应中用C引物和一种V引物进行34种不同的实时PCR反应。图5中示出的数据表明,针对两种样品使用所有V引物通过实时PCR确定的相对丰度是高度可重复的,从而表明多重扩增是高度可重复的。以一个多重扩增产物为模板的每个实时PCR扩增的循环数(Ct值)在X轴上示出,而以第二多重扩增产物为模板的每个实时PCR扩增的循环数绘于Y轴上。一组引物的扩增偏差量可用以下程序评估,该程序用实施例2中的引物组进行了例证。该测试引物组(如上)用于扩增作为模板的cDNA(例如,从由淋巴细胞中提取的mRNA获得的)。用实时PCR确定用34种不同引物中的每一种(与C区段引物一起)扩增的模板量,并将该量与使用相同引物扩增cDNA的量进行比较。由于即使扩增产物内部序列之间的相对丰度和cDNA相同也可能存在串扰,所以只有扩增的显著差异才可用该读出值检测出来。可通过合成引物集合来扩增大量起始cDNA序列的内部片段而测试这种可能性。例如,设计了 12种寡核苷酸,当它们与C区段引物一起使用时,能够扩增上述V区段引物的内部序列。如果存在最小扩增偏差,那么这些内部序列的浓度在起始cDNA和扩增产物之间应当几乎没有变化。来自该实例的数据在图6中示出。其中采用cDNA样品作为模板,用合并的PCRP弓丨物和C引物(来自实施例2)进行多重扩增。利用C引物及下游内部引物对来自多重扩增的模板材料进行初次扩增。类似地,利用实时PCR评估cDNA中这些相同序列的相对丰度。如果多重扩增具有任何显著偏差,则扩增材料中的相对丰度将与cDNA中的相对丰度有很大的差异。如图6中可见,观察到高相关性,表明多重扩增中的最小扩增偏差。使用内部引物以及作为模板的cDNA和多重扩增产物进行的每个实时PCR扩增的循环数(Ct值)分别在X轴和Y轴上示出。初次扩增可以由DNA或RNA (例如,转化为cDNA之后)进行。核酸群测序任何可用于核酸测序的高通量技术都可用于本发明的方法中。DNA测序技术包括利用标记的终止剂或引物和平板或毛细管凝胶分离的双脱氧测序反应(Sanger法)、利用标记的可逆终止核苷酸的合成测序、焦磷酸测序、454测序、等位基因与标记的寡核苷酸探针库的特异性杂交、利用等位基因与标记克隆库的特异性杂交随后进行连接的合成测序、在聚合步骤中对标记的核苷酸的加入的实时监测、聚合酶克隆测序以及SOLiD测序。最近通过利用聚合酶或连接酶的连续或单个延伸反应以及通过与探针库的单个或连续差异杂交证明了对分离的分子的测序。这些反应已对许多克隆序列并行进行,包括在超过I亿个序列的当前商业应用中并行展示。因此,这些测序方法可用于研究T细胞受体(TCR)和/或B细胞受体(BCR)的组库。在本发明的一个方面中,采用高通量测序方法,该方法包括在固体表面上空间分离个别分子的步骤,在该固体表面上对它们进行并行测序。此类固体表面可包括无孔表面(诸如在Solexa测序中,例如Bentley等人,Nature, 456:53-59 (2008)或全基因组测序,例如Drmanac等人,Science, 327:78-81 (2010)),可包括微珠结合的或颗粒结合的模板的阵列孔(诸如454测序,例如Margulies等人,Nature, 437:376-380 (2005)或1nTorrent测序,美国专利公开2010/0137143或2010/0304982)、微机械加工膜(诸如SMRT测序,例如Eid等人,Science,323:133-138(2009))或微珠阵列(如SOLiD测序或聚合酶克隆测序,例如Kim等人,Science,316: 1481-1414 (2007)) 另一方面,这些方法包括将所分离的分子在固体表面上进行空间分离之前或之后,对它们进行扩增。在前的扩增可包括基于乳液的扩增,诸如乳液PCR扩增或滚环扩增。特别受关注的是基于Solexa的测序,其中个体模板分子在固体表面上进行空间分离,之后通过桥接PCR进行并行扩增,以形成单独的克隆群或簇,然后进行测序,如Bentley等人(如上文所引用)以及制造商的说明书(例如,TruSeq Sample Preparation Kit and Data Sheet, Illumina, Inc., SanDiego, CA, 2010)中所述;并在以下通过引用并入本文的参考文献中有进一步的描述:美国专利6,090,592 ; 6, 300,070 -J, 115,400 ;以及EP0972081B1。在一个实施方案中,置于固体表面并在固体表面扩增的个体分子形成簇,该簇具有至少为IO5个簇/cm2的密度;或至少为5xl05/cm2的密度;或至少为IO6个簇/cm2的密度。在一个实施方案中,采用具有相对较高的错误率的测序化学法。在这些实施方案中,由这些化学法产生的平均质量评分是序列阅读长度的单调下降函数。在一个实施方案中,这种下降相当于0.5%的序列阅读在位置1-75含有至少一个错误;1%的序列阅读在位置76-100含有至少一个错误;和2%的序列阅读在位置101-125含有至少一个错误。一方面,对于来自个体的每个样品,在本发明方法中使用的测序技术每运行一次产生至少1000种克隆型的序列;另一方面,该技术每运行一次产生至少10,000种克隆型的序列;另一方面,该技术每运行一次产生至少100,000种克隆型的序列;另一方面,该技术每运行一次产生至少500,000种克隆型的序列;另一方面,该技术每运行一次产生至少1,000, 000种克隆型的序列。又一方面,该技术每运行一次对于每个个体样品产生100,000至1,000, 000种克隆型的序列。本发明的方法中使用的测序技术每次阅读可产生约30bp、约40bp、约50bp、约60bp、约 70bp、约 80bp、约 90bp、约 lOObp、约 llObp、约 120bp、约 150bp、约 200bp、约 250bp、约 300bp、约 350bp、约 400bp、约 450bp、约 500bp、约 550bp 或约 600bp。本发明的方法中使用的测序技术每次阅读可产生至少30、40、50、60、70、80、90、100、110、120、150、200、250、300、350、400、450、500、550 *600bp。一方面,个体的基于序列的克隆型谱利用以下步骤获得:(a)从个体的T细胞和/或B细胞中获得核酸样品;(b)空间分离来源于该核酸样品的个体分子,所述个体分子含有嵌套组模板,每个模板由样品中的核酸产生且每个模板含有体细胞重排区或该重排区的一部分,每个嵌套组能产生多种序列阅读,每个阅读沿相同方向延伸,并且每个阅读从产生嵌套组的核酸上的不同位点开始;
(c)对所述空间分离的个体分子进行测序;以及(d)确定来自核酸样品的核酸分子的不同序列的丰度以产生克隆型谱。在一个实施方案中,测序步骤包括针对每种嵌套组产生多种序列阅读。在另一实施方案中,每个体细胞重排区包含V区和J区,并且多种序列阅读中的每一种都从V区的不同位点开始,并在与其相关的J区方向延伸。在另一实施方案中,测序步骤包括对每个空间分离的个体分子进行双向测序,以产生至少一个正向序列阅读和至少一个反向序列阅读。对于后一个实施方案,至少一个正向序列阅读和至少一个反向序列阅读具有重叠区域,以便通过这些序列阅读间的反向互补关系来确定该重叠区的碱基。在又一个实施方案中,每个体细胞重排区包含V区和J区,并且测序步骤还包括从一个或多个正向序列阅读和至少一个反向序列阅读确定每个个体核酸分子的序列,该序列阅读从J区中的位点开始并在与其相关的V区方向延伸。在另一实施方案中,个体分子包含选自完整IgH分子、不完整IgH分子、完整IgK分子、完整IgK非活性分子、TCRii分子、TCRy分子、完整TCR δ分子和不完整TCRS分子的核酸。在另一实施方案中,测序步骤包括产生具有单调下降的质量评分的序列阅读。对于后一个实施方案,单调下降的质量评分使得序列阅读具有不高于以下的错误率:0.2%的序列阅读在碱基位置1-50含有至少一个错误;0.2-1.0%的序列阅读在位置51-75含有至少一个错误;0.5-1.5%的序列阅读在位置76-100含有至少一个错误。正如下文对组库的定义中所述,可对免疫球蛋白或T细胞受体基因的不同预定区进行测序。在一些实施方案中,可对可变区的全部序列进行测序,以鉴定并量化克隆型。可对全部克隆序列的独特亚群进行测序。在一些实施方案中,对包含VD连接和JD连接的核苷酸进行测序,以独特地鉴定并量化克隆型。在其他实施方案中,可进行测序的片段是全部可变区。在又一实施方案中,对抗原识别区或互补决定区3(CDR3)进行测序。可扩增含有全部CDR3或全部可变区的片段,以允许对包含V、D和J区段的部分的CDR3进行测序。在一个实施方案中,仅对⑶R3进行扩增和测序。⑶R3的扩增和测序可以通过使用对一个或多个V区段序列特异的引物(以及位于C区段中扩增子另一侧的一个或多个引物)完成。用于每个V区段的引物可用于扩增序列的全部组库的一个或多个扩增反应。随可在扩增或不扩增的情况下,混合并分离该序列的组库,并利用任何所述测序技术进行测序。当在单独试管中用各种V引物进行扩增时,由于PCR饱和度,可将携带不同V区段的分子数“标准化”。例如,如果一个特定V区段的一个或多个克隆增殖导致其代表性高于其他片段,这一信息可被清除或减少,因为针对每个片段的PCR反应可能被迫饱和或趋于饱和,。实时PCR可用于量化每种V区段存在多少。可对全部CDR3进行测序,或对CDR3序列亚群进行测序。在一个实施方案中,仅对克隆型亚群进行分析。这可通过用该克隆型亚群特异性的引物(例如,V区段特异性的引物)进行扩增而完成。通过提供完全连通性的连续长阅读的测序,可鉴定独特的克隆型。在一些实施方案中,当存在数种感兴趣的序列时,仅跨越一个连接点的短阅读长度可产生对特定克隆型而言不是唯一的而是多种克隆型之间共享的简并标签。例如,跨越ν/J连接点的测序可将所有具有相同V/J(无论D区段如何)的序列混在一起作为一种克隆型。例如,关于所有区段的完全连通性的信息使得可能具有相同V和J区段但与不同D区段相连的序列被区分开来。从序列数据确定克隆型在本发明的一个方面,可通过结合来自一个或多个序列阅读(如,沿着选定链的V⑶J区)的信息来确定克隆型的序列(包括但不限于来源于IgH、TCRa、TCRi3、TCRy,TCR δ和/或IgLK (IgK)的序列)。另一方面,通过结合来自多个序列阅读的信息来确定克隆型的序列。(如文中所用的“序列阅读”是通过测序技术产生的一系列数据,由该数据确定核苷酸的序列。通常,序列阅读是通过例如利用DNA聚合酶或DNA连接酶沿核酸模板延伸引物而得到的。通过记录与此延伸相关的诸如光学、化学(例如PH变化)或电信号等信号而产生数据。)该多种序列阅读可包括一个或多个沿着有义链的序列阅读(即“正向”序列阅读)以及一个或多个沿着其互补链的序列阅读(即“反向”序列阅读)。当沿着同一链产生多个序列阅读时,首先通过使用针对序列阅读的不同位置而选定的引物扩增样品分子来产生单独的模板。在图4A中阐述了此概念,其中采用引物(404、406和408)在单一反应中产生扩增子(分别是410、412和414)。此类扩增可在同一反应或单独的反应中进行。一方面,无论何时采用PCR,单独的扩增反应都用于产生单独的模板,该单独的模板转而合并在一起并用于产生沿着同一链的多个序列阅读。后一方法对于避免需要平衡引物浓度(和/或其他反应参数)以确保多个模板的均衡扩增(本文中有时称为“平衡扩增”或“无偏差扩增”)来说是优选的。图4B-4C中图示了在单独反应中模板的产生。其中含有IgH的样品(400)被分成三份(472、474和476),加入到使用J区引物(401)和V区引物(分别是404,406和408)的单独PCR中,以产生扩增子(分别是420、422和424)。后一种扩增子随后在使用P5和P7引物的二次PCR(480)中合并(478),以制备用于桥接PCR和在IlluminaGA测序仪或类似仪器上进行测序的模板(482)。本发明的序列阅读可能有很多不同的长度,这部分取决于所采用的测序技术。例如,对于某些技术,在实施过程中可能要有一些权衡,例如:(i)每个模板的序列阅读的数量和长度,和(ii)测序运行的成本和持续时间。在一个实施方案中,序列阅读在20到400个核苷酸的范围内;在另一实施方案中,序列阅读在30到200个核苷酸的范围内;在又一实施方案中,序列阅读在30到120个核苷酸的范围内。在一个实施方案中,为了确定每个克隆型的序列要产生I至4个序列阅读;在另一实施方案中,为了确定每个克隆型的序列要产生2至4个序列阅读;而在另一实施方案中,为了确定每个克隆型的序列要产生2至3个序列阅读。在上述实施方案中,所给出的数值不包括用于从不同个体鉴定样品的序列阅读。在下述实施方案中所用的各种序列阅读的长度还可基于试图由阅读捕获的信息而改变;例如,序列阅读的起始位点和长度可以设计成提供NDN区长度及其核苷酸序列;因此,选择跨越整个NDN区的序列阅读。在其他方面,一个或多个序列阅读包含D区和/或NDN区。在本发明的另一方面,部分通过比对序列阅读与一个或者多个V区参考序列和一个或多个J区参考序列,部分通过确定碱基而无需比对参考序列(比如在高度可变的NDN区中),来确定克隆型的序列。多种比对算法可以应用于序列阅读和参考序列。例如,关于选择比对方法的指南可参见Batzoglou,Briefings in Bioinformatics,6:6-22 (2005),通过引用将其并入。在一个方面,不论何时将V阅读或C阅读(将在下文详述)与V区和J区参考序列进行比对,都需要采用树搜索算法,例如,Cormen等人,Introduction to Algorithms,第三版(TheMIT Press,2009)。V区和J区参考序列的密码子结构可用于比对过程中,以消除测序错误和/或确定比对结果的置信水平,如下文更加充分地描述的。另一方面,至少一个正向阅读的末端和至少一个反向阅读的末端在重叠区(例如图3B中的308)内重叠,使得这两种阅读的碱基彼此是反向互补关系。因此,例如,如果重叠区中的正向阅读是“5’ -acgttgc”,则与之处于反向互补关系的反向阅读在同一重叠区中为“5' -gcaacgt”。一方面,至少部分由此反向互补关系确定此重叠区内的碱基。也就是说,如果保持两个序列阅读间的反向互补关系,或与之相一致,那么预期重叠区内的碱基判定(或相关的质量评分)的概率会升高。一方面,由至少一个起始于其J区并且沿着与其相关的V区方向延伸的序列阅读(本文称为“C阅读”(304))和至少一个起始于其V区并且沿着与其相关的J区方向延伸的序列阅读(本文称为“V阅读” (306))确定TCRP和IgH链(如图3B所示)的克隆型。如图3B所示,重叠区(308)可能包含或不包含NDN区(315)。重叠区(308)可以完全处于J区、完全处于NDN区、完全处于V区,或其可包含J区-NDN区边界或V区-NDN区边界,或这两个边界(如图3B所示)。通常,通过在合成测序反应中使用聚合酶延伸测序引物,如图3B中的(302)和(310)而产生这些序列阅读,例如,Metzger, Nature ReviewsGenetics, 11:31-46(2010) ;Fuller 等人,Nature Biotechnology, 27:1013-1023 (2009)。预先确定引物(302)和(310)的结合位点,以便它们可提供序列阅读的最初比对和分析的起点或锚定点。在一个实施方案中,定位C阅读以使其包含TCRii或IgH链的D区和/或NDN区,并包括邻近V区的一部分,例如如图3B和3C所示。一方面,可利用V区中V阅读和C阅读的重叠来将这两个阅读相互比对。在其他实施方案中,并不需要序列读数的这样的比对,例如对于TCRii链,以使V阅读的长度可能仅足以鉴定克隆型的特定V区。后一方案在图3C中显示。序列阅读(330)用于鉴定V区,需要或不需要与另一序列阅读重叠,并且另一序列阅读(332)横贯NDN区并用于确定其序列。序列阅读(332)延伸到V区的部分(334)用于将序列阅读(332)的序列信息与序列阅读(330)的序列信息相结合以确定克隆型。对于某些测序方法,诸如逐个碱基的方法,如Solexa测序法,通过最小化分析中的测序循环数可降低测序运行时间和试剂成本。任选地,如图3B所示,产生具有样品标签(312)的扩增子(300)来区分来源于不同生物样品(如不同患者)的克隆型。可以通过将引物退火至引物结合区(316),并将其延伸(314)以生成跨过标签(312)的序列阅读来鉴定样品标签(312),从而解码样品标签(312)。至少两个因素使得分析IgH链比分析TCRii链更具有挑战性,这两个因素为:i)体细胞突变的存在使得定位或比对更加困难,以及ii) NDN区较大使得通常不可能将V区段的一部分定位到C阅读上。在本发明的一个方面,通过使用多个引物组产生V阅读可克服该问题,这些引物位于沿V区的不同位置,因此,优选地,这些引物结合位点不重叠并且分隔开来,而且至少一个引物结合位点邻近NDN区,例如在一个实施方案中,距V-NDN连接5至50个碱基,或者在另一实施方案中,距V-NDN连接10至50个碱基。多个引物组的冗余度使得因体细胞突变影响结合位点的而导致一个或两个引物失败从而无法检测克隆型的风险最小化。此外,至少一个邻近NDN区的引物结合位点的存在使得V阅读更有可能与C阅读重叠,并因此有效地延伸C阅读的长度。这允许产生跨越所有大小的NDN区并且还可以基本上定位位于NDN区两侧的整个V区和J区的连续序列。用于执行该方案的实施方案如图4A和4D所示。在图4A中,含有IgH链(400)的样品通过对每个链产生多个扩增子进行测序,通过单组J区引物(401)以及多组(显示的是3组)V区(402)引物(404,406,408)扩增链以产生多个嵌套扩增子(例如,410、412、416),所有扩增子都包含相同的NDN区并具有连续涵盖了 V区(402)的较大部分(411、413、415)的不同长度。嵌套组中的成员可在测序后通过记录它们各自的NDN区、J区和/或C区的身份(或实质身份)而归类到一起,从而能够比序列阅读长度和/或序列质量有限的测序平台重建更长的V(D) J区段。在一个实施方案中,多个引物组可以为2到5个。在另一实施方案中,多个为2到3个;且又一实施方案中多个为3个。多个引物中引物的浓度和位置变化很大。V区引物浓度可以相同或不相同。在一个实施方案中,最接近NDN区的引物的浓度高于多个引物中其他引物,例如,以确保在所得的扩增子中出现含有NDN区的扩增子。一个或多个邻近NDN区(444)的引物(例如图4B中的435和437)可用于产生一个或多个序列阅读(例如434和436),与利用J区引物(432)广生的序列阅读(442)重置,从而提闻重置区(440)喊基判定的质量。来自多个引物的序列阅读可与或不与邻近的下游引物结合位点和/或邻近的下游序列阅读重叠。在一个实施方案中,靠近NDN区(例如436和438)的序列阅读可用于鉴定与克隆型相关的特定V区。这样的多个引物降低了引物结合位点在免疫球蛋白发育过程中超突变而导致扩增不完全或扩增失败的可能性。它还提高了 V区超突变引入的多样性在克隆型序列中被捕获的可能性。可执行二次PCR以制备用于测序的嵌套扩增子,例如,通过利用所示的P5(401)和P7 (404,406,408)引物扩增以产生扩增子(420、422和424),这些扩增子可以作为单分子分布在固体表面上,其中通过桥接PCR或者类似的技术将它们进一步扩增。如图4C所示,可通过利用侧翼J区和V区的密码子结构提高NDN区(尤其是IgH链的NDN区)的碱基判定。(如文中所用的“密码子结构”指的是TCR或BCR转录本区段或NDN区以外(例如V区、J区等)基因的天然阅读框的密码子。)扩增子(450)—图4B的扩增子的放大图一与C阅读(442)和上方的相邻V阅读(434)以及下方分别的V区(430)和J区(446)的密码子结构(452和454)的相对位置一起示出。根据本发明此方面,在通过与V和J参考序列进行常规比对而鉴定密码子结构(452和454)以后,使用序列阅读(434)和(442)从J区(446)到V区(430)以及按相反方向从V区(430)到J区(446)一次一个碱基地移动来判定(或鉴定)NDN区(456)中的碱基。在正常的生物学条件下,只有具有从V区穿过NDN区至J区的符合读框的密码子的重组TCR或IgH序列才表达为蛋白质。也就是说,在体细胞突变产生的变体中,只有J区和V区的密码框彼此符合读框并且穿过NDN区仍然符合读框的变体才会被表达。(这里由参考序列确定V和J区的正确读框)。如果基于一个或多个低质量的碱基判定来鉴定不符合读框的序列,那么相应的克隆型就会被标记以便重新评估或作为潜在的疾病相关异常。如果所鉴定的序列符合读框并且基于高质量的碱基判定,则相应克隆型已被正确判定的可信度较高。因此,一方面,本发明包括一种由双向序列阅读确定基于V(D) J的克隆型的方法,该方法包括以下步骤:(a)产生至少一个起始于J区并延伸至NDN区的J区序列阅读,以及起始于V区并向NDN区延伸的至少一个V区序列阅读,以使J区序列阅读与V区序列阅读在重叠区内重叠,并且J区和V区各自含有密码子结构;(b)确定延伸至NDN区的J区密码子结构是否与向NDN区延伸的V区密码子结构符合读框。在又一实施方案中,产生步骤包括产生起始于V区并延伸通过NDN区到达J区的至少一个V区序列阅读,以使J区序列阅读和V区序列阅读在重叠区内重叠。分析序列阅读。将序列阅读合并至克隆型。由序列阅读数据构建克隆型部分地取决于用于产生这些数据的测序方法,因为不同的方法具有不同的预期阅读长度和数据质量。在一种方法中,采用Solexa测序仪产生用于分析的序列阅读数据。在一个实施方案中,获得提供至少0.5-1.0XlO6个淋巴细胞的样品,以产生至少一百万个模板分子,在任选的扩增后该模板分子可以产生相应的一百万个或者更多的模板分子克隆群(或簇)。对于大多数的高通量测序方法,包括Soleax方法,这种在簇水平上的过采样是理想的,以便以大冗余度确定每一个模板序列以提高序列确定的准确度。对于基于Solexa的实施方案,优选地,每一个独立模板的序列确定10次或更多次。对于其他具有不同预期阅读长度和数据质量的测序方法,不同水平的冗余度可用于类似的序列确定准确度。本领域普通技术人员认识到上述参数,例如样品大小、冗余度等是与特定应用相关的设计选择。如果测序技术没有错误,那么把给定样品的一组阅读还原为其独特的克隆型以及记录每一个克隆型的阅读数将会是琐碎的计算问题。但是,在存在测序错误的情况下,相对于正确克隆型序列每一个克隆型都被错误数量不同的阅读“云”围绕。这种错误的数量越多,围绕的云的密度越低,即云密度随着在序列空间中远离克隆型而降低。多种算法可用于将序列阅读转换成克隆型。一方面,序列阅读的合并取决于三个因素:针对两个感兴趣的克隆型中的每一个获得的序列数;它们之间不同的碱基数;以及在它们不一致的位点处的测序质量。根据预期错误率和错误的二项式分布来评估似然比。例如,对于两个克隆型,其中一个有150个阅读而另一个有2个阅读,它们之间在测序质量低的区域存在一个差异,它们很可能被合并,因为它们可能是由测序错误产生的。另一方面,对于两个克隆型,其中一个有100个序列阅读而另一个有50个阅读,它们之间有两个差异,它们不能被合并,因为它们被认为是不可能由于测序错误而产生的。在本发明的一个实施方案中,以下描述的算法可用于由序列阅读确定克隆型。围绕每种克隆型的阅读云都可以用二项式分布和单碱基错误概率的简单模型来模拟。后一种错误模型可通过定位V区段和J区段或者经由克隆型的自我一致性和收敛性自行找到克隆型算法而推测出来。构建模型,在X是该序列空间区域中唯一正确的克隆型的零模型下,用于计算具有序列阅读计数C2和E错误(相对于序列X)的给定“云”序列Y是具有完美阅读计数C I的正确克隆型序列X的一部分的概率。根据参数C 1、C2和E作出是否将序列Y合并到克隆型X的决定。对于任意给定的C I和E,需要预先计算出用于决定合并序列Y的C2的最大值。选择C2最大值,使得在Y是克隆型X的一部分的零假设下,在将具有错误E的所有可能的序列Y整合到序列X附近以后,不能合并Y的概率小于某个P值。P值控制算法的运行状态,并使得合并或多或少地得到允许。如果由于序列Y的阅读计数值超过了合并到克隆型X的阈值C2而使序列Y不能合并到克隆型X,那么序列Y变成了用于形成另一个克隆型的候选序列。该算法还确保了“更靠近”该序列Y (被认为独立于X)的任何其他序列Y2、Y3等不会聚集于X。“靠近”的概念既包括关于Y和X的错误计数,还包括X和Y的绝对阅读计数,即,它以与上述用于围绕克隆型X的错误序列云的模型相同的方式进行模拟。这样,如果“云”序列正好“靠近”不只一个克隆型,则可以正确地归属于它们正确的克隆型。该算法通过从具有最高阅读计数的序列X开始以从上至下的方式运行。此序列形成第一个克隆型。邻近的序列如果它们的计数低于预先计算的阈值(见上文)则合并到此克隆型,或者如果它们高于该阈值或“更接近”另一个未合并的序列则置之不理。在搜索了最大错误计数以内的所有的邻近序列之后,结束将阅读合并至克隆型X的过程。解读其阅读以及所有已经合并到其中的阅读,并将其从可用于产生其他克隆型的阅读列表中去除。随后下一个具有最高阅读计数的序列被移上来。如上,邻近的阅读合并到此克隆型,并且此过程一直持续到不再存在阅读计数超过给定阈值的序列,例如直到计数大于I的序列已经全部用来形成克隆型。在上述算法的另一实施方案中,可再加入进一步的检验,用于确定是否将候选序列Y合并到现有的克隆型X中,该检验考虑了相关序列的序列阅读的质量评分。如果序列Y和X不同,则为序列Y确定平均质量评分(取所有具有序列Y的阅读的平均数)。若平均评分超过预定值,则此差异更可能指示不应被合并的真正不同的克隆型,如果平均评分低于该预定值,则序列Y更可能是由测序错误产生的,因此应该合并到X中。序列树。上述将阅读合并到克隆型的算法依赖于从一些输入序列X中找到所有错误小于E的序列的有效方式。使用序列树可以解决此问题。这种序列树的实施方式具有某些不寻常的特征,因为树的节点不限于是DNA的单一碱基。这些节点可以有任意长的序列。这允许更有效地使用计算机存储器。将给定样品的所有阅读放置到序列树中。每个叶节点指向与它相关联的阅读。它对应于通过从叶节点到根节点逆向穿过序列树得出的独特序列。将第一个序列放在具有一个根节点和一个叶节点的含有阅读的全部序列的简单的树中。接着将序列一个接一个地加入。对每一个加入的序列而言,或是在此阅读与现有的树之间的共同序列的最后一点上形成新的分支,或是如果该树已经含有此序列,则将此阅读加到现有的叶节点上。在将所有的阅读放到序列树后,很容易将该树用于以下目的:1.最高阅读计数:根据阅读计数来分选叶节点可让我们找到具有最多阅读的叶节点(即序列)。2.找到相邻的叶片:对于任意序列,全部相对于该序列的错误小于X的通过该树的路径是可搜索的。一条路径起始于根部,这条路径分支成多个单独的路径沿着序列树行进。记录每条路径沿着序列树行进时的当前的错误计数。当错误计数超过所允许的错误最大值时,终止给定路径。这样,该树的大部分会尽可能早地得到修正。这是一种从任意给定序列中找到所有错误小于X的路径(即所有叶)的有效方式。体细胞超突变。在一个实施方案中,如下确定已经历体细胞超突变的基于IgH的克隆型。体细胞突变被定义为与(相关区段,通常是V、J或C的)参考序列的相应碱基不同并且在统计学上显著量的阅读中存在的测序碱基。在一个实施方案中,C阅读可用于找到相对于已定位的J区段的体细胞突变,且同样V阅读用于V区段。只使用那些或是直接定位到J或V区段的或是在克隆型内延伸达NDN边界的C阅读和V阅读的片段。用这种方式可以避开NDN区,而且之前用于确定克隆型的相同“序列信息”不用于寻找突变(以防止错误地将那些实际上只是不同的重组NDN区归类为突变核苷酸)。对于每种区段类型,已定位的区段(主要的等位基因)用作支架,并且考虑在阅读定位阶段已经定位到此等位基因的所有阅读。针对体细胞突变,分析其中已定位了至少一个阅读的参考序列的每个位点。在一个实施方案中,接受非参考碱基作为有效突变的标准包括以下各项:1)至少N个阅读具有给定的突变碱基,2)至少一个给定的分数N/M阅读(其中M是在此碱基位置定位的阅读的总数),以及3)基于二项式分布的统计截止(statistical cut),在突变碱基处的N个阅读的平均评分Q以及具有非突变碱基的阅读数(M-N)。优选地,选定上述参数,使得每个克隆型的突变的错误发现率低1/1000,更优选地,低于1/10000。系统发生克隆型(宗族(clan))。对于某些疾。钊绨┲ⅲ馨拖赴錾约膊。桓隽馨拖赴茸婵梢圆喔鱿喙氐牧馨拖赴哟扛龆加涤泻/或表达略微不同的TCR或BCR,并因此由于持续的体细胞超突变或诸如碱基替换、异常重排等疾病相关体细胞突变而具有不同的克隆型。产生这些克隆型的细胞在此称为系统发生克。乙蛔檎庋南喙乜寺≡诖顺莆白谧濉。类似地,系统发生克隆的克隆型称为系统发生克隆型,且一组系统发生克隆型可以称为克隆型的宗族。一方面,本发明的方法包括监测克隆型的宗族的频率(即,组成宗族的系统发生克隆型的频率的总和),而不是个体克隆型的频率。(“一种或多种患者特异性克隆型”的表述包含了宗族的概念)。可通过与亲本克隆型的相关性的一种或多种测量来鉴定系统发生克隆型。在一个实施方案中,如下文所详述,系统发生克隆型可根据同源性百分比归类到同一个宗族。在另一实施方案中,根据相同的V区、J区和/或NDN区的使用来鉴定系统发生克隆型。例如,宗族可用具有相同的J区和ND区但具有不同的V区(有时称为“VH替代”)的克隆型来定义;或者可用具有相同V和J区(通过碱基置换由其各自的参考序列相同地突变)但具有不同NDN区的克隆型来定义;或者可用已经经历了一个或多个I到10个碱基或I到5个碱基或I到3个碱基的插入和/或缺失以产生宗族成员的克隆型来定义。在另一实施方案中,如果克隆型满足以下标准则可归为同一个宗族:i)它们被定位到相同V和J参考区段,该定位发生在克隆型序列中相同的相对位置,以及ii)其NDN区基本上相同。提及宗族成员时所用的“基本上”是指允许在NDN区存在某些小的差异,因为此区域可能发生体细胞突变。优选地,在一个实施方案中,为了避免错误判定NDN区中的突变,碱基置换是否被接受作为癌症相关的突变直接取决于宗族NDN区的大小。例如,如果宗族NDN序列的长度为m个核苷酸或更长,例如9个核苷酸或更长时,若一种克隆型具有相对于该宗族NDN序列的一个碱基的差异作为癌症相关突变,那么一种方法可以接受该克隆型为宗族成员,否则将不接受;或者如果宗族NDN序列的长度为η个核苷酸或更长,例如20个核苷酸或更长,若一个克隆型具有相对于该宗族NDN序列的两个碱基的差异作为癌症相关突变,那么该方法可以接受该克隆型为宗族成员,否则将不接受。在另一实施方案中,可以使用以下标准确定宗族成员:(a)V阅读定位到相同V区,(b)C阅读定位到相同J区,(c)NDN区基本上相同(如上所述),以及(d) V-NDN边界与J-NDN边界之间的NDN区的位置相同(或者等同地,添加至D的下游碱基数与添加到D的上游碱基数相同)。如文中所用的术语“C阅读”可以指由退火到C区(在使用RNA样品的情况下)或者退火到J区(在使用DNA样品的情况下)的测序引物产生的阅读。如其他地方所述,这是因为C区与J区在转录后剪接过程中连接在一起。单个样品的系统发生克隆型可归入宗族,并且来自在不同时间获取的连续样品的宗族可以相互比较。尤其是在本发明的一个方面,对于从每个时间点的每个样品确定的克隆型,鉴定含有与诸如淋巴肿瘤的疾病相关的克隆型的宗族。将这组(或宗族)来自每个时间点的相关克隆型与紧接在前的样品的相关克隆型进行比较,以确定疾病状态,这种确定是通过例如确定在连续的宗族中特定克隆型的频率是升高还是降低,是否出现根据群体研究或数据库得知其为相关性的新相关克隆型,等等。所确定的状态可以是持续缓解、早期复发、进一步克隆进化的证据等等。同种型使用。另一方面,本发明提供了包括同种型使用信息的克隆型谱。如图3B所示,无论何时从RNA确定基于IgH或TCRii的克隆型,转录后剪接总会把C区和V区连接起来。一方面,用于产生C阅读(例如304)的测序引物退火到C区(307)中J区(309)连接处的预定引物结合位点(302)。如果选定引物结合位点(302)以使C阅读(304)包括C区(307)的一部分(305),则可确定C区(307)的身份,其转而确定合成的BCR的同种型。在一个实施方案中,选定引物结合位点(302)使得C阅读(304)包括C区(307)的至少6个核苷酸;在另一实施方案中,选定引物结合位点(302)使得C阅读(304)包括C区(307)的至少8个核苷酸。根据该实施方案确定的每个克隆型都包括其相应的C区部分(305)的序列信息,并从这种序列信息确定其相应的同种型。在本发明的一个方面,相关克隆型在最初确定时可具有第一同种型,但是在它们被监测期间会转换成另一种同种型。该实施方案能够通过记录之前未记录的、除了对应于不同同种型部分(305)的序列外与相关克隆型具有相同序列的克隆型来检测该转换。预计PCR错误集中在PCR早期循环中发生突变的一些碱基中。预期测序错误分布在多个碱基中,这是完全随机的,因为错误可能存在一定的系统性偏差。假设某些碱基有较高的测序错误率,比如说5% (平均值的5倍)。鉴于这些假设,测序错误成为错误的主要类型。将PCR错误从高度相关的克隆型的发生中区分开来将在分析中起作用。考虑到确定存在两个或多个高度相关的克隆型的生物学显著性,可采用一种保守的方法来进行这些判定。考虑检测足够多的次要克隆型,以便以高置信度(比如说99.9% )确保存在不只一种克隆型。例如,对于每1,000, 000个出现100个拷贝的克隆型,次要变体要检测14次或更多次以指定为独立克隆型。同样,对于每1,000, 000个出现1000个拷贝的克隆型,次要变体要检测74次或更多次以指定为独立克隆型。可通过使用对每个测序的碱基获得的碱基质量评分来强化该算法。如果以上验证了质量评分与错误率之间的关系,则对于所有碱基不再采用保守的5%的错误率,而是可以利用质量评分决定判定独立的克隆型所需呈现的阅读数。可以使用所有阅读中特定碱基的中位质量评分,或更严格地,可基于每个阅读中特定碱基的质量评分计算存在错误的可能性,随后可结合这些可能性(假设是独立的)来估计该碱基的测序错误的可能数量。因此,对于具有不同质量评分的不同碱基,存在推翻测序错误假设的不同阈值。例如,对于每1,000, 000个出现1,000个拷贝的克隆型,如果错误概率分别为0.01和0.05,当检测22次和74次时,将次要变体指定为独立的。II1.相关克隆型以及医学算法本发明提供了用于鉴定其存在与否和/或水平与疾病状态相关的克隆型以及利用此信息作出诊断或预后决定的方法。一方面,在算法中向患者或医疗保健提供者呈现来自克隆型谱的信息,该信息可与诸如非TCR或非BCR基因的表达水平、生理状况等其他医学信息结合;即,一组一个或多个步骤,其中评估检测和/或检查的结果,以及(i)确定行动方案或作出关于健康或疾病状态的决定,或(ii)根据流程图或类似的决策结构作出一系列决定,从而导致行动方案或关于健康或疾病状态的决定。本发明的算法在形式上可能有很大不同。例如,如果某一克隆型或者克隆型亚组超过了克隆谱中的预定比值,或者其比例在监测之间以超过预定的速率增加,算法可能只是提示应该使用药物治疗患者。甚至更简单地,算法可能仅指示在疾病状态与一种或多种克隆型的水平和/或由一种或多种克隆型编码的TCR或BCR的功能之间存在正相关。除了来自一个和多个克隆谱的信息以外,更复杂的算法还可以包括患者生理信息。例如,在复杂疾病诸如某些自身免疫性疾病中,在算法中可结合克隆型谱信息和患者的其他数据,诸如之前的治疗过程、是否出现症状(例如,皮疹、关节炎症)或其强度、特定基因的表达等等。在本发明的一个方面,用于监测淋巴疾病的算法提供了一个预定的分数值,样品(如血液样品)克隆型谱中的克隆型(和/或进化上相关的克隆型)的比例高于此预定值则指示疾病复发或治疗抗性。所述算法可由TCR或BCR克隆性的常规度量组成,或包括TCR或BCR克隆性的常规度量。另一方面,用于监测自身免疫性疾病的算法提供了一个或多个预定的分数值,如果分别编码一种或多种预定抗原特异性的TCR或BCR的克隆型谱中克隆型的比例高于此预定值,则指示自身免疫爆发的发作。A.相关克隆型与不相关克隆型本发明的方法提供了区别a)相关克隆型(可以是那些水平与疾病相关的克隆型)与b)不相关克隆型(可以是那些水平与疾病不相关的克隆型)的手段。在一个实施方案中,相关克隆型可以显不与疾病的正相关或者负相关。在另一实施方案中,在疾病闻峰状态存在而在疾病的非高峰状态不存在的克隆型可以是相关克隆型(与疾病正相关)。在另一实施方案中,在疾病高峰状态(或阶段)比疾病非高峰状态更丰富(即以更高的分子水平存在)的克隆型可以是相关克隆型(与疾病正相关)。在另一实施方案中,在疾病高峰状态不存在而在疾病非高峰状态存在的克隆型可以是相关克隆型(与疾病负相关)。在另一实施方案中,在疾病高峰状态不如在疾病非高峰状态时丰富的克隆型可以是相关克隆型(与疾病负相关)。在另一实施方案中,通过算法确定个体的相关克隆型。B.利用校准试验而不使用群体研究发现相关克隆型和不相关克隆型在本发明的一个实施方案中,可通过检查与疾病状态相关的某些样品中存在的克隆型来鉴定相关克隆型。该样品可以是处于疾病高峰状态的血液样品(例如,来自急性发作期的MS或狼疮患者的血液样品),或者可以来自受疾病累及或与疾病相关的组织,该组织富集与该个体的疾病(诸如炎症或肿瘤)相关的T细胞和B细胞。这些组织的实例可以是患有肾炎的狼疮患者的肾脏活检样品、MS患者爆发期的脑脊液(CSF)、类风湿关节炎患者的滑液或癌症患者的肿瘤样品。在所有这些实例中,这些组织很可能含有与疾病相关的有关T细胞和B细胞(虽然不一定是病原体)。值得注意的是,如果该方法用来鉴定与疾病相关的克隆型,那么这些克隆型只与在其样品中检测这些克隆型的个体相关。因此,为了使用该方法鉴定任意给定的患病个体中的相关克隆型,需要特定的校准试验。就是说,一方面,通过从取自直接受疾病累及或与疾病相关的组织(本文中有时称为“疾病相关组织”)的样品产生克隆型谱,来发现或确定相关克隆型。另一方面,此确定还包括,从取自不受疾病累及或与疾病无关的组织(本文中有时称为“非疾病相关组织”)的样品产生克隆型谱,然后比较前后两个克隆型谱,来将相关克隆型确定为那些处于高水平、低水平或功能上不同的克隆型,例如,编码特定抗原特异性的TCR或BCR。一方面,可通过鉴定如下克隆型进行这种确定,该克隆型在受累及的或疾病相关的组织的克隆型谱中出现的频率高于相同克隆型在未受累及的或非疾病相关的组织的克隆型谱中出现的频率。在一个实施方案中,提供了一种用于确定受试者的一种或多种相关克隆型的方法。该方法包括以下步骤:a)通过对来自受试者的至少一个样品的空间分离的个体分子进行核苷酸测序,产生一个或多个克隆型谱,其中所述至少一个样品与疾病的第一状态相关,以及b)基于所述一个或多个克隆型谱,确定受试者中的一种或多种相关克隆型。
在一个实施方案中,至少一个样品来自受疾病累及的组织。在另一实施方案中,所述一种或多种相关克隆型的确定包括对来自至少两个样品的克隆型谱进行比较。在另一实施方案中,所述疾病的第一状态是疾病的高峰状态。在另一实施方案中,一种或多种相关克隆型在疾病的高峰状态存在。在另一实施方案中,一种或多种相关克隆型在疾病的高峰状态不存在。在另一实施方案中,一种或多种相关克隆型在疾病高峰状态处于高水平。在另一实施方案中,一种或多种相关克隆型在疾病高峰状态处于低水平。在另一实施方案中,样品包含T细胞和/或B细胞。在另一实施方案中,所述T细胞和/或B细胞包含T细胞和/或B细胞的亚群。在另一实施方案中,所述T细胞和/或B细胞的亚群通过与标记物的相互作用进行富集。在另一实施方案中,所述标记物是T细胞和/或B细胞的亚群的细胞表面标记物。在另一实施方案中,所述T细胞和/或B细胞的亚群与疾病中特异性存在的抗原相互作用。例如,对于淋巴增生性疾病,诸如淋巴瘤,可以通过如上建议的富集,从淋巴组织、从疾病引起的损伤(例如转移损伤)或者从间接受到疾病累及的组织获得校准样品。对于淋巴肿瘤,有很多可用的指南和可商业获得的试剂盒用于免疫分型和富集疾病相关的淋巴细胞,例如“U.S.-Canadian consensus recommendations on theimmunophenotypicanalysis of haematologic neoplasia by f lowcytometry, Cytometry, 30:214-263 (1997) ;MultiMix AntibodyPanels for Immunophenotyping Leukemia andLymphoma by FlowCytometry (Dako, Denmark);等等。淋巴组织包括淋巴结、脾、扁桃体、腺样体、胸腺等。在一个实施方案中,所述疾病是自身免疫性疾病。在另一实施方案中,所述自身免疫性疾病是系统性红斑狼疮、多发性硬化症、类风湿关节炎或者强直性脊柱炎。在一些实施方案中,通过检测在与疾病状态之外的状态相关的一些样品中存在的克隆型来鉴定相关克隆型。这些状态可包括暴露于非致病抗原,诸如针对本地花粉的亚症状变态反应。该实施方案可用于确定个体最近是否回到过含有此抗原的地方。这些状态包括暴露于与工业过程或生物恐怖制剂的制造或生产相关的抗原。C.利用群体研究发现相关克隆型以及不相关克隆型在一个实施方案中,提供了一种利用群体研究鉴定克隆型的方法。群体研究的使用允许将在已知疾病状态结果的患者中已经得到确认的关于相关克隆型的特定信息标准化,以使得可在未来所有的受试者中鉴定此类相关克隆型而无需进行校准试验。对一组特定相关克隆型的了解可用于提取关于在未来受试者中将相关的克隆型的可能属性(参数)的规律。该实施方案利用以下步骤实施:(a)对来自受疾病累及或者与疾病相关的组织的一组样品中的每一种产生克隆型谱;(b)确定相对于来自未受累及的组织的样品中的相同克隆型处于高水平或低水平的克隆型,或与来自未受累及的组织的样品中的克隆型在功能上不同的克隆型。一方面,如本文所用的关于克隆型的“功能上不同”是指由该克隆型编码的TCR或BCR与其他的相比是不同抗原、蛋白质或复合物特异性的。任选地,上述实施方案还可进一步包括开发一种用于根据上述步骤(a)和/或(b)中确定的克隆型的序列信息或根据功能数据预测任意样品中的相关克隆型的算法,即确定最近测定的克隆型编码对于特异于所观察疾病的抗原、蛋白质或复合物而言为特异性的TCR和BCR。关于以上所述,可通过将在一个或多个初始检测中确定的克隆型(“确定的克隆型”)与通过群体研究、数据库等可以获得的已知与所述疾病相关的克隆型进行匹配,来鉴定一种或多种患者特异性克隆型。一方面,匹配所述克隆型包括找出由确定的克隆型编码的氨基酸序列和由已知的与疾病相关的克隆型或与后一克隆型基本上相同的变体所编码的氨基酸序列间的同一性。如此处所用的“基本上相同的变体”,一方面是指所比较或匹配的序列在核苷酸序列或氨基酸序列上至少80%相同,或至少90%相同。另一方面,基本上相同的变体是指相差5个或更少的碱基或氨基酸添加、删除和/或置换。另一方面,匹配所述克隆型包括找出确定的克隆型和已知与疾病相关的克隆型的核酸序列或与后一克隆型基本上相同的变体的核酸序列间的同一性。再一方面,匹配克隆型包括找出被确定的克隆型和已知与疾病相关的克隆型的核酸序列或与该疾病相关克隆型基本上相同的变体的核酸序列之间的同一性。在一个实施方案中,本发明所涵盖的方法包括,在样品研究中,通过对免疫细胞组库进行测序来鉴定相关与不相关克隆型,所述样品来自不同时期的患者和任选的健康对照,以及在患者患有疾病的情况下,来自用临床数据表征的不同的(和已知的)病程阶段。疾病可以是,例如,自身免疫性疾病。其水平与这些不同阶段的疾病的指标相关的克隆型可用于开发一种算法,该算法用于预测所有个体中不同于那些与疾病无关的序列的、与疾病相关的较大组序列的身份。与校准试验的情况不同,相关序列不需要出现在此发现研究中,但可基于这些序列进行预测。例如,相关序列可以是TCR基因的DNA序列,它编码与发现研究中鉴定的克隆型的DNA序列相同的氨基酸序列。此外,可预测一种或多种相关克隆型的算法可以用于鉴定来自任何个体的样品中的克隆型,并且它绝不是给定个体独特的,因此,允许对新样品中的相关克隆型进行预测,而不需要预先知道该个体中存在的克隆型。一方面,提供了一种用于开发预测来自患病受试者的任意样品中的一种或多种相关克隆型的算法的方法,该方法包括:a)从一组样品产生多个克隆型谱,其中该样品与疾病相关,b)从这组样品鉴定一种或多种相关克隆型,c)利用b)中鉴定的一种或多种相关克隆型的序列参数和/或功能数据来开发可预测来自患病受试者的任意样品中的相关克隆型的算法。在一个实施方案中,这组样品可以取自一种或多种受疾病累及的组织。在另一实施方案中,鉴定一种或多种相关克隆型包括比较来自至少两个样品的克隆型谱。在另一实施方案中,所述功能数据包括T细胞和/或B细胞中标记物的结合能力,或T细胞或B细胞与抗原的相互作用。在另一实施方案中,所述序列参数包含核酸序列和预测的氨基酸序列。在另一实施方案中,样品来自一个或多个处于疾病高峰阶段的个体。在另一实施方案中,所述一种或多种相关克隆型在疾病闻峰状态存在。在另一实施方案中,所述一种或多种相关克隆型在疾病闻峰状态处于闻水平。在另一实施方案中,一种或多种相关克隆型在疾病闻峰状态处于低水平。在另一实施方案中,一种或多种相关克隆型在疾病高峰状态不存在。在一个实施方案中,所述疾病是自身免疫性疾病。在另一实施方案中,自身免疫性疾病是系统性红斑狼疮、多发性硬化症、类风湿关节炎或强直性脊柱炎。另一方面,提供了一种用于发现个体的一种或多种相关克隆型的方法,该方法包括:a)将来自个体的样品的克隆型谱输入算法中,以及b)运用该算法来确定该个体的一种或多种相关克隆型。该算法可以是通过以下步骤开发的算法:a)从一组样品产生多个克隆型谱,其中该样品与疾病相关,b)从这组样品鉴定一种或多种相关克隆型,以及c)使用b)中所鉴定的一种或多种相关克隆型的序列参数和/或功能数据来开发可以预测来自患病受试者的任意样品中的相关克隆型的算法。在一些实施方案中,相关克隆型是群体中存在的已鉴定的克隆型,该群体已暴露于与疾病状态之外的状态相关的抗原。该状态可包括暴露于非致病抗原,诸如针对当地花粉的亚症状变态反应。该实施方案可用于确定个体近期是否到过含有该抗原的地方。该状态可以包括暴露于与工业过程或生物恐怖制剂的制造或生产相关的抗原。D.结合群体研究利用校准试验发现相关和不相关克隆型在本发明的一个实施方案中,通过利用结合群体研究的校准试验来鉴定相关克隆型。在该实施方案中,群体研究并不产生能够在任意样品中预测克隆型的算法,而是允许开发一种算法,该算法用来预测来自受试者(已对其产生特定校准克隆型谱)的任何样品中的相关克隆型。这一实施方案的一个实例是开发一种算法,在临床爆发期首次进行血液检验用来校准该算法后的任何疾病阶段,该算法能够基于从血液样品检测的克隆型谱预测狼疮患者的相关克隆型。因此,在该实施方案中,可以通过以下步骤鉴定相关克隆型:(a)从来自与疾病相关的或受疾病累及的组织的一组样品产生克隆型谱,以根据水平和/或功能鉴定一组与该疾病相关的克隆型,以及鉴定这种水平和/或功能与疾病状态之间的关系;
(b)确定来自该疾病第一状态的组织的样品的克隆型谱;(C)根据步骤(a)的关系确定相关克隆型。在另一实施方案中,可以通过以下步骤鉴定相关克隆型:(a)从来自与疾病相关的或受疾病累及的组织的一组样品产生克隆型谱,以根据水平和/或功能来鉴定一组与该疾病相关的克隆型,以及鉴定这种水平和/或功能与疾病状态之间的关系;(b)测定处于高峰期的相关疾病阶段或来自疾病累及的组织或处于功能表征阶段的新受试者的校准克隆型谱;(C)根据步骤(a)的关系确定相关克隆型。在该实施方案中,本发明包括通过在样品研究中对免疫细胞组库进行测序来鉴定相关和不相关克隆型的方法,所述样品来自不同时期的患者和任选的健康对照,以及在患者患有疾病的情况下,来自用临床数据表征的不同(和已知的)病程阶段。在第一状态与在第二状态以不同频率(或水平)存在的克隆型随后用于开发一种算法,该算法用来预测在处于第一疾病状态的每个个体的组库中发现的哪个序列将在每个个体中与后续状态的疾病相关,该序列不同于那些在该个体中与疾病无关的序列。与单独进行校准试验的情况不同,相关序列可以是发现在疾病状态之间不同的所有序列的一个亚组。也可能未在校准样品中发现相关克隆型,但是如果它们在未来的样品中出现,则基于该算法会预测为相关的。作为一个例子,基于由群体研究产生的算法,与在校准样品中发现的克隆型编码相同氨基酸序列的克隆型可被预测为相关克隆型。不同于之前的实施方案,开发该算法用来基于校准克隆型谱预测相关克隆型,所述校准克隆型谱是在个体中产生的克隆型谱,该个体的相关克隆型将在疾病的特定状态被预测。在该实施方案中,直至测定出特定的校准克隆型谱,该算法才能用于产生特定个体中的相关克隆型。在特定受试者中测定该校准谱后,所有随后的相关克隆型都可基于该个体中克隆型谱的测定进行预测。另一方面,提供了一种用于发现个体的一种或多种相关克隆型的方法,该方法包括:a)将来自该个体的样品的克隆型谱输入算法,以及b)利用该算法确定该个体的一种或多种相关克隆型。该算法可以是通过以下步骤开发的算法:a)从一组样品产生多种克隆型,其中所述样品与疾病相关,b)从该组样品鉴定一种或多种相关克隆型,以及c)使用步骤b)中所鉴定的一种或多种相关克隆型的序列参数和/或功能数据来开发可以预测来自患病受试者的任何样品中的相关克隆型的算法。在一个实施方案中,在疾病的高峰状态获取样品。在另一实施方案中,从受疾病累及的组织中获取样品。在一些实施方案中,针对已暴露于与疾病状态以外的状态相关的抗原的群体中存在的克隆型,利用校准试验结合群体研究来确定相关和不相关克隆型。该状态可包括暴露于非致病抗原,诸如对当地花粉的亚症状变态反应。该实施方案可用于确定个体近期是否去过含有该抗原的地方。该状态可包括暴露于与工业过程或生物恐怖制剂的制造或生产相关的抗原。El.可用于预测相关克隆型的序列相关参数为了进行群体研究,可以利用训练组通过检测各种能够区分相关克隆型与不相关克隆型的参数来理解相关克隆型的特征。这些参数包括所用的序列或特定的V、D和J区段。在一个实施方案中,显示特定V区段更可能与某些疾病相关,如果特定疾病的克隆型可能识别相关的表位,并因此可能具有序列相似性,则通常是这种情况。在又一实施方案中包括其他参数,这些参数包括所鉴定的体细胞超突变的程度、在发作高峰时的克隆型水平、以及当疾病相对不活动时的克隆型水平。能预测相关克隆型的其他参数包括但不限于:1)包括V或J区、组合VJ、DJ区内的短序列的序列基序;2)该克隆型的序列长度;3)该克隆型的水平,包括绝对水平(每百万分子的克隆数)或等级水平;4)氨基酸和核酸序列与其他克隆型的相似度:其他高度相关的克隆型的频率,包括那些具有沉默变化(编码相同氨基酸的核苷酸差异)的克隆型或那些具有保守氨基酸变化的克隆型;5)对于BCR,该克隆型中的体细胞突变的水平和/或与某些种系克隆型的差别在于体细胞突变的不同克隆型的数量;6)其相关蛋白质具有相似的三维结构的克隆型。E2.编码抗原特异性抗体的克隆型数据库该相关克隆型可编码对于一种或多种抗原的一种或多种表位而言为特异性的免疫球蛋白或TCR。因此,在本发明的一个方面,可通过将测得的克隆型与数据库项进行比较来确定相关克隆型,该数据库包含对于一种或多种选定的抗原来说基本上所有可能的克隆型(即,“抗原特异性克隆型数据库”)。可通过对淋巴细胞的抗体编码序列的选定区域进行测序来构建此类数据库,该淋巴细胞的抗体编码序列产生对于感兴趣的抗原或表位具有特异性的抗体,或者可通过使用在其表面上表达和展示抗体或其片段的噬菌体进行结合试验来构建此类数据库。后一过程易于执行,如Niro等人,Nucleic Acids Research,38(9):ell0(2010)中所述。简单来说,一方面,所述方法包括以下步骤:(a)感兴趣的抗原,例如HCV核心蛋白,与固相支持体结合,(b)噬菌体编码的抗体库在抗体结合条件下暴露于抗原,以便一部分噬菌体编码的抗体结合到结合抗原上,而另一部分仍处于游离状态,以及
(c)收集结合的噬菌体编码的抗体并对其测序,以创建相关克隆型的数据库项。利用如上所述的高通量DNA测序技术方便地对结合的噬菌体编码的抗体进行测序。在一个实施方案中,本方法的克隆型编码结合化合物的单链可变片段(scFv)。可以使用不同严格性的抗体结合条件。由结合的噬菌体确定的核酸序列可以制成表格,并输入到合适的抗原特异性克隆型数据库中。F.改善相关克隆型测定的功能数据又一实施方案将利用功能数据协助鉴定相关克隆型。例如,可通过标准方法例如FACS或MACS捕获在包含相关克隆型的细胞中富集的含有某些标记物的T细胞和/或B细胞。在另一实施方案中,该标记物是细胞表面标记物。在另一实施方案中,T细胞和/或B细胞对与病理学相关的抗原或对受累组织的反应性将是克隆型的病理学相关性的良好证据。在另一实施方案中,可合成候选克隆型的序列,并置于完全TCR或BCR的环境中,以及评估相关反应性。或者,可将不同序列的扩增片段输入噬菌体、核糖体或RNA展示技术。可针对具有相关反应性的序列来选择这些技术。对选择之前和之后的测序结果的比较可鉴定那些具有反应性并因此可能是病理性的克隆。在另一实施方案中,特异性展示技术(例如噬菌体、核糖体或RNA展示)可以以阵列形式使用。携带来自TCR或BCR的个体序列(例如⑶R3序列)的个体分子(或这些个体分子的扩增)可以排列为噬菌体、核糖体或RNA。然后可以研究特异性抗原,以鉴定编码与其结合的肽的序列。结合与疾病相关的肽的抗原可能是病理性的。G.产生免疫负荷算法算法可用于计算由相关克隆型和不相关克隆型的功能水平给出的免疫负荷、值或评分。所述免疫负荷可用来作出临床决定。使用实验(例如,包含来自处于疾病第一状态的受试者的样品和来自处于疾病第二状态的受试者的样品的实验)数据,可以开发一种将相关和不相关克隆型水平的信息结合成单一评分(免疫负荷)的算法。然后调整该算法的参数以最大化免疫负荷和临床数据间的相关性。例如,临床数据可以是疾病严重程度的临床度量(例如,MRI显示的多发性硬化症患者的病变程度)。因此,在一个实施方案中,可以通过以下步骤计算免疫负荷:(a)开发一种使用一组因素将相关克隆型水平结合成单一疾病活动性评分的算法;(b)将步骤(a)中产生的评分与关于疾病状态的临床数据进行比较;以及(C)优化这些因素从而最大化临床数据与疾病活动性评分之间的相关性。产生免疫负荷算法中所用的相关克隆型可以利用如上所述的校准试验、群体研究或校准试验和群体研究来产生。在结合相关克隆型中可以考虑的一些因素为相关克隆型的数量、它们的水平、它们的变化率(速度),以及速度的变化率(加速度)。其他需要评估的因素包括处于发作高峰期和非活动疾病状态的克隆型的水平。在一个实施方案中,产生的免疫负荷与自身免疫性疾病相关。该负荷可称为自身免疫负荷。一方面,提供了一种用于产生计算疾病活动性评分的算法的方法,该方法包括:a)开发一种使用一组因素将相关克隆型水平结合成疾病活动性评分的算法,b)将疾病活动性评分与关于疾病状态的临床数据进行比较,以及c)优化这些因素以便最大化临床数据和疾病活动性评分之间的相关性。H.利用负荷算法监测疾病1.在没有校准试验的情况下监测疾病在本发明的一个实施方案中,利用群体研究来确定克隆型和免疫负荷算法。免疫负荷可以直接使用而不需要先对个体患者进行校准。当患者处于任何疾病状态时,该试验都可进行。该试验可用来基于上述开发的算法产生特异性相关克隆型和不相关克隆型。随后可使用在群体研究中产生的第二算法计算免疫负荷。之后可在临床上使用该评分。在一个实施方案中,可在不使用校准试验的情况下通过以下步骤进行监测试验:(a)在患者被监测时测定患者的克隆型;以及(b)利用由发现算法试验所预测的相关克隆型,以及来自监测试验的数据,利用监测算法产生反映患者疾病状态的评分。另一方面,提供了一种用于监测个体的疾病状态的方法,该方法包括:a)确定来自受试者的样品的克隆型谱,b)将来自a)的克隆型谱信息输入算法,以及c)利用该算法产生预测个体的疾病状态的评分。该算法可以是通过以下步骤产生的算法:a)开发一种使用一组因素将相关克隆型水平结合成疾病活动性评分的算法,b)将疾病活动性评分与关于该疾病状态的临床数据进行比较,以及c)优化所述因素以便最大化临床数据和疾病活动性评分之间的相关性。2.使用校准试验监测疾病在本发明的一个实施方案中,使用校准试验或校准试验和群体研究的结合来确定相关克隆型和免疫负荷算法。免疫负荷可以通过首先进行校准试验而用于临床。当患者处于一种状态,该状态与在产生用于免疫负荷算法的相关克隆型和不相关克隆型的研究中使用的第一状态相似时,可以进行该试验。例如,如果免疫负荷算法是产生于自身免疫性疾病的爆发期,该状态可以是自身免疫性疾病的爆发期。然后该校准试验可用于产生将用于后续疾病监测试验的特异性相关克隆型和不相关克隆型。在对该患者治疗的晚些时候,对患者进行另一个试验,并且可使用发现研究中产生的算法以及在该患者的特异性校准试验中产生的克隆型水平列表来计算免疫负荷。之后该免疫负荷评分可在临床上使用。在一个实施方案中,使用校准试验的监测试验包括以下步骤:(a)检测处于疾病状态I的患者以确定克隆型谱;(b)随后(在患者将要被监测时)测定患者的克隆型;(C)利用监测算法,由来自校准试验的疾病状态I的克隆型谱和后期试验的信息来产生反映疾病状态的疾病评分。另一方面,提供了一种用于监测个体的疾病状态的方法,该方法包括:a)确定来自受试者的样品的克隆型谱,b)将来自a)的克隆型谱信息输入算法,以及c)利用该算法产生预测该个体的疾病状态的评分。该算法可以是由以下步骤产生的算法:a)开发一种使用一组因素将相关克隆型水平结合成疾病活动性评分的算法,b)将疾病活动性评分与有关该疾病状态的临床数据相比较,以及c)优化该因素以便最大化临床数据和疾病活动性评分之间的相关性。在另一实施方案中,该方法可进一步包括通过本发明的任何方法来确定该个体中的一种或多种相关克隆型,以及将关于一种或多种相关克隆型的信息输入该算法。在一个实施方案中,疾病是自身免疫性疾病。在另一实施方案中,该自身免疫性疾病是系统性红斑狼疮、多发性硬化症、类风湿关节炎或强直性脊柱炎。3.与使用免疫负荷相关的其他因素相同的免疫负荷对于不同患者可能意味着不同的情况。举例说明,需要考虑患者的整体临床情况。从试验的角度来看,在作临床决定时,除了免疫负荷的水平外,还可考虑速度(免疫负荷随时间的变化率)和加速度(速度随时间的变化率)。例如,如果自身免疫负荷评分正在上升(高速度),就可预测自身免疫性疾病的初期爆发。可整合到负荷评分(例如,自身免疫负荷评分)中的其他试验包括,例如,红细胞沉降率(ESR)、C-反应蛋白(CRP)水平、抗dsDNA、其他自身抗体效价、补体水平、尿蛋白水平、尿蛋白/肌酐比值、肌酐水平、血尿素氮(BUN)水平、血小板水平、WBC计数、血细胞比容(Hct)、Hb、尿分析结果。与可整合的SLE相关的其他试验包括,例如,⑶27水平、⑶27++细胞水平、INF-响应性基因(Baechler,EC 等人(2003) Proc.Natl.Acad.Sc1.100:2610-2615)和趋化因子评分(Bauer JW等人(2009) Arthritis Rheum.60:3098-3107)。其他与狼疮不相关的试验包括,例如,促甲状腺激素(TSH)试验、三碘甲状腺原氨酸(T3)试验、甲状腺素(T4)试验、肝功能试验(LFT)、其他自身抗体、钙卫蛋白试验、乳铁蛋白试验和滑液分析。另外的试验可包括成像试验,包括,例如,MR1、CT-扫描、X-射线和超声波。1.利用测序技术结合部分细胞富集,作为校准步骤的一部分来寻找相关克隆型有几种技术可用于基于细胞标记物分离血液或组织中的细胞。这些技术包括固相分离,如微珠或柱体,其上固定有诸如抗体的特异性亲和试剂。液相分离可使用如流式细胞术等技术来实现,其中利用特异性结合选定的细胞标记物的标记试剂引导门控流装置,在该装置中,特异性荧光标记物可用于分离如此标记的细胞。白细胞去除术是另一种液相分离技术,可用于富集血液中的白细胞群,例如,Shelat, Am.J.Med.123:777-784(2010);美国专利5,846, 928 ;等等,随后可利用细胞表面标记物进行进一步富集。当对算法进行校准以预测相关克隆型和/或测定这些克隆型的水平以便确定疾病负荷时,对T细胞和/或B细胞的亚群进行谱分析有时将会是有利的。使用以上对于各种表面或内部标记物所述的方法可以完成。使用此类方法的一个挑战在于针对给定标记物的选择性永远不会完美这一事实。因此,富集不太可能产生纯的选定细胞群体。不分离细胞而实现细胞亚群富集的另一种方法是选择性地生长目标细胞亚群。例如,可在体外用抗原激活T细胞,并且可允许激活的细胞分裂从而数量增加,导致它们的富集。在本发明的一个实施方案中,在针对至少一种细胞标记物富集前后,通过对空间分离的个体分子进行测序而产生T细胞群和/或B细胞群的克隆型谱。然后比较这两个谱以确定哪些克隆型在富集的和未富集的细胞群之间具有显著变化的频率,从而鉴定与携带为富集而选定的标记物的细胞相关的克隆型。在实现该鉴定中使用测序方法的优势是,由于在足够的测序深度下能够很好地测定克隆型频率,即使富集相对较差,也可以鉴定克隆型。这转而允许常规而廉价地使用多种富集方法,因为不需要为了达到纯度而设计昂贵的多重富集。在一个实施方案中,在细胞富集前后对T细胞受体和B细胞受体的这种测序可作为校准算法的一部分,用以确定哪些克隆型是相关的。在该实施方案中,在针对与处于第一疾病状态的疾病相关的标记物富集前后,对细胞进行测序。该第一疾病状态的实例是:处于该疾病高峰状态的血液样品、受累及的组织样品、处于疾病高峰状态的受累及的组织样品,等等。这样从含有和不含细胞标记物的细胞部分获得克隆型,并且可以将其输入算法,随后用来确定该个体中的相关克隆型。在另一实施方案中,不仅对第一疾病状态期间收集的样品进行富集,而且对来自同一个体的后续样品进行富集。这样,就能确定处于任何时间的细胞亚部分中的相关克隆型。在另一实施方案中,细胞标记物与测序结合使用,不仅用来评估特异性相关克隆型的频率,而且用来评估它们的功能状态。在该实施方案中,细胞标记物提供超出相关克隆型的身份之外的信息,因为它们可改善根据相关克隆型的频率对疾病状态的预测。在利用特异性标记物富集的前后进行测序,确定了特异性克隆型的频率。此外,确定了含有这种特异性克隆型和其他细胞标记物的细胞的频率和分数。考虑这种情况,有两位患者,他们在含有与某些临床状态相关的克隆型的细胞中具有相同频率的这些克隆型,但具有不同频率的特定细胞标记物(例如,激活标记物)。这些患者尽管具有相同频率的相关克隆型,但可能具有不同的疾病活动性。细胞标记物可以是细胞激活标记物。通常,可通过利用已知与疾病相关的T细胞和/或B细胞群体测定基因表达来确定标记物。这些标记物可以是细胞表面标记物或细胞内表达的标记物。在本发明的一个实施方案中,富集表现出对已知与特定疾病相关的抗原具有亲和性的细胞。有多种方法可以进行该富集。在另一实施方案中,感兴趣的细胞是与特定抗原相互作用的B细胞。在这种情况下,将会存在具有与该特定抗原结合的B细胞受体序列的B细胞。这些B细胞受体因此可用作细胞表面标记物,该细胞表面标记物可使用抗原特异性试剂进行富集。在一个实施方案中,其上固定有抗原的微珠或柱子可用于富集表达特异于该抗原的B细胞受体的细胞。在另一实施方案中,抗原为多聚体,例如四聚体,以便提高表达适当的B细胞受体的细胞的亲和力。在另一实施方案中,可用荧光标记的抗原试剂来标记这些细胞。然后可用基于荧光标记进行分选的流式细胞术来富集这些细胞。在流式细胞术方法中,该过程可与B细胞的其他标记物结合进行。在另一实施方案中,荧光抗原试剂为多聚体,以便提高表达适当的B细胞受体的细胞的亲和力。本发明的一个方面是可以确定不同克隆型与特异性抗原相互作用的强度。通过抗原相互作用富集克隆型的程度提供了相互作用强度的度量。结果,代替传统的抗体“效价”水平,可以获得更详细的信息。具体来说,可以确定具有不同亲和力的不同克隆型的频率。在一个实施方案中,在富集中所用的抗原是单一分子种类。在另一实施方案中,抗原是与疾病相关的抗原的复杂混合物。该抗原可以是一种细胞类型或多种细胞类型的混合物。在另一实施方案中,感兴趣的细胞是在MHC分子的环境中与特异性抗原相互作用的T细胞。在一个实施方案中,与MHC分子复合的肽用于捕获相关细胞。MHC-肽复合物的四聚体先前已经成功用于此目的。在另一实施方案中,将含有能够呈递抗原的细胞和T细胞的血液或相关组织与抗原一起温育,以允许将肽呈递给T细胞。之后可以根据某些激活特征来富集通过与这些抗原结合而激活的细胞。可利用潜在的任何激活特征,如细胞增殖、白细胞迁移、细胞毒性和/或激活标记物的表达。例如,激活的细胞增殖,并且能够使得它们分裂并富集。相似地,激活的细胞能够表达一些可用于捕获它们的标记物。这些标记物可以是表面标记物或某些内部标记物,如细胞因子,诸如INFy、IL-2或IL-17。可使用不同的技术,诸如FACS或抗细胞表面标记物抗体包被的微珠,而轻易地捕获表达该表面标记物的细胞。还开发了捕获表达细胞内标记物(特别是细胞因子)的细胞的技术。一种技术被称为细胞内细胞因子染色。在该方法中,特异于讨论中的免疫过程的细胞因子在T细胞内被捕获,随后将T细胞通透化,从而允许使用荧光抗体标记这些特异性细胞因子。之后可以使用流式细胞术富集这些标记的细胞。另一种方法,细胞因子捕获,利用具有双重特异性的杂合抗体。一种特异性是针对所有T细胞(如MHC分子)中的一些通用标记物,而另一种是针对感兴趣的细胞因子,例如,INFr、IL-2或IL-17。通用特异性将抗体附着在所有T细胞的表面,然后用附着在相同细胞上的抗体捕获从T细胞释放出的细胞因子。然后,可以使用针对相关细胞因子的荧光抗体,从而允许用FACS捕获相关细胞。
本发明的一个方面是可以确定不同克隆型与特定抗原相互作用的强度。通过抗原相互作用富集克隆型的程度提供了该相互作用的强度的度量。因此,能够确定具有不同亲合力的不同克隆型的频率。在一个实施方案中,在富集中所用的抗原是单一分子种类。在另一实施方案中,抗原是与疾病相关的抗原的复杂混合物。抗原的复杂混合物可以是一种细胞类型,或多种细胞类型的混合物。J.用于检测潜在性感染复发的抗原富集在传染病中,不仅经常检测病原体的存在或不存在,而且还经常检测和监测对该病原的免疫应答。因此,免疫系统针对特定病原体抗原而产生的抗体的检测是常规临床实践中的一种方法。然而,这种通过抗体测定的对特定病原体抗原的免疫应答不能够给出对该抗原的免疫应答的全面见解。检测的抗体可能是许多不同的B细胞克隆的产物,每个克隆表达略微不同的抗体,每个抗体可携带略微不同的关于该疾病状态的信息。此外,根本没有检测对这些抗原的T细胞应答。使用本发明公开的方法可以非常全面地分析患者对病原性感染的免疫应答。在一个实施方案中,在疾病过程中的一个时间点使用B细胞富集可以全面地检测感染病原体的个体中的B细胞应答,以确定与响应于该感染的抗体相关的B细胞克隆型。为了实现此目的,可以通过使用在讨论的病原体中存在的抗原进行富集,来确定对病原体的免疫应答所涉及的B细胞。这些抗原可以是单一抗原种类、一组不同的抗原种类或来自病原体(包括来自病原体的整个细胞)的抗原的复杂混合物。然后将此类抗原固定在固体表面上或进行荧光标记,并且在抗原被突光标记的情况下,使用基于微珠的结合方案、基于柱子的结合方案或流式细胞术方法进行富集。在富集前后,通过在两个维度上分离来自B细胞受体的个体DNA或RNA分子,并对个体分子进行测序,以形成BCR克隆型谱,从而对来自患者的细胞进行谱分析。然后在两个克隆型谱之间显示显著的频率偏移的克隆型序列被候选为负责针对一种或多种抗原的免疫应答的克隆型。可以任选地开发进一步的算法以完善关于哪些克隆型有可能与该特异性免疫应答相关的预测。这些算法可以使用序列参数,诸如频率、序列长度、氨基酸序列相似性、与其他类似克隆型序列(包括那些通过体细胞超突变产生的序列)的相似度,等等。在一个优选的实施方案中,在一个校准时间点及时完成抗原捕获以鉴定相关的B细胞,并在随后的谱分析时间点上不进行抗原捕获,在这个时间点上无需富集而对所有B细胞进行谱分析。在另一实施方案中,测定T细胞应答。为了实现该目的,通过使用在讨论的病原体中存在的抗原进行富集而确定在针对病原体的免疫应答中涉及到的T细胞。这些抗原可以是单一抗原种类、一组不同的抗原种类或来自病原体(包括来自病原体的整个细胞)的抗原的复杂混合物。在一个实施方案中,MHC-抗原复合物的四聚体用于荧光标记T细胞。在另一实施方案中,至少在第一时间点将此类抗原加入到患者的血液中,并进行温育,以使抗原性肽能够被该个体的抗原呈递细胞所呈递。在这两个实施方案中,在使用MHC-抗原复合物的四聚体、内部细胞因子染色方法或细胞因子捕获和FACS分选富集这些T细胞之前和之后,对来自血液样品的单独空间分离的RNA或DNA分子进行谱分析。在两个克隆型谱之间显示显著的频率偏移的T细胞克隆型序列随后被候选为负责针对一种或多种抗原的免疫应答的克隆型。可任选地开发进一步的算法以完善关于哪些克隆型可能与该特异性免疫应答相关的预测。这些算法可以使用序列参数,诸如频率、序列长度、氨基酸序列相似性、与其他类似的克隆型序列的相似度,等等。在一个优选的实施方案中,在一个校准点及时完成抗原捕获以鉴定相关的B细胞,并在随后的谱分析时间点不进行抗原捕获,在这个时间点上无需富集而对所有B细胞进行谱分析。IV.确定疾病状态由于免疫系统对人类健康是如此重要,测定免疫应答的能力在医学中具有广泛的应用。本发明教导了当潜在的疾病状态由免疫系统介导时使用免疫系统理解潜在的疾病状态的能力。这使得一组非常有效的使用免疫谱的诊断和预后应用能够告知许多临床结果的风险,并允许医生更有效地进行干预。A.免疫谱分析在自身免疫性疾病治疗中的应用本发明的方法能够用于诊断和治疗受试者的自身免疫性疾病。自身免疫性疾病涉及适应性免疫细胞逃脱提供自身免疫性的正常过程,并且攻击身体组织上的一些靶标。自身免疫性疾病包括,例如,急性播散性脑脊髓炎、爱迪生氏病、强直性脊柱炎、抗磷脂抗体综合征、自身免疫性溶血性贫血、自身免疫性肝炎、自身免疫性内耳病、白塞氏病、大疱性类天疱疮、乳糜泻、查加斯病、慢性阻塞性肺病、皮肌炎、I型糖尿病、古德帕斯丘氏综合征、格雷夫斯氏病、格林-巴利综合征、桥本氏甲状腺炎、化脓性汗腺炎、特发性血小板减少性紫癜、间质性膀胱炎、多发性硬化症、重症肌无力、神经性肌强直、寻常型天疱疮、恶性贫血、多肌炎、原发性胆汁性肝硬化、类风湿关节炎、硬皮病、系统性红斑狼疮、舍格伦综合征以及血管炎综合征。这些自身免疫性疾病的阶段可以使用本发明的方法来诊断。可基于自身免疫性疾病的阶段向受试者建议治疗。关于患有自身免疫性疾病或疑似患有自身免疫性疾病的受试者的临床信息,可以用于确定疾病状态(或AutoImm load(自身免疫负荷))。临床信息可以用于确定与疾病状态相关的克隆型谱的模式。临床信息可包括,例如,身高、体重、眼球颜色、年龄、性别、民族、血压、LDL胆固醇水平、HDL胆固醇水平、家族医学史以及分子标记物信息。临床信息可包括一种或多种自身免疫性疾病的症状。对于自身免疫性肝炎,症状可以包括疲劳、肝肿大、黄疸、瘙痒、皮疹、关节痛、腹部不适、蛛状痣、恶心、呕吐、厌食、黑尿、浅色或灰色粪便。对于皮肌炎(DM),症状可包括皮疹(面部、颈部、肩部、上胸部、肘、膝盖、指关节和背部的斑块状、蓝紫色变色)伴有或先前有肌无力、吞咽困难、肌痛、疲劳、体重减轻和低热。对于格雷夫斯氏。⒆纯梢园ㄓ捎谀芰肯脑黾佣⑸奶逯丶跚、食欲增加、心率和血压升高,以及震颤、神经质和出汗。对于桥本氏甲状腺炎,症状可以包括精神和躯体放缓、对寒冷更强的敏感性、体重增加、皮肤变粗糙、甲状腺肿大。对于混合性结缔组织病(MCTD),症状可以包括系统性红斑狼疮(SLE)、硬皮症和多肌炎的特征。对于大疱性类天疱疮(BP)症状可以包括轻微的瘙痒伤痕到严重的水疱和感染、口腔或食道大疱。对于天疱疮,症状可以包括皮肤和粘膜起疱。对于恶性贫血,症状可以包括呼吸短促、疲劳、脸色苍白、心跳过速、食欲不振、腹泻、手脚麻刺感和麻木、口腔溃疡和步态不稳。对于多肌炎(PM),症状可以包括肌无力、吞咽困难和肌痛。对于原发性胆汁性肝硬化(PBC),症状可以包括疲劳和瘙痒。对于硬皮病(系统性硬化症),症状可以包括手指或手部的肿胀和虚肿、皮肤增厚、手指皮肤溃疡、手部关节僵硬、疼痛、咽喉痛和腹泻。对于舍格伦综合征,症状可以包括眼睛和口干燥、颈部腺体肿胀、吞咽或讲话困难、味觉或嗅觉异常、口渴和舌头溃疡。对于系统性红斑狼疮(SLE),症状可以包括发热、体重减轻、脱发、口鼻疮、不适、疲劳、癫痫和精神病症状、与RA相似的关节炎症、鼻子和脸颊上有蝶形皮疹、手脚对冷有极度的敏感性。对于血管炎综合征,例如,韦格纳肉芽肿病、特发性新月性肾小球肾炎(ICGN)、微镜多关节炎(MPA)、肺肾综合征(PRS),症状可以包括疲劳、虚弱、发热、关节痛、腹痛、肾脏问题和神经问题。临床信息可以来自在一个或多个时间点上的一个或多个受试者。临床信息可以包括关于患有自身免疫性疾病的受试者对于该受试者已接受的一种或多种治疗的应答的信息。以下探讨了 AutoImm Load对于特定自身免疫性疾病的临床应用。本发明的另一实施方案涉及免疫谱分析试验与其他已经用于检测这些疾病的疾病活动性的标记物的组合,以使试验具有更高的灵敏度和特异性。其他分子识别符或标记物可以用于计算AutoImmLoad或用于确定疾病状态。分子识别符可以包括核酸、蛋白质、碳水化合物和脂质,以及核酸或蛋白质的表达谱。分子识别符可以是人来源或非人来源(例如,细菌)的。识别符或标记物可以通过包括,例如,比较基因组杂交(CGH)、染色体微阵列分析(CMA)、表达谱分析、DNA微阵列、高密度寡核苷酸微阵列、全基因组RNA表达阵列、肽微阵列、酶联免疫吸附试验(ELISA)、基因组测序、拷贝数(CNV)分析、小核苷酸多态性(SNP)分析、免疫组织化学、原位杂交、荧光原位杂交(FISH)、PCR、Western印迹法、Southern印迹法、SDS-PAGE、凝胶电泳和Northern印迹法的技术来确定。对于系统性红斑狼疮,标记物可以包括红细胞沉降率(ESR)的水平、C-反应蛋白(CRP)水平、抗-dsDNA、其他自身抗体效价、补体水平、尿蛋白水平、尿蛋白/肌酐比值、肌酐水平、血尿素氮(BUN)水平、血小板水平、白细胞计数、血细胞比容(Hct)、Hb和尿分析结果。其他例如与SLE相关的能够整合的检验包括,例如,⑶27水平、⑶27++细胞水平、INF-应答性基因和趋化因子评分。1.系统性红斑狼疮(SLE)本发明的方法可以用于确定系统性红斑狼疮(SLE或狼疮)的状态或阶段。SLE是一种严重的自身免疫。3U勰ツ昵岢赡耆(女性占大多数)。它以炎性过程为特征,可以影响包括皮肤、关节、肾脏、肺、心脏和中枢神经系统在内的许多器官,经常会导致残疾,有时导致死亡。该疾病遵循一个非常不可预测的过程,其特点是爆发期后接着是静止的缓解期。然而,诊断为SLE的患者定期看风湿病医生并用多种强效药物进行治疗。这些药物包括类固醇,诸如强的松和其他免疫抑制剂诸如骁悉(Cellcept)(吗替麦考酚酯)。虽然这些药物可以降低器官损伤,但他们具有显著的副作用,包括感染和不孕的风险。某些症状(例如,疼痛和疲劳)的不可靠性和不可预知的疾病过程使得制订药物剂量很困难,从而导致对某些患者过度治疗,而对其他患者却治疗不足。因此,SLE的治疗对于临床医生是巨大的治疗挑战。临床医生可使用许多标准方法评估SLE的活动性。疾病的状态可以通过观察该病的临床症状来测量。这些方法包括体征(例如,皮疹)和症状(例如,关节痛和疲劳)的评估,以及实验室结果(例如,尿蛋白/肌酐比值、抗-dsDNA抗体和血细胞计数)。然而,这些临床指标可能是疾病状态的滞后指示,患者也许仅仅在治疗的数周或数月后就有反应。此外,在一些情况下,很难精确地评估症状(例如,疼痛和疲劳)。其他炎症指标,例如抗-dsDNA抗体、补体水平(例如,C3)、C反应蛋白(CRP)和红细胞沉降率(ESR)通常缺乏特异性和/或灵敏性。侵入性方法诸如肾脏活检对于常规使用来说是不切实际的。因此,临床医生要对他们的患者进行相当频繁的检测,却没有针对疾病状态的完美测量值。在一些测量中,将临床症状和实验室评估整合起来,诸如系统性红斑狼疮疾病活动指数(SLEDAI)和医师整体评估(PGA)。在临床实践中这些测量并不是常规的,并且在一些临床情况下常常存在不足。在本发明的一个实施方案中,鉴定了针对不同疾病状态代表不同免疫谱的克隆型。然后通过比较所鉴定的免疫谱与患者当前的免疫谱来跟踪该疾病的状态。该疾病可以是狼疮。该疾病状态可以是爆发期和非爆发期。该免疫谱可以用作爆发状态的早期指示。这可以推动治疗决定。在实施例部分更详细地讨论了 AutoImm Load在进行SLE治疗性干预中的应用的具体实例,以及确定AutoImm Load的具体的特定可行性研究。在一方面,SLE相关的克隆型与自身抗原特异性抗体有关。因此,确定个体患有系统性红斑狼疮的可能性的方法包括以下步骤:(a)确定该个体的B细胞样品的克隆型谱,该样品包含其克隆型的组库;以及(b)将该克隆型谱的克隆型与抗原特异性克隆型数据库的克隆型进行比较,以确定克隆型匹配的水平,从而确定系统性红斑狼疮的可能性,该抗原特异性克隆型数据库包括对于一种或多种抗原特异性的人免疫球蛋白链的基本所有克隆型,所述一种或多种抗原选自:双链DNA、丙二醛、4-羟基壬烯醛、超氧化物歧化酶、硝基酪氨酸、心磷脂、核糖体P蛋白、磷脂、小核核糖核蛋白的核心蛋白(Smith抗原)、组蛋白、Ul小核核糖核蛋白、I型拓扑异构酶、着丝粒蛋白质、SS-A核糖核蛋白、SS-B核糖核蛋白和组氨酸-tRNA连接酶。2.多发性硬化症(MS)本发明的方法也可以用于确定多发性硬化症(MS)的状态或阶段。MS是一种影响脑部和脊髓(中枢神经系统)的自身免疫性疾病。由于每次疾病发作的位置和严重程度可能不同,症状也不同。发作可持续数天、数周或数月。这些发作与症状减轻或无症状时期(缓解期)交替出现。疾病的再现(复发)是常见的。然而,该疾病可能持续恶化而无缓解期。因为脑部或脊髓的任意部分的神经都可能受到损伤,多发性硬化症患者在身体的许多部位都有症状。肌肉症状包括,例如,失去平衡、麻木或某些部位感觉异常、由于肌肉痉挛而引发的疼痛、手臂或腿部疼痛、手臂或腿移动存在问题、行走问题、协调性和小动作存在问题、发音含糊或言语难以理解、一个或多个手臂或腿部的震颤、肌肉群不受控制的痉挛(肌肉痉挛)以及一个或多个手臂或腿部的无力。眼部症状包括,例如,复视、眼睛不适、不受控制的眼球快速运动和视觉丧失(通常每次影响一只眼睛)。其他脑部和神经症状包括,例如,注意力持续时间减少、判断力下降、记忆力下降、沮丧或感觉悲伤、头晕和平衡性问题、脸部疼痛、听力丧失以及疲劳。肠和膀胱的症状包括,例如,便秘、开始排尿困难、尿频、漏便、尿急以及漏尿(失不乂。
目前没有已知的治愈多发性硬化症的方法。然而,存在可减缓该疾病的治疗方法。治疗的目的是为了控制症状以及帮助患者维持正常的生活质量。用于减缓多发性硬化症进展的药物可包括,例如,帮助控制免疫系统的免疫调节剂,包括干扰素(Avonex、Betaseron或Rebif)、单克隆抗体(Tysabri)、醋酸格拉替雷(Copaxone)、米托蒽醌(Novantrone)、甲氨蝶呤、硫唑嘌呤(Imuran)、环磷酰胺(Cytoxan)和那他珠单抗(Tysabri)。类固醇可以被用来减低疾病发作的严重性。用来控制症状的药物可包括,例如,缓解肌肉痉挛的药物,诸如力奥来素(Baclofen)、替扎尼定(Zanaflex)或苯二氮革f减少泌尿问题的胆碱能药物,用于情绪或行为症状的抗抑郁药,以及针对疲劳的金刚烷胺。MS影响女性多于男性。该疾病最?加20岁到40岁之间,但是可以在任何年龄段内发现。MS是一种进行性疾。馕蹲派窬鹕(神经变性)随时间而恶化。MS恶化的速度因人而异。当身体的自身免疫细胞攻击神经系统时,发生炎症。炎症的反复发作可以发生在脑部和脊髓的任何部位。有MS家族史的人和那些生活在MS较高发病率的地理区域的人具有较闻的患病风险。MS的症状可能模拟了许多其他神经系统疾病的症状。该疾病可以通过排除其他病状来诊断。患有一种称为复发缓解型MS的人可能有至少两次被症状缓解期或无症状期隔开的疾病发作的历史。如果中枢神经系统的两个不同部分的功能在两个不同的时间发生减退(例如异常反射),医疗服务人员可能会怀疑是MS。神经学检查可能显示身体的一个区域或遍布身体的许多部位的神经功能减退。诊断多发性硬化症的试验包括,例如,脑脊液检验,包括CSF寡克隆带分析、头部MRI扫描、腰椎穿刺(脊椎穿刺)、神经功能研究(诱发电位检测)以及脊椎MRI。如其他自身免疫性疾病一样,MS遵循具有急性爆发和缓解期的不可预测的过程。治疗方法的数量不断增长,但每个都具有从严重的(体重增加和抑郁)到危及生命(全血细胞减少和PML感染)的副作用,在不同患者间不同的效果,以及高昂的费用。同时,缺少对MS疾病活动性的高度准确的和特异性的常规检测,使得有效地实施治疗的挑战变得复杂。即使没有治疗,临床发作也可能被长时间的阶段(在疾病早期长达数年)分开。此外,可获得的药物降低复发的可能性,但不能完全阻止复发。因此,疾病的活动性是难以评估的,并因此,有一种不适当的疾病活动性的短期测量,能够用于通过测量复发次数或严重性的下降来检测具体的治疗方法是否对给定患者具有疗效。仅有的另一个可用于监测疾病活动性的检查是脑部MRI,用于跟踪损伤的状态,其借助于诸如钆的对比度增强剂来显示损伤状态。然而,这种成像仅仅提供了脑部损伤的综合显示,而缺少特异性和时间分辨率。考虑到花费、缺少特异性和过度造影剂暴露的危险,试图用MRI成像在短于一年的时间长度上跟踪疾病进程是不切实际的。因而,患者经常要以巨大的代价治疗很长时间,而没有任何能够帮助医生调整剂量和/或转换到其他治疗的有效反馈。在本发明的一个实施方案中,鉴定不同疾病状态代表不同免疫谱的克隆型。然后通过将鉴定的免疫谱与患者当前的免疫谱相比较,从而跟踪疾病状态。疾病可以是MS。疾病状态可以是缓解期和活动期。该免疫谱可用作对缓解期或非缓解期的早期指示。这可以推动治疗决定。3.类风湿关节炎(RA)
本发明方法能够用于测量类风湿关节炎患者的疾病状态。类风湿关节炎(RA)是一种慢性的、系统性的炎症性疾病,能够影响许多组织和器官,但主要攻击关节,产生炎症性滑膜炎,这种炎症性滑膜炎常常发展成关节软骨损坏以及关节强直。类风湿关节炎还能够在肺部、心包膜、胸膜和巩膜部位产生弥漫性炎症以及产生结节性病变,最常见于皮肤下的皮下组织。虽然类风湿关节炎的起因是未知的,但是自身免疫对它的慢性和进行性具有关键作用。大约1%的世界人口患有类风湿关节炎,女性比男性高三倍。发病在40至50岁之间最频繁,但是任何年龄的人都可能会患病。它可能是一种致残的和令人痛苦的病状,其能够导致功能和活动性的基本丧失。RA主要是靠症状和体征进行诊断,但是也可以用血液检验(尤其是称作类风湿因子的检验)和X射线来诊断。通常由风湿病医生一关节和结缔组织疾病方面的专家来进行诊断和长期管理。有各种治疗方法可供使用。非药理学治疗包括物理疗法、矫正器以及职业疗法。包括类固醇在内的镇痛药(止痛药)和抗炎药物可用于抑制症状,而缓解疾病的抗风湿药物(DMARD)可用于抑制或终止潜在的免疫过程和阻止长期损伤。如今,更新的一类生物制剂增加了治疗选择。当在临床上怀疑RA时,可以进行免疫学研究,诸如检测类风湿因子(RF,一种特异性抗体)的存在。RF阴性并不能排除RA;相反,关节炎是所谓血清阴性的。大约15%的患者是这种情况。在患病的第一年内,一些个体的类风湿因子更可能呈现阴性,而随着时间转变为血清阳性状态。RF也可见于其他疾病(例如舍格伦综合征)和大约10%的健康人群,因此该试验并不十分特异。由于这种低特异性,已经开发了新的血清学试验,该试验检测所谓的抗瓜氨酸蛋白抗体(ACPA)的存在。如同RF,这些试验仅在所有RA病例的一部分中(67%)是阳性的,但是如果未患RA则极少出现阳性,提供约95%的特异性。正如RF,有证据表明ACPA在许多病例中存在,甚至在临床疾病发病前。对ACPA最常见的试验是抗CCP (环瓜氨酸肽)试验和抗MCV测定(抗突变的瓜氨酸波形蛋白的抗体)。最近,开发了一种用于早期检测RA的血清学即时检测(P0CT)。该检测结合了对类风湿因子和抗MCV的检测,用于诊断类风湿关节炎,并且显示出72%的灵敏度和99.7%的特异性。此外,可以进行多个其他的血液检验以允许检测关节炎的其他起因,诸如红斑狼疮。红细胞沉降率(ESR)、C反应蛋白、全血计数、肾功能、肝酶和其他免疫学检测(例如,抗核抗体/ANA)都在这个阶段进行。铁蛋白水平升高可以揭示血色素沉着病——一种模拟RA,或是斯提耳氏病的体征,斯提耳氏病是血清阴性的、通常在青少年中发生的类风湿病的变型。术语“缓解疾病的抗风湿药物(DMARD) ”最初是指影响诸如ESR和血红蛋白和自身抗体水平的生物学测量的药物,但是现在通常用于指可以降低对骨骼和软骨的损伤率的药物。已经发现DMARD既可以产生持久的症状缓解,也可以延缓或终止病情进展。这是非常重要的,因为这种损伤通常是不可逆的。抗炎药和镇痛药改善疼痛和僵硬,但不能阻止关节损伤或减慢疾病的进展。在风湿病医生中逐步达成以下共识,对于关节的永久性损伤发生在疾病的极早期。过去,通常仅使用抗炎药来开始治疗,并在临床上以及使用X射线评估进展。如果有证据表明开始发生关节损伤,那么将开出更强力的DMARD。超声波和MRI是更加灵敏的关节成像方法,并且已经证明关节损伤发生在比之前想象的更早期以及更多的患者中。X射线检查正常的人常?梢酝ü觳獾絏射线无法显示的病变。现在的目的是在损伤发生前进行治疗。对于为什么早期启动DMARD有益于阻止结构性关节损伤可能有其他原因。从疾病的最早阶段开始,关节就被免疫系统的细胞所浸润,这些细胞以可包含多种正反馈回路(长期观察发现,单一皮质类固醇注射可以长期中止特定关节中的滑膜炎)的方式相互间发送信号。利用有效的DMARD(诸如甲氨蝶呤)尽可能早地打断该过程似乎可以在之后的数年改善RA的结果。长期来看,在症状发生后延缓治疗少至数月可能导致更糟的结果。因此,当患者对治疗的响应性最高并获益最多时,对建立对早期关节炎的最有效的治疗方法具有相当大的兴趣。用于治疗关节炎的传统小分子质量药物包括,例如,化学合成的DMAED:硫唑嘌呤、环孢菌素(环孢菌素A)、D-青霉胺、金盐、羟氯喹、来氟米特、甲氨蝶呤(MTX)、米诺环素和柳氮磺胺吡啶(SSZ)。细胞毒性药物包括环磷酰胺。最常见的副作用涉及肝脏和骨髓毒性(MTX、SSZ、来氟米特、硫唑嘌呤、金化合物、D-青霉胺)、肾毒性(环孢菌素A、肠胃外金盐、D-青霉胺)、肺炎(MTX)、变应性皮肤反应(金化合物、SSZ)、自身免疫性(D-青霉胺、SSZ、米诺环素)和感染(硫唑嘌呤、环孢菌素A)。羟氯喹可造成眼部毒性,虽然这是罕见的,并且由于羟氯喹不影响骨髓或肝脏,它常常被认为是具有最低毒性的DMARD。遗憾的是,羟氯喹不是非常有效的,且依靠其自身常常不足以控制症状。生物制剂可以通过基因工程来生产,包括,例如,肿瘤坏死因子a (TNFa)阻断剂-依那西普(Enbrel)、英夫利昔单抗(Remicade)、阿达木单抗(Humira),白细胞介素I (IL-1)阻断剂-阿那白滞素(Kineret),抗B细胞单克隆抗体-利妥昔单抗(Rituxan),T细胞协同刺激阻断剂-阿巴西普(Orencia),白细胞介素6 (IL-6)阻断剂-塔西单抗(抗-1L-6 受体抗体)(RoActemra、Actemra)。抗炎药包括,例如,皮质类固醇、非留体抗炎药(NSAID,多数也作为镇痛药)。镇痛药包括,例如,扑热息痛(在美国和加拿大称为对乙酰氨基酚)、阿片制剂、地普喹酮和外用利多卡因。治疗RA的挑战在于以下事实:该病是一种长期慢性。傻贾戮哂刑粽叫缘牟屑玻嬖诘亩嘀种瘟品椒ㄖ忻恳恢侄加忻飨缘娜钡。许多DMARD使得患者遭受显著的副作用,这些副作用包括严重感染、癌症或甚至自身免疫性疾病的风险增加。此外,生物来源的药物非常昂贵,而患者可能要经受频繁的注射。对患者启动治疗的医生会面临许多可能的选择。一旦患者开始治疗则期望获取快速的反。粤私饣颊呤欠穸栽诔鱿至俅脖硐种八≡竦牧品ㄓ蟹从。成像技术是不灵敏且昂贵的,并且许多血液标记物(诸如CRP)缺少足够的灵敏性。允许内科医生快速确定疾病状态的试验可以允许他或她快速地将疗法调整为更加有效的疗法,从而使患者免于额外的关节损伤,并且更加有效地使用可利用的昂贵的疗法。从开始治疗起没有经历过任何急性爆发的患者实际上可能仍然经历着临床上未表现的进行性关节炎症损伤。使医生可以从背景中区分该状态的试验将允许调整疗法以努力使患者更接近不经历进行性关节损伤的状态。关于AutoImm Load如何能够用于处理RA患者的具体实例在本文件的实施例部分进一步详细描述。在本发明的一个实施方案中,鉴定针对不同疾病状态代表不同免疫谱的克隆型。然后通过将已鉴定的免疫谱与患者当前的免疫谱进行比较,而跟踪该疾病状态。该疾病是RA。该疾病状态可以是,但是不限于严重炎症和基线时期。这些免疫谱用于推动治疗决定。4.强直性脊柱炎该方法能够用于检测强制性脊柱炎的疾病活动性。强直性脊柱炎(AS,来自希腊语强直,弯曲;椎骨,脊椎),之前被称为Bechterew病、Bechterew综合征以及MarieStrumpell。棺倒亟谘椎囊恢中问剑且恢致匝字⑿怨亟谘缀妥陨砻庖咝约膊。它主要影响脊柱中的关节和骨盆中的骶髂,最终导致脊柱融合。它是具有强烈遗传倾向的脊椎关节病的成员之一。完全融合导致脊柱的完全僵化,这是一种被称为竹节状脊柱的病状。典型的患者是年轻男性,年龄在18至30岁之间,当首次出现该病的症状时,在脊柱的下半部或有时在整个脊柱会伴有慢性疼痛和僵硬,常常伴有从骶髂关节到一侧或另一侧臀部或大腿背部的疼痛。受影响的男性多于女性,约为3: I的比例,通常患有该疾病的男性会经历比女性更加痛苦的过程。在40%的病例中,强直性脊柱炎与眼部的炎症(虹膜睫状体炎和葡萄膜炎)有关,导致发红、眼部疼痛、视力障碍、飞蚊症和畏光。另一种常见症状是全身疲劳,且有时还会恶心。可能会出现少见的主动脉炎、顶端肺纤维化和骶神经根鞘扩张。正如所有血清学阴性的脊柱关节。赡芑岢鱿种讣浊唐(甲剥离)。没有用来诊断AS的直接试验。显示特征性脊柱变化和骶髂关节炎的脊柱临床检查和X射线研究是主要的诊断工具。X射线诊断的缺点是,在X射线证明在平片X射线上发生变化之前,AS的体征和症状通常已经存在了长达8-10年,这意味着在引入适当的疗法前延误了长达10年。早期诊断的选择是对骶髂关节进行断层摄影术和核磁共振成像,但是这些检查的可靠性仍然不清楚。斯考伯试验是在检查中进行的腰椎弯曲度的有用的临床测量。在急性炎症期期间,AS患者有时会显示C反应蛋白(CRP)的血液浓度增加,以及红细胞沉降率(ESR)提高,但是也有许多AS患者的CRP和ESR率未提高,所以,正常的CRP和ESR结果并不总是与患者实际具有的炎症量相符合。有时,AS患者具有正常水平的结果,然而他们的体内却正经历着显著量的炎症。强直性脊柱炎(AS,来自希腊语强直,弯曲;椎骨,脊椎),之前被称为Bechterew病、Bechterew综合征和Marie Strumpell病,脊椎关节炎的一种形式,是一种慢性炎症性关节炎和自身免疫性疾病。它主要影响脊柱中的关节和骨盆中的骶髂,最终导致脊柱融合。它是具有强烈遗传倾向的脊椎关节病的成员之一。完全融合导致脊柱的完全僵化,这是一种被称为竹节状脊柱的病状。有三种主要类型的药物用于治疗强直性脊柱炎:1)抗炎药,包括诸如布洛芬、苯基丁氮酮、吲哚美辛、萘普生的NSAIDJP C0X-2抑制剂,它们能够减轻炎症和疼痛。通过临床证据也证实了阿片类止痛药在缓解AS患者通常所经历的慢性疼痛方面是非常有效的,特别是在延时释放制剂中。2)DMARD,诸如环孢菌素、甲氨蝶呤、柳氮磺胺吡啶和皮质类固醇,用于通过免疫抑制来降低免疫系统响应;3) TNF α阻断剂(拮抗剂),诸如依那西普、英夫利昔单抗和阿达木单抗(也称为生物制剂),指示免疫抑制剂的治疗,并且如在其他自身免疫性疾病中一样是有效的免疫抑制剂。已经证明TNFa阻断剂是最有希望的治疗剂,可以减缓大多数临床病例的AS进展,帮助许多患者获得其炎症和疼痛的显著减低,虽然不能消除。也已经证明了他们不仅在治疗关节炎方面,而且在治疗与AS有关的脊柱关节炎方面,都有高度有效。除了通常的高费用外,缺点是这些药物增加了感染风险的事实。由于这个原因,任何TNF-a阻断剂的方案都包括在开始治疗前对于结核的检测(如Mantoux或Heaf)。如果发生复发感染,甚至复发咽喉痛,则由于涉及免疫抑制可能需要暂停治疗。建议服用TNF药物的患者限制接触其他携带或可能携带病毒(如感冒病毒或流感病毒)或可能具有某种细菌或真菌感染的人。AS影响产生在健康人群中非常常见的症状。例如,主诉严重背痛的患者不一定正经历AS爆发,而可能只是患有常规的背痛。在未对疾病状态进行非常精确的观察的情况下,迫使医生作出是否使用昂贵的具有潜在严重副作用的药物来治疗这些症状的决定。CRP和ESR并不提供对该疾病状态的非常准确的观察。同时,未经治疗的疾病的过程可能导致长期的脊髓损伤恶化。该事态导致了困难的临床挑战并采用显著的过度治疗。反映疾病活动性的客观测量的可用性对于AS患者的处理可能具有很大的帮助。在本发明的一个实施方案中,鉴定针对不同疾病状态代表不同的免疫谱的克隆型。然后通过将已鉴定的免疫谱与患者当前的免疫谱相比较,来跟踪该疾病的状态。所述疾病是AS。所述疾病状态可以是,但不限于高炎症期和基线期。这些免疫谱用于推动治疗决定。B.免疫谱分析在癌症检测中的应用这些方法可用于测量癌症风险。在工业化世界,癌症已经成为死亡的首要原因。因此,亟需治疗癌症的方法。正在尝试许多癌症治疗方法,包括新的小分子药物的开发,以及靶向肿瘤的抗体。已经提出的一组方法是免疫疗法。肿瘤监视是免疫系统细胞的功能之一。有几种被免疫系统识别的肿瘤抗原类别。第一个类别由肿瘤内的体细胞突变(点突变或易位)新产生的抗原组成。另一个类别由来自仅在不表达MHC分子的男性生殖细胞中表达的蛋白质的抗原组成。在许多肿瘤中基因表达的调节异?赡芑嵩市碚庑┛乖械囊恍┑玫奖泶。第三个类别包括来自仅在特定组织中表达的蛋白质的抗原。第四个类别包括在肿瘤组织中明显过度表达的抗原。最后,第五个类别包括由异常的翻译后修饰产生的抗原。肿瘤的一个特性是他们逃脱免疫系统的有效清除的能力。据认为,在肿瘤中获得的新的突变允许其从平衡相(此时肿瘤没有完全被消除但是其生长受到抑制)进入逃脱相,在逃脱相肿瘤生长而没有受到免疫系统的有效控制。肿瘤可以采用很多机制逃脱免疫系统。这些机制包括缺乏特异性抗原肽或能够激活T细胞的共刺激分子。其他机制包括肿瘤分泌抑制T细胞的因子和通过创建分隔肿瘤与淋巴细胞的物理屏障而产生肿瘤诱导的特殊部位。正在以多种方式研究和测试诱导免疫系统以更好地对抗肿瘤,作为治疗癌症的一种策略。一种方法是过继性T细胞疗法。该方法集中于通过分离那些浸润肿瘤和/或与特异性肿瘤抗原反应的细胞来鉴定靶向肿瘤抗原的T细胞。这些T细胞可以在提高他们的有效性的情况下,如使用IL-2和/或抗原呈递细胞,在体外进行生长。随后将扩增的细胞输注回患者血液中。另一种方法是使用含有肿瘤特异性TCR的逆转录病毒。这些逆转录病毒能够输注到患者的特定细胞中,该细胞随后分泌逆转录病毒,使其感染T细胞,该T细胞随后开始表达肿瘤特异性TCR。最后,一种普通的方法是使用疫苗接种。该治疗方法的前提是用一种或多种肿瘤抗原对患者的免疫将刺激免疫系统抗击肿瘤的能力。常常使用佐剂(如卡介苗(BCG))来完成免疫。正如预防由HPV-16和HPV-18诱发的宫颈癌的能力所证明的,这种方法已经在预防病毒诱发的癌症中获得成功。然而,这种方法却在其他肿瘤的治疗中不太成功。由于能够获得导致例如乳腺癌和宫颈癌死亡率降低的更好的早期检测方法,因癌症造成的死亡率发生了很大改善。肿瘤的可突变性使得他们的早期治疗比在晚期检测后的治疗更为有效。传统上,寻找肿瘤检测生物标志物通常包括寻找在肿瘤中高度表达而在正常组织中处于低水平或不存在的标志物。这已导致鉴定了许多肿瘤标志物,如PSA。癌症的早期检测的一个问题是,当生物标志物的检测最困难,即,肿瘤非常小时,出现癌症检测的最大值。因此,为了获得能够区别具有小肿瘤的患者与无肿瘤者的有效的癌症检测生物标志物,需要由于肿瘤和正常组织之间在大小上的很大差别而在肿瘤和正常组织之间具有巨大的表达差别。此外,标志物需要有效地“溢出”到血液或其他体液以允许使用非侵入性技术进行检测。本发明教导了一种使用免疫细胞应答来检测癌症的新机理。从这方面来说,不是通过检测由肿瘤自身产生的标志物,而是通过检测肿瘤的免疫系统应答来实现癌症检测。具体来说,TCR和/或BCR谱能够了解关于身体是否对肿瘤产生了应答。这能够解决现有生物标志物的一些问题。首先,免疫应答是扩大的信号,更容易被检测到。其次,淋巴细胞有规律地通过血液,并因此相关的生物标志物可能会比传统的肿瘤生物标志物更容易地在外周血中存在并可检测到。最后,由正常组织产生的“背景”生物标志物材料的问题大大降低。T细胞和/或B细胞的极大多样性提供了一种具有高灵敏度和特异性的检测相关生物标志物的方式,特别是目前可以获得高通量DNA测序方法。基于免疫系统对癌症的应答来检测癌症的方法利用了免疫治疗的基础。然而,这两种应用的风险可能大有不同。利用对癌症的免疫应答进行检测不需要特定克隆型对治疗肿瘤有效,而是需要它与对肿瘤的免疫应答相关。本发明的另一实施方案涉及将免疫谱分析试验与已经用于癌症检测的其他标志物相结合,以使得试验具有更高的灵敏度和特异性。其他分子识别符或标记物可用于计算负荷算法或用于确定疾病状态。分子识别符可以包括核酸、蛋白质、碳水化合物和脂质以及核酸或蛋白质的表达谱。分子识别符可以是人或非人来源(例如,细菌)的。识别符或标记物可通过一些技术来确定,该技术包括,例如,比较基因组杂交(CGH)、染色体微阵列分析(CMA)、表达谱分析、DNA微阵列、高密度寡核苷酸微阵列、全基因组RNA表达阵列、肽微阵列、酶联免疫吸附试验(ELISA)、基因组测序、拷贝数(CNV)分析、小核苷酸多态性(SNP)分析、免疫组织化学、原位杂交、荧光原位杂交(FISH)、PCR、Western印迹法、Southern印迹法、SDS-PAGE、凝胶电泳和Northern印迹法。C.免疫谱分析在移植医学中的应用这些方法可以用于检测移植器官的免疫排斥反应。器官移植已经成为医学不可或缺的一部分,在美国,每年进行超过25,000例实体器官(肾脏、肝脏、心脏、胰脏和肺)移植以及超过15,000例骨髓移植。它们通常是在三级护理中心进行的复杂的操作。为了将移植排斥反应的风险最小化,通常在患者有癌症和感染风险的较长时间内对患者进行免疫抑制。此外,许多移植物被急性排斥,或者在移植后数年才排斥。尽管存在这些问题,但是器官移植仍然是必要的治疗方式,因为对于器官衰竭的患者几乎没有其他备选方案。实体器官移植排斥反应主要是由于适应性免疫系统对所移植的器官的应答而发生的。这是由于移植物中存在被宿主免疫系统识别的同种异体抗原。该排斥反应可能在三个不同的阶段发生。第一个是移植后数分钟内的超急性期,在该阶段预形成的抗体对移植物产生响应。第二个是在移植后前几周或数月内发生的急性排斥反应。最后一个是可能在移植数年后发生的慢性排斥反应。考虑到这些风险,已经采取护理以使供体和受体间的免疫原性差异最小化。例如,当供体和受体的ABO亚型相匹配并进行交叉配型试验(确定受体是否具有与供体的白细胞反应的抗体)时,超急性反应的风险大大降低。相似地,对主要组织相容性(MHC)进行仔细匹配以减少急性排斥反应。然而,考虑到MHC分子具有极高的多态性,很难找到完美的匹配。单卵双生具有完美的MHC匹配。相似地,预计有1/4的兄弟姐妹具有完美的MHC匹配。在每个临床试验中检测到相同等位基因的非亲缘个体通常由于在常规临床实践中未检测的其他多态性位点而存在差异。然而,即使是具有来自兄弟姐妹的完美MHC匹配,由于次要组织相容性抗原的存在仍具有显著的排斥反应的风险,并且急性排斥反应确实非常普遍地发生在一半以上的移植物中。人们可能相像,对MHC基因座的更加积极的检测以及对次要组织相容性抗原的鉴定和匹配将会显著改善移植物排斥和可能的存活率。然而,事实是,可获得的供体器官数量有限使得这项任务不切实际,因为更积极的检测可能显著延误确定对每个患者合适的移植物。因此,在移植领域发生的许多进展是使用免疫抑制剂来预防和治疗排斥反应。目前有许多药物用于该目的,包括:硫唑嘌呤、皮质类固醇、环孢菌素、他克莫司、吗替麦考酚酸、西罗莫司、莫罗莫那-CD3、抗CD25单克隆抗体、抗CD20单克隆抗体以及钙依赖磷酸酶抑制剂。骨髓移植最常用于白血病和淋巴瘤治疗。通常,接受者经历激进的放射和/或化学治疗方案以在移植前减少肿瘤负荷。来自供体的成熟T细胞可以在反向排斥中攻击某些宿主组织,这被称为移植物抗宿主病(GVHD)。这通常表现为疹、腹泻和肝病。仔细的MHC匹配能够改善但不能消除这一问题。一个解决方案是在体外从供体骨髓中排除最终引起GVHD的成熟T细胞。与此相关的一个问题是引起GVHD的同一现象可能通过移植物对抗白血病的效果(其中供体T细胞攻击剩余的癌细胞)担负骨髓移植的某些治疗效果。另外,供体T细胞的排除可能使患者具有免疫缺陷的风险。因此,当考虑这些方法时必须平衡风险与利益。因此通常用免疫抑制剂治疗患者以预防以及治疗GVHD。目前的骨髓处理(对于实体器官移植更是如此)严重依赖于使用强免疫抑制剂的治疗。然而,考虑到这些药物具有重大的风险,它们的使用要同时平衡风险与利益。然而,考虑到不能很好地了解特定患者在特定时间的风险,用针对平均患者的平衡了风险与利益的剂量治疗患者。能够预测未来排斥事件的检测有助于帮助患者在他们需要的适当时间定制治疗方案。这可使得某些患者中使用的免疫抑制剂的量减少,同时改善排斥率和希望的移植物存活率。本发明的另一个实施方案涉及免疫谱分析试验与其他已经用于检测移植排斥的标记物的组合,以使试验具有更高的灵敏度和特异性。其他分子识别符或标记物可用于计算负荷算法或者用于确定疾病状态。分子识别符可以包括核酸、蛋白质、碳水化合物和脂质,以及核酸或蛋白质的表达谱。分子识别符可以是人或非人来源的(例如细菌的)。识别符或标记物可以通过多种技术来确定,包括,例如,比较基因组杂交(CGH)、染色体微阵列分析(CMA)、表达谱分析、DNA微阵列、高密度寡核苷酸微阵列、全基因组RNA表达阵列、肽微阵列、酶联免疫吸附试验(ELISA)、基因组测序、拷贝数(CNV)分析、小核苷酸多态性(SNP)分析、免疫组织化学、原位杂交、荧光原位杂交(FISH)、PCR、Western印迹法、Southern印迹法、SDS-PAGE、凝胶电泳和Northern印迹法。D.免疫谱分析在感染治疗中的应用这些方法在指导感染的治疗中具有实用性,尤其是当这些感染能够以活动和潜伏状态存在时。在过去一个世纪,用于治疗感染性疾病的抗生素的出现对于预期寿命作出了巨大的影响。在过去十年,分子诊断技术已经在感染性疾病的诊断和处置中具有快速增长的作用。通过核酸扩增提供的出色的灵敏度和特异性已经使这些技术能够应用到越来越多的应用中。许多应用用于诊断性评价传染原的存在或不存在。例如,经常通过采用核酸扩增技术的分子检测来进行对性传播疾病的检测。另一组应用涉及在已经诊断具有传染原的患者中评价感染的“载量”。其一个例子是在已经诊断为AIDS的患者中评价HIV病毒载量。这种检测可以帮助医生确定患者的疾病状态,并因此可以提供关于正在使用的治疗方案的有效性的指导。有时这不仅有助于考虑感染原的水平,而且有助于考虑针对感染原的免疫应答。在临床实践中常规使用针对感染的免疫应答的一个例子是在乙型肝炎中。乙型肝炎检测的一个方面依赖于通过核酸扩增试验检测乙型肝炎抗原来检测传染原。此外,通常在常规临床实践中检测针对乙型肝炎的不同抗体的存在。抗-HBc IgM的存在通常发生在急性感染情况中,抗-HBc IgG的出现表明感染是慢性的。同样,抗-HBs抗体的出现表明感染被清除。在本发明的一个实施方案中,评估针对感染的免疫应答,其价值基于分子检测的灵敏度和特异性。这对于其中传染原在机体中保持潜伏的慢性感染性疾病可能尤其有用。可以使用TCR和/或BCR谱来评估针对感染的免疫应答。可以使用测序来获得TCR和/或BCR谱,以允许以高灵敏度和特异性地检测特定的克隆型。为了确定与疾病相关的特定克隆型,设计了数种方法。本发明的另一个实施方案涉及免疫谱分析试验与其他已用于检测传染原的标记物的组合,以使试验具有更高的灵敏度和特异性。其他分子识别符或标记物可用于计算负荷算法或用于确定疾病状态。分子识别符可以包括核酸、蛋白质、碳水化合物和脂质,以及核酸或蛋白质的表达谱。分子识别符可以是人或非人来源的(例如,细菌的)。识别符或标记物可以通过多种技术来确定,包括,例如,比较基因组杂交(CGH)、染色体微阵列分析(CMA)、表达谱分析、DNA微阵列、高密度寡核苷酸微阵列、全基因组RNA表达阵列、肽微阵列、酶联免疫吸附试验(ELISA)、基因组测序、拷贝数(CNV)分析、小核苷酸多态性(SNP)分析、免疫组织化学、原位杂交、荧光原位杂交(FISH)、PCR、Western印迹法、Southern印迹法、SDS-PAGE、凝胶电泳和Northern印迹法。E.免疫谱分析在治疗衰老患者中的应用这些方法在监测老年人的免疫系统的状态中具有实用性。老年人经历免疫系统的下降,称为免疫衰老,这影响他们对感染作出应答和引起对疫苗的有效应答的能力(Weinberger等人,2008)。从老年人因肺炎导致的高死亡率(国家统计局,2005年)以及他们对医院获得性感染如艰难梭菌和甲氧西林抗性金黄色葡萄球菌的易感性(健康保护署,2008年)来看,这是很明显的。而且,免疫系统能力的下降被认为可以解释老年人中癌症比例的增加。此外,免疫衰老可以导致老年人的具有炎症过程的重要方面的其他主要疾。绨⒍群D『托脑嗖。预测哪些个体最具有这些致命结果的风险的能力对于老年病医生是有帮助的,因为他们可以据此作出关于疫苗接种、积极治疗感染和住院治疗的临床决定。在免疫衰老中,先天性免疫和适应性免疫系统的许多方面都发生改变。T细胞丧失应答性,巨噬细胞具有降低的抗原呈递能力和改变的细胞因子分泌,自然杀伤细胞具有降低的毒性,滤泡树突状细胞不能有效地呈递抗原,而中性粒细胞丧失吞噬能力。幼稚T细胞和B细胞池更。且湎赴托вο赴卦黾樱贾耇和B细胞组库的多样性降低,从而导致适应性免疫系统响应新抗原的能力下降。与巨细胞病毒(CMV)相关的T细胞组库尤其大大增加,可能占据总T细胞组库的几乎45%。已经注意到,在百岁老人中这种增加不太明显。研究表明,免疫标记物可以预测老年人的生存期。已经表明B细胞组库的多样性程度至少在一个人群中可以预测老年人的生存期。即使表明TCR和BCR多样性的这些总体差异可以预测临床结果,但是这些标记物缺乏特异性。组库数据的更深入的分析可以提供显著更高的预测精度。例如,对CMV反应性的扩充可以与其他扩充具有不同的意义。在本发明的一个实施方案中,可以从已跟踪临床病史数年的老年患者的纵向群组中收集来自外周血中发现的T细胞和B细胞的RNA。可以对这些群组的每一个,在他们的临床史的数个时间点扩增TCRa和TCRii基因以及IgH、IgK和IgL基因。将生存期长的患者与生存期短的患者的谱进行比较。首先,可以获得多样性的总体测量。这不仅包括所鉴定的不同克隆型的数量,而且包括它们的多样性。例如,V、D、J区段使用在两组中是否相同?或者一组中它的使用是否更被限制?例如,两份样品可能具有相同数量的独立克隆型,但是其中一份样品的克隆型没有覆盖许多V区段。与克隆型分布于所有V区段中的其他样品相比,预期这种样品在新抗原应答中的多能性更低。除了总体多样性,还确定是否可以基于一些序列参数来区分生存期长的患者中的扩充的克隆型与生存期短的患者中的克隆型。可以通过寻找对特定抗原具有响应的克隆型来补充这种方法。例如,考虑到可以获得的证据,CMV反应性克隆型的鉴定可能具有预测能力。可以从一组老人以及健康患者中捕获在发现研究中为CMV反应性的T细胞克隆型。可以研究这些克隆型的序列以确定将它们与其他克隆型区分开来的参数。使用这种CMV克隆型预测算法以及用上面所述的纵向群组,可以评估增加这种信息是否可以增加从不能长期生存的患者预测可以长期生存的患者的能力。本发明的另一个实施方案涉及免疫谱分析试验与其他已经用于检测老年群体的健康的标记物的组合,以使试验具有更高的灵敏度和特异性。其他分子识别符或标记物可用于计算负荷算法中或用于确定疾病状态。分子识别符可以包括核酸、蛋白质、碳水化合物和脂质,以及核酸或蛋白质的表达谱。分子识别符可以是人或非人来源的(例如,细菌的)。可以通过多种技术确定识别符或标记,这些技术包括,例如,比较基因组杂交(CGH)、染色体微阵列分析(CMA)、表达谱分析、DNA微阵列、高密度寡核苷酸微阵列、全基因组RNA表达阵列、肽微阵列、酶联免疫吸附试验(ELISA)、基因组测序、拷贝数(CNV)分析、小核苷酸多态性(SNP)分析、免疫组织化学、原位杂交、荧光原位杂交(FISH)、PCR、Western印迹法、Southern印迹法、SDS-PAGE、凝胶电泳和Northern印迹法。F.免疫谱分析在疫苗施用中的应用这些方法在疫苗的施用中具有实用性。采用接种疫苗显著降低了多种生物体的感染率。流感在美国每年导致超过30,000例死亡,持续显著健康影响。因为毒株变异迅速,每年必须进行流感疫苗接种。该疾病的大部分严重的后遗症发生在老年人中。遗憾的是,老年人经常免疫衰老,这导致他们对疫苗接种的应答不足。为了区别对疫苗接种有反应的患者与对疫苗接种没有反应的患者,需要进行研究。在这个群体中,对于具有已知的流感结果(即他们后来是否受到针对感染的保护)的接种流感疫苗的患者群组可获得疫苗接种之前和(在一个或多个设定时间)之后的血液样品。从这些样品可以获得TCR和/或BCR序列。确定每位患者在疫苗接种后富集的克隆型。然后将对疫苗接种有反应的患者中g集的克隆型与一组对照克隆型(例如,在冋组患者中的其余的克隆型)进行比较,以便区别相关克隆型与其他克隆型。然后使用预测这些克隆型的算法来预测对疫苗接种没有反应的患者中的相关克隆型。没有反应的患者产生的克隆型可能与有反应但水平较低的那些患者相同。另外,无反应者可能产生一类独特的克隆型。在无反应者中鉴定出的相关克隆型的数量可以区分这两种可能性。在另一个实施方案中,通过首先在疫苗接种后从个体获得淋巴细胞的样品,然后从该样品分离对疫苗具有反应性的淋巴细胞,来监测个体对疫苗接种的反应性。对于B细胞,使用来自疫苗或与之相关的抗原性物质作为附着到固体支持物如磁珠上的捕获部分,利用常规的亲和纯化很容易地进行这种分离。也可以采用常规的方法,例如,美国专利7,776,562 ;7,125,964 ;5,635,363或类似方法(通过引用并入本文)进行T细胞的分离。从分离的淋巴细胞样品产生克隆型谱以获得一组相关克隆型。在随后的时间点,从个体获得外周血样品并生成克隆型谱。监测在随后的样品中相关克隆型的频率变化率以确定个体对疫苗接种的反应性。可以用以下步骤实施这种监测对疫苗接种的反应性的方法:(a)在疫苗接种后从个体的外周血富集淋巴细胞样品以获得疫苗反应性淋巴细胞的样品;(b)从疫苗反应性淋巴细胞样品确定克隆型谱以鉴定一种或多种与疫苗应答相关的患者特异性克隆型;以及(c)从随后的一个或多个时间获得的外周血细胞样品确定克隆型谱中一种或多种患者特异性克隆型中的每一种的水平,以监测个体对于疫苗接种的反应性。在一个实施方案中,根据在随后测定的克隆型谱中一种或多种患者特异性克隆型的量或频率的增加而确定反应性。用鉴定的相关克隆型,然后建立算法以产生用于预测免疫的可能性的评分。采用来自疫苗反应者和无反应者的谱的数据来产生这种算法。然后可以使用这种算法并使用从免疫后获得的样品预测的相关克隆型来预测下一位患者中免疫的可能性。通过应用另一种也已经在发现研究中产生的算法进行预测。可任选地通过来自预先校准的数据帮助(或取代)而将相关克隆型搜索限制在免疫后富集的那些克隆型。本发明的另一个实施方案涉及免疫谱分析试验与其他已经用于检测对疫苗接种的反应的标记物的组合,以使试验具有更高的灵敏度和特异性。其他分子识别符或标记物可用于计算负荷算法或用于确定疾病状态。分子识别符可以包括核酸、蛋白质、碳水化合物和脂质,以及核酸或蛋白质的表达谱。分子识别符可以是人或非人来源的(例如,细菌的)。可以通过多种技术确定识别符或标记物,这些技术包括,例如,比较基因组杂交(CGH)、染色体微阵列分析(CMA)、表达谱分析、DNA微阵列、高密度寡核苷酸微阵列、全基因组RNA表达阵列、肽微阵列、酶联免疫吸附试验(ELISA)、基因组测序、拷贝数(CNV)分析、小核苷酸多态性(SNP)分析、免疫组织化学、原位杂交、荧光原位杂交(FISH)、PCR、Western印迹法、Southern印迹法、SDS-PAGE、凝胶电泳和Northern印迹法。G.免疫谱分析在监测免疫超敏反应(变态反应)中的应用适应性免疫系统已经进化为对与病原体相关的抗原有反应。在自身免疫性疾病的情况下,免疫系统有时可能具有错误的目标。在自身免疫性疾病中,免疫系统针对自身抗原,而在超敏反应中,产生对有害刺激如药物、灰尘和食物的反应。超敏反应非常常见,多达50%的美国人对环境刺激过敏,它是由机制引起的。超敏反应分为4种类型。I型超敏反应是速发型超敏反应,由IgE介导。II型往往是由于IgG抗体结合到细胞表面相关抗原上而导致的。例如,结合于细胞表面的无害药物在碰巧具有这些抗体的患者中可能使该细胞成为抗药物IgG的目标。III型是由抗原-抗体复合物在组织上沉积所引起的。例如,当抗原量很大导致产生不能被有效清除而是沉积在血管壁上的小免疫复合物时会发生这种情况。IV型超敏反应是由T细胞介导的迟发型超敏反应。I型和IV型对人体健康具有最大的影响。在I型超敏反应中,患者通过产生针对无害抗原(变应原)的IgE抗体而变得对无害抗原(变应原)敏感。后来暴露于变应原诱导了 IgE结合细胞如肥大细胞和嗜碱性粒细胞的活化。一旦活化,这些细胞通过分泌储存的化学物质以及合成细胞因子、白三烯和前列腺素而诱导炎症过程从而引起变态反应。变应原的剂量和进入途径决定了变态反应的程度,其范围可以从变应性鼻炎的症状到过敏症中危及生命的循环衰竭。通常,急性I型反应之后是另一个晚期,该晚期在许多产生的病理过程中起作用。T辅助细胞和其他炎症细胞的募集的晚期基本上是IV型超敏反应。一些I型变态反应包括季节性鼻炎结膜炎(枯草热)、食物过敏、药物诱发的过敏、特应性皮炎(湿疹)和哮喘。这些是非常常见的病状,其患病率不断上升,导致巨大的花费以及发病率和死亡率。例如,哮喘是一种影响美国人口的约7%的慢性疾。涿磕暌鹪4,000例死亡。这些疾病中的一些具有一些相关的问题。例如,特应性皮炎患者具有显著增加的患上哮喘的风险。食物过敏可以引起呕吐和腹泻,但也可以在相当数量的患者中导致过敏,在美国每年约有30,000例,导致约200例死亡。一些激活鼻中的粘膜下肥大细胞而引起变应性鼻炎症状的相同的变应原也可以激活下呼吸道中的肥大细胞,引起支气管收缩,这是典型的哮喘症状。一些IV型超敏性反应是接触性皮炎(例如,毒葛)、慢性鼻炎、慢性哮喘和乳糜泻。乳糜泻是由非IgE介导的食物过敏引起的慢性疾病。它是由针对谷蛋白(一种存在于小麦和其他食品中的组分)的变应性应答引起的小肠的疾病。超过95%的乳糜泻患者具有特定的MHC II类等位基因,HLA-DQ2。超敏反应的治疗不同,但他们往往具有两个方面:急性治疗和慢性处置或预防。一些这样的病状可能是危及生命的(过敏反应和急性哮喘),需要立即就医。慢性处置通常涉及设法避免特定变应原。当可以清楚地确定变应原(例如,针对坚果的变态反应)时,这可能是有效的,但是当变应原广泛存在于环境中时,如对于花粉或灰尘,这可能是困难的。因此,对于一些这样的疾病(例如,哮喘和变应性鼻炎),通常采用药物进行慢性治疗。当患者再次暴露于该变应原时,最终检测治疗处置的有效性水平。因此,一些患者可能受到过度或不足的治疗。理想地,可以获得评价疾病活动性和患者发生超敏反应应答的容易程度的试验。这种试验允许根据个别患者的需要定制治疗。H.淋巴肿瘤的检测本发明的一个方面将采用下一代测序技术来评价淋巴细胞癌症中的特定TCR或BCR重排的水平。这些测序技术可以以合理的成本从100万或更多个空间分离的单独TCR或BCR分子获得序列阅读。使用这些技术仍然可以以特定的方式检测以1/1,000,000或更低频率存在的序列,因此允许以该水平检测与特定TCR或BCR重排相关的癌细胞。可以从血液或骨髓DNA进行为了特定基因而扩增所有不同类型的序列的多重扩增。例如,为了扩增IgH序列,可以使用与所有已知的V区段和等位基因互补的数条引物以及与所有J区段和等位基因互补的数条引物。重要的是,在不同的序列之间几乎不发生扩增偏差。我们已经表明,可以从RNA扩增TCR β和IgH基因,不同的V引物的效率仅有很小差别,从而验证了从DNA扩增的可能性,从DNA扩增将允许甚至在TCR或BCR没有表达时评价癌细胞。考虑不同克隆型的扩增中的任何偏差,通过计数单独地空间分离的分子的统计学来确定本发明的灵敏度。因此,可以预计,与为了同样目的开发的实时PCR试验相比,这种方法将提供更高的灵敏度,并且对于不同的肿瘤细胞TCR或BCR序列将具有更少的灵敏度差异。此外,为了获得更高的灵敏度,可以简单地获得更多的测序阅读。由于测序成本持续下降,我们预计在给定成本的灵敏度将继续改善。在有足够的测序阅读的情况下,灵敏度将受样品中的淋巴细胞数量的限制。相反情况下,非特异性扩增和任何探针的杂交所引起的背景限制了实时PCR检测的灵敏度。为了使用本发明监测淋巴癌,可以通过对诊断的白血病或淋巴瘤样品进行测序来确定患者特异性克。患矗ü永醋约膊∠喙刈橹(其中发现了富集状态的疾病反应性淋巴细胞)的样品产生克隆型谱来确定患者特异性克隆型。一旦确定了克隆型谱,可以通过与来自与疾病无关的组织的样品的克隆型谱相比较来确定疾病相关克隆型的水平。然后,在疾病进程中后续的时间点,在来自患者的样品的克隆型谱中确定疾病相关克隆型的水平。优选地,从便于获得的组织如外周血采集这类后续样品。可以使用血液样品中的细胞,或者,可以使用来自无细胞的血浆的DNA或RNA。不需要患者特异性的探针或者采用将被作为标准运行的患者特异性的模板,而这在目前的技术中是需要的。在本发明的这种实施方案中,在鉴定患者特异性克隆型之后可以获得完整序列组库,以及根据将获得的序列与储存的关于每位患者的有关序列的数据相匹配而信息地测定有关的相关克隆型。对于淋巴瘤,疾病相关组织可以包括淋巴组织、骨髓、外周血等。癌症克隆型的鉴定。为了使用测序方法来监测癌症,定义每个个体中的癌症克隆型是关键。对于二次检测(对于诊断为淋巴肿瘤的患者的复发和预后应用),癌症克隆型的鉴定通常可能相当直接。例如,诊断时的白血病患者的血液或骨髓样品一般显示出癌症克隆型作为样品中最频繁的克隆型。在二次检测的其他情况下(例如,来自一些淋巴瘤样品的活检),癌症克隆可能不会以非常高的水平存在。可与多种抗原反应的其他克隆型(包括正在攻击癌症的那些克隆型)以更高的频率被发现。如果克隆型的水平本身不足以确定癌症克隆型,可以使用其他标准。可以使用下面描述的数种方法来鉴定癌症克隆型。交叉谱系重排。一些类型的其他非常见重排在一些癌症中是常见的,因此可用于将它们与肿瘤相关联。例如,交叉谱系重排,像在B细胞中的T细胞受体(α、β、Υ和/或δ)或者在T细胞中的B细胞受体(IgH、IgK和/或IgL)是常见的,尤其是在ALL中。交叉谱系重排的存在很可能支持克隆型的恶性来源。用特定细胞类型的测序对交叉谱系重排进行的测序。可替代地,可以通过利用在细胞表面上存在某些抗原的标准方法(例如,磁珠和FACS)分离出一种类型的细胞。可以进行测序以评价交叉谱系重排的存在。例如,可以分离B细胞,并且可以对TRCii进行测序。富集的特定TCRP序列的存在是与癌症一致的。可以在富集之如和之后进行测序,从而允许测定未富集时的水平和富集的程度。无活性的免疫受体。可用于区分恶性细胞和其他细胞的另一个特征是非恶性细胞需要具有有活性的免疫细胞受体。淋巴细胞在与抗原的反应中增殖,并可以达到高水平。因此,对于正常(非癌症)克隆型达到高水平依赖于有活性的免疫受体。在活检样品中鉴定出高水平的非功能序列不足以确定为癌症,因为,由于在包含功能性重排的细胞中第二种等位基因的非功能性重排,在功能性细胞中可以发现非功能性重排。使用RNA可以消除这一点的不确定性,因为肿瘤细胞可以继续表达非功能性重排,而这在正常细胞中不可能发生,但是通常更明确的方法是有用的。有可以区分癌症中的非功能性序列的额外特征。例如,一些未成熟的癌症,例如,ALL,通常只有IgH重排,而没有IgK或IgL重排。在不存在癌症的情况下,这种模式不可能达到高频率。可以使用以下技术评价这些非功能性重排。在一系列稀释的样品中的统计连锁。物理连锁的替代方案是寻找如上所述的作图连锁。在这种情况下,仅仅检测一种基因(例如,IgH),问题是非功能性序列与什么连锁,即,在相同细胞中的IgH的其他等位基因的序列是什么。与第二种非功能性等位基因连锁的闻频非功能性等位基因与由于癌症而达到的闻频率相一致。对特定细胞类型的测序。也可以通过捕获携带一种标记物的细胞并评价其他的序列而鉴定这种模式。例如,可以使用FCM来捕获IgK和IgL阴性的细胞。在FCM富集之前和之后对IgH进行测序可以鉴定在这个群体中富集的克隆。预期IgK和IgL阴性的细胞达不到高频率,它们的存在与未成熟的癌症如ALL是一致的。失活性体细胞超突变。在其克隆型已经经历体细胞超突变的B细胞淋巴瘤中可以发现替代的模式。这些克隆中的一些可能具有克隆间变异,其中癌细胞包含在它们中具有不同的突变的数个克隆。一些获得的克隆可能具有失活性突变。对于正?乖奶逑赴槐洌≡癫⒗┰鼍哂惺Щ钚蕴逑赴槐涞目寺∈遣豢赡艿。这些克隆的存在与癌症是一致的。对携带肿瘤标志物的细胞组分测序。在肿瘤标志物已知的情况下,可以用这种标志物进行FCM来富集癌细胞。可以在富集之前和之后对免疫受体组库进行测序。富集的克隆型很可能与癌症克隆型相关联。例如,可以使用FACS来富集淋巴瘤细胞以分离携带与肿瘤相关的特定标志物(最方便的是表面标志物)的细胞。在富集之前和之后对BCR测序很容易鉴定富集的克隆型并且扩展至鉴定癌症克隆型。或者,可以在DNA或RNA水平上评价标志物的关联。这可以通过数种方法来完成,包括上述连锁PCR或与连续稀释的细胞的统计学关联。定量这些标志物的连锁将使试验具有更好的表现,因为许多标志物在癌细胞中过表达,但在正常细胞中仍然以一定的水平存在。为了解释这一点,可以使用三种基因进行连锁PCR:免疫受体、肿瘤标志物和对照基因。免疫受体基因可以与其他两种基因中的任一种连锁,并且作为受体重排和肿瘤标志物之间连锁的结果的连锁分子的分数可以表明这种肿瘤标志物的表达水平。
易位的检测。除了作为已经变成癌细胞的细胞的标志物外,IgH通常还是淋巴肿瘤中的两种病理性易位配偶体之一。一个例子是使IgH的J区段紧密靠近周期蛋白DI (CCNDl)基因的t (11:14),这导致其过表达。这种被称为BCLl-1gH的重排发生在多达60%-70%的套细胞淋巴瘤以及其他淋巴肿瘤(例如,20%的多发性骨髓瘤)中。另一个例子是使IgH的J区段紧密靠近BCL2的t (14:18),这导致其过表达。这种重排发生在最高达90%的滤泡性淋巴瘤和20%的大B细胞淋巴瘤中。通常通过细胞遗传学、Southern印迹法或FISH鉴定这些重排。PCR具有以非常高的灵敏度和特异性鉴定重排的潜能,如用于检测费城染色体的BCR-ABL所示。已经使用不同的PCR技术来评价与淋巴瘤相关的易位,最近引入的实时PCR(例如,对于BCL2-1gH)可能是最先进的。BCLl-1gH和BCL2_IgH有一些特征使得它们的检测的灵敏度和特异性比BCR-ABL的灵敏度和特异性更低。首先,与BCR-ABL对t匕,BCLl-1gH和BCL2-1gH不产生融合蛋白,并且没有产生可预测的分子结构的剪接事件。相反,断点可能跨越大区域。具有允许使用引物和约40%的BCLl-1gH的组合检测最高达88%的BCL2-1gH的常见断点。这导致漏掉了一些具有易位的患者。第二,这些重排可能存在于从不患癌症的正常个体中。例如,在超过约4%以> 1/25K的频率携带BCL2-1gH的大部分的正常个体中已经发现了约10_5的水平的BLC2-1gH易位。BCL2-1gH的频率随着年龄的增加而变得更高。也假设不同的人可能具有不同的“背景”易位水平。这种易位在正常样品中的存在大概是由于如下事实:肿瘤发生是多步骤的过程,BCL2-1gH对于肿瘤来说不足以出现。这种低水平背景的存在限制了检测的灵敏度。使用与所有J区段互补的J引物和与BCLl或BCL2易位断点的上游区域互补的引物进行扩增,并对扩增产物进行测序。这可以形成用于灵敏检测这些易位和它们出现在其中的癌细胞的方法。首先,单独分离的分子的深度测序(例如,100K或I百万个阅读)可以允许在其他基因座扩增的背景中从少量细胞中检测适当的序列。此外,在正常个体中的背景易位的问题可能改善实时PCR所遇到的问题。有证据表明,至少在一些情况下,背景易位不是克隆的,而是在相同的患者中反复出现。使用测序,可以区分不同的易位事件以获得独立的易位事件的频率。由于不同的易位的断点很可能是独特的,易位事件可以彼此区分。可替代地或此外,可以利用B或T细胞受体基因的易位进行连锁PCR以对易位提供独特的条形码。也可以如上所述使用一组稀释样品统计地进行连锁。系列监测易位水平以检测它们的频率增加的点可能有助于早期癌症检测以及复发的检测。在后一种情况下,可以从诊断的活检样品鉴定与患者相关的特定断点。通过测序而根据它们的断点区分易位从而区分背景和癌症的这种概念可以扩展到涉及IgH的其他易位(例如,t(8:14))或者淋巴肿瘤或其他癌症中的所有其他易位。改变癌细胞水平和癌症的可能性。仅仅存在表明还有剩余肿瘤细胞的序列本身不能预测临床复发。例如,肿瘤细胞增殖能力和针对肿瘤的免疫应答之间的平衡来实现肿瘤水平的稳定状态。可以预计,除了克隆型的绝对水平,其变化率也可以为预测复发可能性提供信息。例如,考虑两位患者,他们各自具有X水平的各自的患者特异性癌症克隆型。如果在以前的试验中一位患者的水平一致性地为X,而另一位患者在以前的试验中的水平比X低得多,则第二位患者发生复发的可能性要高于第一位患者。同样,可以使用与包含癌症相关克隆型的细胞的状态相关的其他数据来预测复发的可能性。例如,某些标记物(表面或非表面)的存在可以指示细胞的功能状态并因此指示复发的可能性。在捕获具有相关标记物的细胞之如和之后测序可以确定具有携带相关标记物的癌症克隆型的细胞的分数。同样,可以在RNA水平上评价与复发可能性相关的一些标记物(例如,一些与细胞生长相关的基因的表达)。这可以通过数种方法来完成,包括上述连锁PCR,或者通过细胞稀释统计学地完成。最后,肿瘤细胞中免疫受体特异性RNA的水平可能具有功能性后果以及与复发可能性有关联。可以通过进行可能与免疫受体重排或对照基因2连锁的对照基因I之间的连锁PCR来评价这种水平。两种产物的相对分数可以表示细胞中RNA的相对量。另一种方法包括将免疫受体重排的RNA水平和DNA水平进行比较。DNA中的癌症特异性克隆型的频率表明了癌症特异性克隆型的相对水平。然后可以从RNA评价相同克隆型的频率,并可以追踪RNA和DNA中的相对频率。这种相对频率的变化可以表明复发可能性的变化。针对淋巴癌的免疫反应。除了监测癌症克隆型和其可能的后代,我们还可以评价针对肿瘤的免疫应答。我们可以鉴定很可能引起针对肿瘤的反应的克隆型。例如,在诊断性淋巴结活检的活检样品中富集的B或T细胞克隆型可以是针对肿瘤的免疫应答的结果。此外,可以进行功能测试来鉴定与一些肿瘤抗原相互作用的T细胞。肿瘤抗原可以是特定的抗原或者它可以是肿瘤细胞本身。例如,在用抗原或肿瘤细胞刺激之前和之后对TCR的测序可以借助于细胞在刺激之后的富集来鉴定相关的T细胞。这些T细胞在来自患者的后续血液样品中的水平可能有助于预测复发。例如,考虑上面提到的情况,其中已经稳定地检测了癌症克隆型的特定水平X。这可能是平衡肿瘤生长与针对肿瘤的免疫应答的结果。如果在某一时间点针对肿瘤的免疫应答降低,则可能预测肿瘤将复发。可以通过确定已经被确定为能够攻击肿瘤的T细胞克隆型的水平来定量针对肿瘤的免疫应答。测序与其他细胞标记物的整合。可以通过如上所述对免疫受体重排的测序进行癌症特异性克隆型的检测。可以使用与癌细胞相关的标志物(表面或非表面)的存在来捕获细胞亚群,随后对该细胞亚群进行测序。使用标记物特异性捕获和在捕获之前和之后的测序的组合可以提供额外的信息。首先,这可以用来鉴定被富集并因此很可能是上述癌症特异性克隆型的克隆型。此外,对具有癌症特异性标记物的细胞测序可以导致更高的灵敏度。如果有完美的标记物,仅仅需要进行很少的阅读就能在数百万其他细胞中检测癌症特异性克隆型。大多数标记物不算完美,通过它们进行捕获产生了明显的背景(即,非癌细胞)。然而,通过这些标记物富集癌细胞,与不富集的情况下进行相同数量的测序阅读相比,在更少的测序阅读下具有相等的灵敏度,或者具有更好的灵敏度。例如,利用一百万个测序阅读,可以评价约一百万个用癌症特异性标记物捕获的细胞。这对应于在捕获前存在的更多的细胞,因此对应于更好的灵敏度。最后,标记物的使用可以提供与肿瘤生物学和预后相关的功能信息。不同样品的血液中可能存在一定水平的肿瘤细胞,但是细胞上的功能性标记物可以区分表明有高复发可能性的样品和预测有低复发可能性的样品。例如,可以在用相关标记物捕获之前和之后对样品进行测序,并可以评价具有特定标记物的克隆型序列的百分比。可以预测具有相同的癌症特异性克隆型总水平但是携带相关标记物的细胞的分数不同的两份样品具有不同的复发可能性。系统发生克隆(宗族)的克隆进化和检测和其他癌症相关的突变如上所述,在一个方面,本发明的方法监测一个家族的克隆型水平而不是个别克隆型的水平。这是因为克隆进化的现象,例如Campbell等人,Proc.Natl.Acad.Sc1., 105:13081-13086(2008) ;Gerlinger 等人,Br.J.Cancer,103:1139-1143 (2010)。诊断样品中存在的克隆序列可能不会和随后的样品(如在疾病复发后米集的样品)中的序列保持完全相同。因此,如果追踪与诊断样品序列匹配的准确的克隆型序列,复发的检测可能失败。通过测序可以很容易地检测并鉴定这种进化的克隆。例如,通过V区替代(被称为VH替代)出现许多进化的克隆。实时PCR技术不能检测出这些类型的进化的克隆,因为引物针对错误的V区段。然而,考虑到D-J连接在进化的克隆中保持完整,在本发明中可以使用单独空间分离的分子的测序对D-J连接进行检测和鉴定。而且,诊断样品中这些相关克隆型以可观的频率存在增加了克隆型关联的可能性。同样,免疫受体序列中体细胞超突变的发生可能干扰实时PCR探针检测,但是应用于测序读出的适当的算法(如上所公开的)仍然可以识别进化克隆型。例如,可以识别V或J区段中的体细胞超突变。这通过将克隆型定位到最接近的种系V和J序列而实现。与种系序列的差异可以归因于体细胞超突变。因此,可以很容易地检测并鉴定通过V或J区段中的体细胞超突变而进化的克隆型。可以预测NDN区中的体细胞超突变。当剩余的D区段的长度足以被识别并定位时,可以容易地识别在其中的任何体细胞突变。在N+P碱基中(或者在不可定位的D区段中)的体细胞超突变不能肯定被识别,因为这些序列在可能不是癌克隆型后代的新重组的细胞中可能被修饰。然而,容易构建算法来鉴定具有因体细胞突变而导致的高可能性的碱基变化。例如,与原克隆型具有相同的V和J区段并且NDN区有I个碱基差异的克隆型很可能是体细胞重组的结果。如果在V和J区段中有其他体细胞超突变,这种可能性可能增加,因为这确定了这种特定克隆型为已经是体细胞超突变的对象的克隆型。因此,可以用数个参数来计算克隆型是原克隆型的体细胞超突变的结果的可能性:NDN区中差异的数量、NDN区的长度,以及V和/或J区段中其他体细胞超突变的存在。克隆进化数据可以提供大量信息。例如,如果主要的克隆是已进化的克隆(以前不存在,因此以前未记录的克隆),那么这表明,肿瘤已经获得具有潜在的选择性优势的新的遗传变化。这并不是说免疫细胞受体中的特定变化是选择性优势的原因,而是说它们可以代表它的标记物。其克隆型已经进化的肿瘤可能与差异预后相关联。在本发明的一个方面,被用作疾病(如淋巴肿瘤,例如,白血病)的患者特异性生物标记物的一种或多种克隆型包括以前未记录的克隆型,该克隆型是被监测的一种或多种克隆型的体细胞突变体。在另一个方面,当任何以前未记录的克隆型与充当患者特异性生物标记物的现有克隆型或一组克隆型至少90%同源时,那么这种同源的克隆型与之前监测的克隆型组一起包括或被包括在该克隆型组中。也就是说,如果在淋巴肿瘤中鉴定了一种或多种患者特异性克隆型并将其用于定期监测疾病(例如,通过对侵入性更低地获得的血液样品进行测定),并且如果在一种这样的测定过程中,检测到是目前组的克隆型的体细胞突变的新的(以前未记录的)克隆型,那么将它增加到被监测的患者特异性克隆型的组中用于随后的测定。在一个实施方案中,如果这种以前未记录的克隆型与目前组的一个成员至少90%同源,那么将它增加到患者特异性的克隆型生物标记物的组中用于接下来对患者进行检测;也就是说,这种以前未记录的克隆型被纳入作为其来源的克隆型的目前组成员的宗族中(基于克隆型数据的上述分析)。在另一个实施方案中,如果以前未记录的克隆型与目前组的成员至少95%同源,则进行这种纳入。在另一个实施方案中,如果以前未记录的克隆型与目前组的成员至少98%同源,则进行这种纳入。
细胞也可能通过取代NDN区但保留V和V区段的过程以及它们积累的突变而进化。如果它们包含足够数量的突变而使得这些突变独立衍生的机会较小,可以通过鉴定共同的V和J区段来将这种细胞鉴定为以前未记录的癌克隆型。进一步的约束可能是NDN区与以前测序的克隆具有相似的大小。足量细胞的评价试验的灵敏度受限于产生在扩增反应中使用的核酸模板的细胞的数量。通常,每个细胞中存在约6pg DNA。因此,为了具有1/1000,000的灵敏度,需要使用约6yg DNA。然而,在外周血中,只有一部分细胞是B细胞,因此,来自外周血的约6 μ gDNA可能只有约100,000个B细胞。为了获得更高的灵敏度,可以使用更大量的DNA。一个问题可能是,由于使用更多的DNA,用DNA纯化的抑制剂的效果可能更大,并且可能看到样品与样品之间的差异。获得更纯的细胞群体可以改善这个问题。在临床情况下经常制备外周血单核细胞(PBMC)。来自PBMC的约6 μ gDNA可以具有约250,000-300, 000个B细胞。也可以进行B细胞的特异性捕获以获得更多的B细胞/ μ g使用的DNA。可以跟踪多于一种免疫受体重排以使灵敏度达到最大并改善克隆进化的问题。因此,如果跟踪3种重排,那么在它们之间分配可获得的细胞会降低对每种重排的分析的灵敏度。因此,以在分配之前扩增重排的所有3个基因座的方式扩增DNA(或RNA)可以缓解这个问题。以前已经采用了全基因组扩增方法,该方法在这里可用于在分配之前完成3个基因座的扩增。或者,可以采用在一个反应中对特定基因座进行扩增以实现相同的任务。在这种情况下,后来的分配并单独地扩增每种重排是任选的。当用来仅评价一种免疫受体重排时,在扩增特定免疫受体重排之前的全基因组扩增也可能是有用的。例如,体细胞超突变经常使IgH的评价复杂化,这使得通常希望使用多个引物组。在这种情况下,在使用不同引物组的不同反应之间分配输入核酸之前的全基因组扩增并不必然导致检测癌症特异性克隆型的灵敏度提高。在这种情况下,不同的(例如,3种)反应评价可获得的输入核酸的完整组库,因此没有全基因组扩增的优势(除了保留DNA用于其他探询)。然而,当在与引物互补的序列处发生体细胞超突变时,情况并不是这样。例如,如果只有一种代表癌特异性克隆型的DNA分子,那么它会参与三个反应中的一个。体细胞超突变阻止这种特定克隆型被扩增。另一方面,全基因组扩增防止上述情形发生,因为癌特异性序列的初始单分子被扩增,因此存在于所有3个管中。所以,即使在用于基因座扩增的输入模板中癌特异性克隆型的频率没有增加,它存在于所有3个管中的事实也是一个优势。除了全基因组扩增外,可以使用诸如长距离PCR等方法或使用来自所有3个引物组的引物进行基因座特异性扩增或进行初步扩增。淋巴肿瘤的筛查。上述方法适用于初步诊断后患者的监测;然而,本发明也适用于癌症筛查。原发癌的筛查是降低死亡率的主要力量。淋巴肿瘤的早期检测可导致这些癌症的生存率大大提高。至少在急性和慢性淋巴细胞白血病中已经表明,在确诊之前数年可以检测到特定的癌症克隆型。也可能比使用目前的诊断方法更早地检测到淋巴瘤克隆型。利用本发明,通过如上所述对免疫细胞受体进行测序,可以进行用于筛查目的的癌症克隆型的检测(即,在原发肿瘤发生之前)。每位患者中的癌症克隆型可能是独特的,显然无法预先知道每位患者中被筛查的序列。然而,为了鉴定可能与癌症相关的克隆型,上面列出的许多方法可用于来自尚未诊断出癌症的患者的血液,它们的水平和这些水平的变化可用于评价患者发生临床癌症的风险。淋巴肿瘤的类型。本发明的方法可以用于监测淋巴肿瘤,例如,淋巴瘤或白血病。成熟B细胞肿瘤可以包括,例如慢性淋巴细胞白血病/小淋巴细胞淋巴瘤、B细胞幼淋巴细胞白血病、淋巴浆细胞性淋巴瘤(如1Waldenstrdm巨球蛋白血症)、脾边缘区淋巴瘤、浆细胞肿瘤(浆细胞骨髓瘤、浆细胞瘤、单克隆免疫球蛋白沉积疾病和重链病)、结外边缘区B细胞淋巴瘤(MALT淋巴瘤)、淋巴结边缘区B细胞淋巴瘤(NMZL)、滤泡性淋巴瘤、套细胞淋巴瘤、弥漫性大B细胞淋巴瘤、纵隔(胸腺)大B细胞淋巴瘤、血管内大B细胞淋巴瘤、原发性渗出性淋巴瘤和伯基特淋巴瘤/白血病。成熟T细胞肿瘤可以包括,例如,T细胞幼淋巴细胞白血病、T细胞大颗粒淋巴细胞白血病、成人T细胞白血病/淋巴瘤、结外T细胞淋巴瘤(鼻型)、肠病变型T细胞淋巴瘤、肝脾T细胞淋巴瘤、蕈样真菌病/Sezary综合征、原发性皮肤CD30阳性T细胞淋巴组织增生性疾病、原发性皮肤间变性大细胞淋巴瘤、淋巴瘤样丘疹病、血管免疫母细胞性T细胞淋巴瘤、外周T细胞淋巴瘤(未指定的)或间变性大细胞淋巴瘤。本发明的方法可以用来监测急性白血病或慢性白血病。白血病可以是急性淋巴细胞白血病(ALL)(例如,前体B急性淋巴细胞白血病、前体T急性淋巴细胞白血病、伯基特白血病和急性双表型白血病);慢性淋巴细胞性白血病(CLL)(例如B细胞幼淋巴细胞白血病);急性髓性白血病(AML)(例如,急性早幼粒细胞白血病、急性髓母细胞白血病和急性巨核母细胞白血病);慢性髓细胞性白血病(CML)(例如,慢性单核细胞白血病);毛细胞白血。籘-细胞幼淋巴细胞白血病(T-PLL);或大颗粒淋巴细胞白血病。1.癌症筛查可以利用抗原特异性T和/或B细胞谱分析来了解临床状况的另一个例子是在癌症筛查中使用特定的癌症自身抗原。癌细胞经常产生抗原性的异常分子并引发免疫应答。为了评价患者继续发展癌症的可能性,可以直接在血液或体液中筛查这类分子。然而,已经证明这些方法的灵敏度是一个限制因素,因为当癌症处于早期阶段时(此时它们最可能是可治疗的且无症状的),这些抗原在血液或其他体液中以非常小的浓度存在。然而,这些抗原性分子可以引发免疫应答,尽管这种免疫应答可能不足以控制肿瘤的生长,但是作为检测早期癌症的一种方式,它的强度可能足以被检测到。已经检测了针对例如肺癌和乳腺癌细胞特异性的抗原的抗体,该抗体可以被用作使用抗原本身捕获并检测抗体以筛查这些癌症的方式(M.Nesterova等人.Biochimica et Biophysica Acta 2006:1762:398_403)。如上所述,这些试验缺乏区分不同的抗体克隆的能力,且漏过任何潜在的针对肿瘤抗原的T细胞免疫应答。可以使用上述方法来同时富集T细胞和/或B细胞,所述T细胞和/或B细胞表达结合已知存在于肿瘤细胞中的抗原的TCR或BCR。为了鉴定特定个体中可能是针对这些抗原的免疫应答的一部分的T细胞或B细胞,使用本文所述的本发明,可以在抗原特异性T/BCR富集之前和之后产生克隆型频率。有数种可以在临床上实施本发明的方式。在第一个实施方案中,采集来自个体(要评价其发生危险性肿瘤的风险)的血液,并在富集结合特定组癌抗原的细胞之前和之后对完整的T和B细胞克隆型谱进行分析。这些抗原可以是单一抗原种类,一组抗原,或抗原的复杂混合物,或者可以是来自一种肿瘤或多种肿瘤混合的材料的完整混合物。这些抗原可以包括 p53、c-myc、NY-ESO-l、BRCAl、BRCA2、HER2、MUCl、CAGE、Sox2、GBU4-5、膜联蛋白1、cox-20除了包括核酸和氨基酸序列参数、长度、区段使用等其他参数外,根据频率在富集之前和之后的显著偏移,可以鉴定可能与针对这些抗原的免疫应答相关的克隆。基于这种类型的单一时间点测定,或者从至少第二时间点(其中这些克隆型的频率的变化被用来计算癌症的风险),可以确定发生癌症的风险。可以在第一时间点进行富集以鉴定相关抗原特异性克隆型,在不进行富集的后续时间点定量这些相关抗原特异性克隆型以计算风险评分。也可使用群体研究来产生算法以便从抗原特异性富集预测相关克隆型。在该群体研究中,获得多于一个具有已知癌症风险的个体,并使用本发明的技术鉴定抗原特异性克隆型。使用该群体来产生一种算法,可以使用这种算法来预测在癌症风险未知的新个体中与疾病相关的抗原特异性克隆型。J.药物不良反应药物治疗的益处经常被它们的不良反应所制衡。大多数药物不良反应(ADR)基本上可预见的并且是剂量依赖性的。其他ADR是特应性的,其中许多是由免疫机制引起的。对这些ADR的数种的易感性与特定的HLA基因型相关。理想地,患者在得到药物之前知道他们易患ADR。最近,FDA在HIV药物阿巴卡韦的标签上增加了在开始治疗之前检测等位基因HLA-B*5701的建议,因为具有这种基因型的患者易发生药物超敏反应。在不可能告诉患者他们易患ADR的情况下,期望在出现任何症状前通过血液检验来检测ADR的迹象。有数种方法可以诊断免疫相关的ADR。有数种通过使患者暴露于药物而再现药物变态反应的体内方法(皮肤试验、皮内、斑片试验和药物激发试验)。体外方法包括评价嗜碱性细胞活化、药物特异性IgE和药物特异性淋巴细胞刺激试验。使用药物特异性淋巴细胞活化的不同形式来评价淋巴细胞活化的不同性质。其中包括淋巴细胞刺激、淋巴细胞迁移、淋巴细胞毒性和淋巴细胞转化试验。这些试验的一些变形包括评价活化标记物如⑶69或释放的细胞因子的水平。通常,使用所有这些方法来诊断已经具有变态反应的患者,而不是预测超敏反应。额外的问题困扰着不同的技术。例如,一些体内试验在患者中具有一定的重度变应性应答的风险。嗜碱性细胞活化缺乏对相关抗原的特异性,药物特异性IgE仅仅与涉及IgE的那些变态反应类型(例如,溶血性贫血和过敏反应)相关。因此,需要一种能够在药物施用之前或症状出现之前预测ADR的方法。评价T和/或B细胞组库可以产生这种试验。可以使用一些体外方法来鉴定与药物相互作用的克隆型。例如,可以用特定药物进行淋巴细胞刺激试验以鉴定与药物相互作用的克隆型。K.组织损伤检测已经表明,在血液和体液和/或组织中使用分子标记物能够提供关于可能发生损伤的器官的重要信息,该信息可以帮助疾病诊断和指向治疗性干预。这种标记物的一个例子是作为心脏病诊断的一部分的血液中的蛋白质肌钙蛋白的检测。肌钙蛋白是对于心脏组织高度特异性的分子,其主要包含在心脏组织中的细胞内,对于心脏健康的个体,以非常低的水平存在于循环中。然而,当心脏病发生时,细胞死亡和凋亡导致该分子和其他分子溢出进入血流,其中使用ELISA试验的灵敏检测可以揭示明显与心脏病相关的升高的肌钙蛋白水平。这种范例可以很容易地扩展到可能遭受类似损伤的其他组织,但是研究人员鉴定如下标记物的能力限制了这类技术,该标记物对于给定组织足够特异从而提供诊断上相关的信息,并且在组织损伤的早期足够丰富从而在可能导致器官损伤的疾病的过程中在临床上有用的时间提供信息。已经表明,尽管在人细胞上存在的表面标记物不会导致免疫反应,但是当细胞内部包含的分子被释放进血流中时,它们可能是免疫原性的。如在检测癌症自身抗原的情况下,与在肌钙蛋白的情况下进行的该类型的直接抗原检测相比,通过检测可与这些抗原反应的免疫细胞可以更灵敏地间接检测这些与器官损伤相关的自身抗原。因此,可以使用本发明来提供对个体中器官损伤水平的诊断性洞察。在本实施方案中,使用上述方法富集可与特定类型的人组织内发现的分子的特异性抗原反应的T和/或B细胞。可以使用T和/或B细胞克隆型频率在富集之前和之后的偏移来确定哪些克隆型可能与这些抗原反应。可以将这种方法与使用序列参数的序列算法相组合以确定这些富集的克隆型中哪些最可能与这些抗原反应。也可以使用涉及多于一个具有已知器官损伤的个体(其抗原特异性相关克隆型已经根据经验确定)的群体研究来确定算法,可以使用该算法通过在随后的个体中鉴定通常与这些相关克隆型相关的序列特征来优化这些预测。可以至少在第一时间点进行抗原特异性克隆型关联以鉴定并预测相关克隆型。然后可以在进行或不进行抗原特异性富集的情况下分析在随后的时间点采样的血液或体液以测定这些相关克隆型的水平,该水平可以用来产生与该个体在该时间的特定器官损伤程度相关的器官损伤评分。可以使用这些克隆型的水平来建立这种评分,可以随着时间而变化的这些克隆型的水平也可以建立这种评分。在本实施方案中可以使用针对特定组织的抗原。组织可以是:心、肺、肝、肠、胰、食道、胃、肾、神经、睾丸、卵巢、前列腺、胸腺、胎盘、子宫等。针对这些组织中的每一种的抗原可以是已知在这些组织中特异性表达的一组选择的基因产物。这些特异性表达的基因产物可以是考虑在这些器官和其他器官之间的差异基因表达的结果。该抗原可以是单一抗原、一组抗原或者材料的复杂混合物,该材料可以是且包括来自所述组织的完整细胞的材料。L.暴露于本地抗原的鉴定在本发明的一个实施方案中,使用所述方法来产生基于本地抗原的与具体地理位置相关的免疫谱的数据库。这些抗原可以是但不限于本地花粉。这些抗原可以具有季节性组分。一旦产生了地理位置相关的免疫谱,将受试者目前的免疫谱与该数据库进行比较。使用这种比较来确定受试者最近是否曾经暴露于本地抗原。在一个实施方案中,该方法用来测试受试者是否处在被怀疑的地区。在另一个实施方案中,该方法用来在没有预先怀疑受试者所处地区的情况下确定受试者可能去过的地方。因此,本发明用于确定个体暴露于一种或多种抗原的方法可以包括以下步骤:(a)从个体的B细胞和/或T细胞样品确定克隆型谱,该样品包含其克隆型的组库;和(b)比较该谱的克隆型与抗原特异性克隆型数据库的克隆型以确定克隆型匹配的水平,从而确定暴露于抗原的水平,抗原特异性克隆型数据库包括对于一种或多种抗原为特异性的人TCR和/或免疫球蛋白链的基本上所有的克隆型。在一个实施方案中,所述一种或多种抗原由病原体的抗原组成。在另一实施方案中,病原体是病毒。在另一个实施方案中,这种病毒是流感病毒、天花病毒、丙型肝炎病毒、冠状病毒、登革热病毒或慢病毒。在一个实施方案中,这种抗原特异性克隆型数据库由克隆型组成,该克隆型由人TCRP和IgH链的基本上所有⑶R3区组成。M.暴露于生物恐怖相关抗原的鉴定
在本发明的一个实施方案中,使用所述方法来产生与抗原相关的免疫谱的数据库,该抗原可能与生物恐怖相关化合物的产生有关。这些抗原可以是但不限于能够被制成武器的病毒载体。一旦产生了免疫谱,将受试者目前的免疫谱与数据库进行比较。使用这种比较来确定受试者最近是否曾经暴露于生物恐怖相关化合物。在一个实施方案中,该方法用来测试受试者是否暴露于所怀疑的特定化合物。在另一个实施方案中,该方法用来在没有预先怀疑哪些化合物的情况下确定受试者是否可能已经暴露于一系列潜在的化合物。在一个实施方案中,在已经发现生物试剂之后产生将要检测的免疫谱。例如,由当局确定具有生物恐怖攻击嫌疑的个体。从嫌疑人获得样品,使用上述方法获得免疫谱。将这种免疫谱与包含许多样品谱的数据库进行统计学比较。样品谱包括代表某些生物恐怖相关抗原的免疫谱。样品谱包括代表某些抗原或抗原组合的免疫谱,该抗原只在该年的特定时间存在于特定地理位置。嫌疑人的免疫谱与这种数据库的比较提供了嫌疑人在特定时间范围内处在特定地理位置以及嫌疑人暴露于某些生物恐怖相关抗原的证据。该证据用来进一步指导调查并在诉讼中使用。试剂盒在本文所述方法的商业化中,用于扩增特定的体细胞重排区域或其部分的试剂盒是特别有用的。此类试剂盒可以用于进行单阶段或两阶段PCR (如上所述),该PCR用于扩增预先确定的体细胞重排区域或其部分,目的在于制备用于序列分析的克隆型的样品。试剂盒一般包括一种或多种试剂,例如,但不限于:核酸引物,其包装在容器中,例如,但不限于,小瓶、管或瓶中,在适合于商业分发的包装中,例如,但不限于,盒子、密封袋、泡罩包装或纸箱中。包装通常包含标签或包装插页,其指明包装的试剂可用在从患者的组织样品产生克隆型谱的方法中。如本文所用,“包装材料”包括在用于试剂盒中试剂的分布的包装中使用的任何物品,包括但不限于容器、小瓶、管、瓶、袋、泡罩包装、标签、标记物、说明书和包装插页。这种试剂盒的一个例子包括对于在一个管中如上所述从自患者的T细胞或患者的外周血淋巴细胞或患者的骨髓提取的DNA或RNA扩增TCRii序列所必要的试剂。这种试剂盒的一个例子包括对于在多个管中如上所述从自患者的B细胞或患者的外周血淋巴细胞或患者的骨髓提取的DNA或RNA扩增IgH序列所必要的试剂。在后者的例子中,必要的试剂包括用于如上所述产生巢式模板组的多组引物。通常,这种多组为2或3或4组。对于后者的例子中,在一个实施方案中,提供三组引物;更具体地,提供以下三组引物:第I组包括来自表5的正向引物和来自表8的反向引物;第2组包括来自表6的正向引物和来自表8的反向引物;第3组包括来自表7的正向引物和来自表8的反向引物。在另一个例子中,试剂盒包括上述的试剂,包括一个或多个PCR引物组和热稳定的DNA聚合酶如Taq聚合酶,以及如果从RNA扩增序列,则包括逆转录酶。引物的存在量可以使得如上所述产生患者样品中个体克隆型序列的平衡扩增。在本发明的一个方面中,提供引物的量以确?寺⌒偷钠胶饫┰。多重PCR反应的这种平衡是本领域普通技术人员公知的,包括但不限于,调整反应中引物的浓度和/或选择引物在感兴趣的区域中的位置和长度以增加或减少个体引物的退火速率。在一个实施方案中,选择引物的量以使在PCR中它们的浓度使得每条引物与其引物结合位点退火的速率基本上相同。在另一个实施方案中,选择引物的量以使得样品中每个序列被扩增的量在克隆型的随机样品的平均扩增量的2倍以内。在又一个实施方案中,这种随机样品含有至少100个克隆型。热稳定的DNA聚合酶和转录酶可从多家制造商商业获得。试剂盒中的额外材料可以包括:合适的反应管或小瓶,障碍组合物,通常为蜡珠,任选地包括镁;用于PCR阶段的反应混合物(通常是浓缩的,例如2X、5X、10X或20X),包括必要的缓冲液和试剂如dNTPs ;无核酸酶或无RNase的水;RNase抑制剂;一种或多种对照核酸(即,如内部标准),和/或任何额外的缓冲液、化合物、辅因子、离子组分、蛋白质和酶、聚合物和可用于多重PCR反应中的类似物。以商业上可行的任何方式包装试剂盒中的组分。例如,可以将PCR引物和/或逆转录酶单独包装以助于配置试验的灵活性,或者一起包装以增加易用性以及减少污染。同样,可以单独或一起包装缓冲剂、盐和辅因子。该试剂盒也可以包括适用于从组织样品手动或自动提取核酸的试剂和机械组分。这些试剂对于本领域技术人员是已知的,通常是设计选择的问题。比如,在自动化过程的一个实施方案中,在试剂盒中提供的合适的裂解溶液中超声破坏组织。实施例1 确定自身免疫性疾病的状态从多发性硬化症发作高峰的患者采集脑脊液(CSF)和血液样品。从脑脊液和血液中分离⑶4+细胞,通过PCR扩增T细胞受体β基因的⑶R3。进一步扩增该扩增的片段以添加用于Solexa测序的桥接扩增引物结合位点和测序引物结合位点。对T细胞受体β基因的可变区进行测序以鉴定克隆型。用序列信息来产生患者的克隆型谱。当患者处于多发性硬化症的相对非活动性状态时,采集另一份血液样品。重复如上相同的步骤以产生克隆型谱。病理性克隆型被确定为那些在发作高峰时较高而在非活动状态时明显下降的克隆型。从后一种状态的患者中采集另一份血液样品。此时,仅对T细胞受体β基因⑶R3区的一部分进行扩增,然后测序。该亚组包含病理性克隆型。确定各种克隆型的水平以评价患者的疾病状态。实施例2TCRP组库分析:扩增和测序策略在该实施例中,分析TCRP链。该分析包括扩增、测序并分析TCRP序列。一条引物AGCGACCTCGGGTGGGAACA (SEQ ID NO:1)与C β I和C β 2中的共有序列互补,有34条能够扩增所有48个V区段的V引物(表I)。Ci31或Ci32在从J/C连接起的第10和14位彼此不同。用于ce I和⑶2的引物终止于i6bP位置处,并且对于ce ι或c^2没有偏好。这34条V引物由Van Dongen等的美国专利公开2006/0234234 (其通过引用并入本文)中公开的一组原始引物修饰而成。表I与不同的V家族互补的引物序列
权利要求
1.一种监测患者中的疾病的方法,所述方法包括以下步骤: (a)通过从疾病相关组织中的淋巴细胞样品确定克隆型谱来鉴定ー种或多种与疾病相关的患者特异性克隆型,所述淋巴细胞样品包含来自所述疾病相关组织的克隆型的组库;和 (b)从外周血细胞样品确定克隆型谱来鉴定ー种或多种与疾病相关的患者特异性克隆型的存在、不存在和/或水平,该外周血细胞样品包含克隆型的组库。
2.权利要求1的方法,进ー步包括重复所述步骤(b)以监测患者中的疾病或病状的步骤。
3.权利要求1的方法,其中所述鉴定步骤进一歩包括从同一患者中的非疾病相关组织中的淋巴细胞样品确定克隆型谱,并将该克隆型谱与来自所述疾病相关组织的克隆型谱进行比较,以鉴定所述ー种或多种患者特异性克隆型。
4.权利要求3的方法,其中所述疾病 相关组织是来自所述疾病的高峰状态的组织,并且其中所述非疾病相关组织是来自所述疾病的非高峰状态的组织。
5.权利要求4的方法,其中所述疾病是自身免疫性疾病。
6.权利要求5的方法,其中所述自身免疫性疾病是系统性红斑狼疮,所述疾病相关组织是肾、皮肤、外周血或骨髄;所述自身免疫性疾病是多发性硬化症,所述疾病相关组织是脑脊液;或者所述自身免疫性疾病是类风湿关节炎,所述疾病相关组织是滑液。
7.权利要求5的方法,进ー步包括重复所述步骤(b)以监测患者中的疾病或病状的步骤。
8.权利要求1的方法,其中所述疾病是淋巴瘤,所述疾病相关组织是骨髓或淋巴组织;或者所述疾病是白血病,所述疾病相关组织是骨髓或外周血。
9.权利要求8的方法,进ー步包括重复所述步骤(b)以监测患者中的疾病或病状的步骤。
10.权利要求8的方法,其中所述鉴定步骤进一歩包括从同一患者中非疾病相关组织中的淋巴细胞样品确定克隆型谱,并将该克隆型谱与来自所述疾病相关组织的克隆型谱进行比较,以鉴定所述ー种或多种患者特异性克隆型。
11.权利要求1的方法,其中所述鉴定步骤进一歩包括从同一患者中非疾病相关组织中的淋巴细胞样品确定克隆型谱,并将该克隆型谱与来自所述疾病相关组织的克隆型谱进行比较,以鉴定所述ー种或多种患者特异性克隆型。
12.权利要求11的方法,进ー步包括重复所述步骤(b)以监测患者中的疾病或病状的步骤。
13.权利要求11的方法,其中根据在所述疾病相关组织中与在所述非疾病相关组织中具有不同的频率;或者根据在所述疾病相关组织中与在所述非疾病相关组织中具有不同程度的基于IgH的克隆型中的体细胞超突变;或者根据在所述疾病相关组织中与在所述非疾病相关组织中具有不同的V区和J区使用频率;或者根据在所述疾病相关组织中与在所述非疾病相关组织中具有不同平均长度的NDN区;或者根据在所述疾病相关组织中与在所述非疾病相关组织中具有不同的BCR和/或TCR表达水平;或者根据在所述疾病相关组织中与在所述非疾病相关组织中具有不同数量的编码相同或相似蛋白质的克隆型,来鉴定所述ー种或多种患者特异性克隆型。
14.权利要求13的方法,进一步包括重复所述步骤(b)以监测患者中的疾病或病症的步骤。
15.权利要求13的方法,其中根据在所述疾病相关组织中比在所述非疾病相关组织中具有更高的频率来鉴定所述一种或多种患者特异性克隆型。
16.权利要求13的方法,其中根据在所述疾病相关组织中与在所述非疾病相关组织中具有不同的V区和J区使用频率来鉴定所述一种或多种患者特异性克隆型。
17.权利要求13的方法,其中根据在所述疾病相关组织中与在所述非疾病相关组织中具有不同平均长度的NDN区来鉴定所述一种或多种患者特异性克隆型。
18.权利要求13的方法,其中根据在所述疾病相关组织中与在所述非疾病相关组织中具有不同的BCR和/或TCR表达水平来鉴定所述一种或多种患者特异性克隆型。
19.权利要求1的方法,其中通过将确定的克隆型与已知与所述疾病相关的克隆型进行匹配,或者通过将V区和J区使用与已知与所述疾病相关的V区和J区使用的频率进行匹配,来鉴定所述一种或多种患者特异性克隆型。
20.权利要求19的方法,其中所述匹配包括发现由所述确定的克隆型所编码的氨基酸序列与由已知与所述疾病相关的克隆型或其基本上相同的变体所编码的氨基酸序列之间的同一'I"生。
21.权利要求19的方法,其中所述匹配包括发现所述确定的克隆型与已知与所述疾病相关的克隆型或其基本上相同的变体的核酸序列之间的同一性。
22.权利要求19的方法,其中所述匹配包括发现所述确定的克隆型与已知与所述疾病相关的克隆型或其基本上相同的变体的核酸序列之间的同一性。
23.权利要求1的方法,其中所述组库中的每一个有99%的概率包括以0.01%或更高的频率存在的每种克隆型。
24.权利要求1的方法,其中所述组库中的每一个包括至少含IO4个克隆型的样品。
25.权利要求1的方法,其中所述组库中的每一个包括至少含IO5个克隆型的样品。
26.权利要求1的方法,其中所述疾病选自淋巴增生性疾病、实体瘤、感染性疾病和自身免疫性疾病。
27.权利要求26的方法,其中所述从所述血细胞样品确定所述组库的步骤进一步包括包含任何以前未记录的所述一种或多种患者特异性克隆型的系统发生克隆型作为所述一种或多种患者特异性克隆型。
28.权利要求26的方法,其中所述系统发生克隆型包括与所述一种或多种患者特异性克隆型中的任一种90%相同的以前未记录的克隆型。
29.权利要求26的方法,其中所述系统发生克隆型包括通过体细胞超突变与所述一种或多种患者特异性克隆型相关的以前未记录的克隆型。
30.权利要求26的方法,其中所述疾病是淋巴增生性疾。⑶移渲兴鱿低撤⑸寺⌒桶ㄍü逑赴嘏庞胨鲆恢只蚨嘀只颊咛匾煨钥寺⌒拖喙氐囊郧拔醇锹嫉目寺⌒。
31.权利要求30的方法,其中所述体细胞重排包括VH替代。
32.权利要求30的方法,其中所述体细胞重排包括与所述一种或多种患者特异性克隆型中的任一种具有相同突变的V区和J区但是与该患者特异性克隆型具有不同的NDN区的克隆型。
33.权利要求27的方法,其中所述鉴定步骤进一步包括从同一患者中非疾病相关组织中的淋巴细胞样品确定克隆型谱,并将该克隆型谱与来自所述疾病相关组织的克隆型谱进行比较,以鉴定所述一种或多种患者特异性克隆型。
34.权利要求27的方法,其中所述疾病是淋巴瘤或白血。⑶移渲兴鋈范ǖ牟街(b)进一步包括从来自所述外周血的所述样品的所述克隆型计算克隆性的度量。
35.一种监测患者中的疾病的方法,所述方法包括以下步骤: (a)将来自患有疾病的个体的淋巴细胞样品的克隆型谱与来自同一个体的、基于与该疾病相关的细胞表面标记物富集的淋巴细胞样品的克隆型谱进行比较,以鉴定一种或多种与该疾病相关的患者特异性克隆型;和 (b)确定来自外周血细胞样品的克隆型谱中一种或多种患者特异性克隆型的每一种的水平,该样品包含其克隆型的组库。
36.权利要求35的方法,其中所述从所述血细胞样品确定所述组库的步骤包括将任何以前未记录的所述一种或多种患者特异性克隆型的系统发生克隆型作为所述一种或多种患者特异性克隆型。
37.权利要求35的方法,其中所述疾病是淋巴增生性疾病。
38.权利要求35的方法,其中所述方法进一步包括重复所述步骤(b)以监测所述疾病或病状的步骤,并且其中所述组库中的每一个有99%的概率包括以0.01%或更高的频率存在的每种克隆型。
39.权利要求35的方法,其中所述方法进一步包括重复所述步骤(b)以监测所述疾病或病状的步骤,并且其中所述组库中的每一个包括至少含IO4个克隆型的样品。
40.权利要求35的方法,其中所述疾病是自身免疫性疾病。
41.权利要求40的方法,其中所述从所述血细胞样品确定所述组库的步骤包括将任何以前未记录的所述一种或多种患者特异性克隆型的系统发生克隆型作为所述一种或多种患者特异性克隆型。
42.权利要求40的方法,其中所述方法进一步包括重复所述步骤(b)以监测所述疾病或病状的步骤,并且其中所述组库中的每一个有99%的概率包括以0.01%或更高的频率存在的每种克隆型。
43.权利要求40的方法,其中所述方法进一步包括重复所述步骤(b)以监测所述疾病或病状的步骤,并且其中所述组库中的每一个包括至少含IO4个克隆型的样品。
44.权利要求40的方法,其中所述自身免疫性疾病是系统性红斑狼疮。
45.一种同时测定样品中的淋巴细胞数量和克隆型表达水平的方法,所述方法包括以下步骤: 从个体获得包含T细胞和/或B细胞的样品; 对源自所述细胞的基因组DNA的在空间分离的个体分子进行测序,该空间分离的个体分子包含与样品中的许多淋巴细胞相对应的许多克隆型; 对源自所述细胞的RNA的空间分离的个体分子进行测序,该空间分离的个体分子包含与它们在样品的淋巴细胞中的表达水平相对应的许多克隆型;和 对于每种克隆型,通过将从源自所述细胞基因组DNA的分离的个体分子确定的数量与从源自所述细胞RNA的分离的个体分子确定的数量进行比较,来确定所述样品的淋巴细胞中的克隆型表达水平。
46.权利要求45的方法,其中所述确定步骤进一步包括通过将已知量的内部标准加至所述基因组DNA来确定所述样品中的所述淋巴细胞的数量。
47.权利要求45的方法,其中所述样品是具有确定体积的外周血样品,并且其中所述确定步骤包括确定所述样品中所述淋巴细胞的浓度。
48.权利要求45的方法,其中所述确定所述表达水平的步骤包括对于每个所述克隆型,将从源自所述RNA的所述分离的个体分子确定的所述克隆型数量除以从源自所述基因组DNA的所述分离的个体分子确定的所述克隆型数量。
49.权利要求45的方法,其中所述对源自所述RNA的所述空间分离的个体分子进行测序的步骤包括用指示其RNA来源的第一标记物标记每种所述空间分离的个体分子,并且其中所述对源自所述基因组DNA的所述空间分离的个体分子进行测序的步骤包括用指示其基因组DNA来源的第二标记物标记所述空间分离的个体分子,使得第一标记物与第二标记物可区别开。
50.权利要求45的方法,其中所述样品包含与所述数量的所述淋巴细胞相对应的所述数量的所述克隆型的组库,所述淋巴细胞包含克隆型的组库。
51.权利要求50的方法,其中所述样品包含B细胞。
52.权利要求50的方法,其中所述样品包含T细胞。
53.一种同时测定样品中的淋巴细胞数量和淋巴细胞克隆性的方法,所述方法包括以下步骤: 从个体获得包含T细胞和/或B细胞的样品; 对源自所述细胞的核酸的空间分离的个体分子进行测序,该空间分离的个体分子包含与样品中的许多淋巴细胞相对应的许多克隆型; 从空间分离的个体分子的数量确定淋巴细胞的数量; 确定所述空间分离的个体分子的不同序列的丰度,以基于其产生克隆型谱和克隆性的度量。
54.权利要求53的方法,其中所述确定所述数量的步骤进一步包括通过将已知量的内部标准加至所述基因组DNA来确定所述样品中的所述淋巴细胞的数量。
55.权利要求54的方法,其中所述样品是具有确定体积的外周血样品,并且其中所述确定所述数量的步骤包括确定所述样品中的所述淋巴细胞的浓度。
56.权利要求53的方法,其中所述样品包含与所述淋巴细胞的所述数量相对应的所述克隆型的所述数量的组库,所述淋巴细胞包含克隆型的组库。
57.权利要求56的方法,其中所述样品包含B细胞。
58.权利要求56的方法,其中所述样品包含T细胞。
59.权利要求53的方法,其中所述疾病是淋巴瘤,而所述疾病相关组织是骨髓或淋巴组织;或者其中所述疾病是白血。黾膊∠喙刈橹枪撬杌蛲庵苎。
60.一种监测个体对疫苗接种的响应性的方法,所述方法包括以下步骤: 在接种疫苗后从个体的外周血富集淋巴细胞样品,以获得疫苗响应性淋巴细胞的样品;从疫苗响应性淋巴细胞的样品确定克隆型谱,以鉴定与疫苗响应相关的一种或多种患者特异性克隆型; 从在一个或多个后续时间获得的外周血细胞样品确定克隆型谱中一种或多种患者特异性克隆型的各自的水平,以监测个体对疫苗接种的响应性。
61.一种监测患者中的淋巴增生性疾病的方法,所述方法包括以下步骤: (a)通过从骨髓样品确定淋巴细胞的克隆型谱来鉴定一种或多种与淋巴增生性疾病相关的患者特异性克隆型,所述样品包含克隆型的组库;和 (b)在后续时间从骨髓或外周血细胞样品确定克隆型谱,以鉴定一种或多种与该疾病相关的患者特异性克隆型的存在、不 存在和/或水平,这种后来的骨髓样品或外周血样品包括克隆型的组库。
全文摘要
需要改进的用于明确患有病状的患者的诊断和预后的方法,尤其是针对自身免疫性疾病和癌症,特别是淋巴肿瘤,如淋巴瘤和白血病。本文提供了利用DNA测序鉴定淋巴肿瘤、自身免疫性疾病和其他病状患者中的个性化或患者特异性生物标记物的方法。鉴定的生物标记物可以用来确定和/或监测患有相关淋巴病状或自身免疫性疾病或其他病状的受试者的疾病状态。特别是,本发明提供了用于监测经历克隆进化的淋巴肿瘤的灵敏方法,而不需要针对作为患者特异性生物标记物的进化的或突变的克隆开发替代试验。
文档编号G01N33/48GK103097888SQ201180033142
公开日2013年5月8日 申请日期2011年5月4日 优先权日2010年5月6日
发明者马利克·法哈姆, 托马斯·威利斯 申请人:赛昆塔公司