客观日本

日本理研查清癌症全基因组的微卫星不稳定性

2020年04月06日 生物医药

日本理化学研究所(简称“理研”)生命医科学研究中心癌症基因组研究小组的藤本明洋副组长和中川英刀组长等组成的联合研究团队,从2,700多例癌症全基因组序列数据中,鉴定出名为“微卫星(MS)”的基因组重复序列突变,并明确了其特征。该研究作为国际合作开展的全基因组泛癌分析项目(PCAWG)的一环,是迄今为止关于癌症全基因组“微卫星不稳定性(MSI)”最全面的研究和诊断。

该研究成果可用于癌症免疫疗法的适应性诊断和遗传性肿瘤诊断,并有望推动新一代癌症基因组医疗研究的发展。

使用高突变率MS标志物的MSI检测目前应用于遗传性肿瘤诊断和癌症免疫疗法的适应性诊断。不过,重复序列分析非常难做,所以此前一直不清楚全基因组发生了什么样的MS突变。

此次,联合研究团队开发了确定全基因组的MS突变的高精度分析法“MIMcall”,对PCAWG分析的21种癌症的2,717例全基因组序列数据,实施了每例平均约765万处、合计约200亿处的MS突变分析。发现虽然大多数MS中未发现突变,但大约20万处MS中有多个癌症基因组发生突变(约占分析的所有MS的2.6%)。其中31例癌症(大肠癌、子宫内膜癌、胃癌等)发现的MS突变数量极多,判断为MSI。另外,新确定了20个高频率突变的MS标志物,并发现突变频率与现有MS标志物相当,MSI检测精度也基本相同。

相关研究成果预定发布在科学期刊《Genome Research》上,已于3月25日在网络版公开。

背景

癌症是随着基因组不断发生突变而发病和恶化的“基因组疾病”,所以说,癌症的本质在于“基因组的不稳定性”。目前,全球正积极开展全面的癌症全基因组序列分析,并根据获得的癌症基因组突变数据开发新药及实施精准医疗(癌症基因组医疗)。理研团队2014~2019年通过癌症基因组领域的国际联合项目“全基因组泛癌分析(PCAWG)”,对癌症实施了大规模的全基因组序列分析,由此发布了最全面最详细的癌症基因组目录。

在人类基因组的30亿个碱基序列中,重复序列约占一半。其中,1~6个碱基重复数十次的序列被称为“微卫星”,人类基因组被认为拥有1000万个以上的MS。MS的突变率较高,而且个体间的重复长度具有丰富的遗传多态性,因此可作为遗传标志物用于群体遗传学和谱系分析等研究。

癌症诊疗通过检查几种MS标志物是否存在突变(重复长度变化)来判断“微卫星不稳定性(MSI)”,用于诊断DNA修复机制缺损的遗传性肿瘤(林奇综合征)。另外,近年来发现,MSI阳性癌症对使用免疫检查点抑制剂的治疗反应良好,因此,MSI检测还被作为免疫检查点抑制剂的适应标准,受到了广泛关注。不过,此前MSI检测虽然使用了几种具有高突变率的MS标志物,但一直不清楚整个基因组发生了什么样的MS突变。此外,关于MS的高突变率机制也有很多不明之处。

近年来,随着新一代测序仪(NGS)技术的快速发展以及信息分析技术和IT硬件技术的革新,约由30亿个碱基信息构成的人类全基因组序列分析可以低成本轻松实施。今后,不仅是研究,预计全基因组序列分析在癌症基因组医疗等诊断和精准医疗方面也将成为重要的分析方法。不过,利用现在的NGS分析技术,极难对MS和重复序列位点进行分析,目前还没有利用NGS对全基因组实施大规模的MS分析。

研究方法与成果

重复序列MS在聚合酶链反应(PCR)及NGS的序列分析阶段容易出现错误。为明确此测量中的错误频率和模式,联合研究团队着眼于男性正常DNA全基因组序列数据中X染色体上的MS。因为男性的X染色体只有一条,无需像位于其他染色体上的MS那样评估两个等位基因。因此,联合研究团队根据男性X染色体的数据推算了MS在全基因组序列中的人为突变比例,然后利用该信息,开发了确定癌症中的MS突变的分析法“MIMcall”,并确认该方法具有很高的精度。

接下来,联合研究团队利用MIMcall,针对PCAWG分析的21种2,717例癌症全基因组序列数据(癌症和正常),以每例平均约765万处、合计约为200亿处的MS为对象实施了突变分析。由此发现,虽然大多数MS中未发现突变,但大约20万处MS中有多个癌症基因组发生突变,而且这些突变MS大多位于未编码蛋白质的基因组区域。

另外发现,突变MS的个数与全基因组中的SNV(单碱基替换)突变数量没有关系,但与indel(短插入、缺失)突变数量密切相关。MS突变与indel突变的发生机制相同。此外,详细分析突变MS的特征发现,腺嘌呤 A和胸腺嘧啶T的重复会导致突变率升高(图1上)、MS突变与DNA的复制时间和DNA结构有关等。

在整个基因组分析的约765万处MS中,将有3%以上的MS发生突变的肿瘤定为MSI阳性,由此在整个基因组确定了31例MSI阳性癌症。其中,大肠癌(59例中有7例)、胃癌(78例中有6例)和子宫内膜癌(50例中有11例)较多。此外肝癌、胰腺癌、卵巢癌、肾癌和恶性黑色素瘤各占1~2例(图1下)。

title

图1:21种癌症的全基因组微卫星(MS)突变率
上:针对A(腺嘌呤)重复26次的MS(黑色),显示了插入突变(蓝色)和缺失突变(红色)。
下:3%以上的MS发生突变的癌症判定为微卫星不稳定性(MSI:Microsatellite Instable,红点)。大肠癌、子宫内膜癌和胃癌检测出多个MSI阳性的样本。MS突变低于3%的癌症不属于微卫星不稳定性(MSS:Microsatellite Stable,黑点)。

在这31例MSI阳性癌症中,2例DNA修复基因的生殖细胞突变,相当于林奇综合征;还发现了很多DNA修复基因的体细胞突变。另外,MSI阳性癌症会随着突变表达很多新抗原,诱导抗原产生等的免疫原性被认为比较高。本研究推测,MSI阳性癌症的新抗原比MSI阴性癌症多,很多MSI阳性癌症是因为编码蛋白质的基因内的MS或者重复序列发生突变形成的。

研究团队还新确定了20个高频率突变的MS标志物,并利用埼玉县立癌症中心的大肠癌和子宫内膜癌DNA库,验证了MSI的诊断精度。由此确认新MS标志物的突变频率与现有MS标志物相当,MSI检测精度也基本相同(图2)。

title

图2:通过新MS标志物判断大肠癌和子宫内膜癌的MSI
用橙色标记了现有MSI诊断标志物(8个)、此次新确定的具有高突变率的MS标志物(20个)及蛋白质编码区(11个)的MS标志物的突变。可以看出MSI阳性大肠癌(24例)和子宫内膜癌(12例)具有相同程度的突变频率。MSI阴性大肠癌(22例)的突变频度也为同等水平,表明MSI检测精度也基本相同。

未来展望

随着DNA序列分析技术的创新带来成本降低,今后不仅是研究领域,预计全基因组序列分析在癌症诊断和精准医疗领域也将成为标准的基因组分析方法。

MSI是与癌症的本质“基因组不稳定”直接相关的现象,通过此次的大规模全基因组序列数据分析获得的关于MSI的知识,有助于查清癌症的真面目,预计今后会开发以该现象为靶标的治疗方法。

另外,此次开发的基于全基因组序列数据的MS突变分析法(MIMcall)和MSI检测法,还有望用于全基因组时代的癌症免疫疗法的适应性诊断及遗传性肿瘤诊断。

论文信息
题目:Comprehensive Analysis of Indels in Whole-genome Microsatellite Regions and Microsatellite Instability across 21 Cancer Types
期刊:《Genome Research》
DOI:10.1101/gr.255206.119


日语发表原文

中文:JST客观日本编辑部