TCGA癌症临床数据资源进一步介绍---癌症研究领域的全谱!

2021-11-04 10:42 来源:崇左妇科医院

2006年,肝胃癌DNA布谱(The Cancer Genome Atlas, TCGA)计划以多形病态胶质基因突变(GBM)、肺上皮细胞会细胞会胃癌(LUSC)和卵巢浆液病态囊腺胃癌(OV)开始为期3年的试点工程建设,2009年~2015年更进一步展开。到工程建设截止,TCGA在线数据资料量化新闻记者已描绘了33种肝胃癌多种类型10,000余实有高血压的分子会相同之处,并界定了很多分子会病毒性。TCGA包含的皆科关键因素相同之处代同上蓝营化的数据资料查阅。为确保自始确常用这些具DNA相同之处的都从皆科数据资料,在在TCGA完成一批重大成果,刊载在CellPress旗下的期刊。

本文对4同年5日刊载Cell上的一文同步进行编译。书评阐明以OS(总求生存期)、PFI(无成效每隔)、DFI(无染病每隔)和DSS(疾染病涉及活到)为四个主要皆科结果起点的TCGA蓝营肝胃癌皆科数据资料资源(TCGA-CDR)国际国际标准数据资料库系统,并计算出来了每种肝胃癌多种类型的起点常用决定。TCGA皆科数据资料可从DNA数据资料共享密闭(GDC)门户网站下载,所有的分子会数据资料在下载。皆科数据资料和分子会数据资料常用举实有来说的条码结构,便于高血压的皆科数据资料和样品分子会数据资料定位。

TCGA蓝营胃癌数据资料库系统描述符相同之处

布1A为皆科数据资料定位和一原理及4个主要皆科起点都是以和检验的举实有来说,对33份初始提出申请和97份严重不足之处数据资料文件,共33种肝胃癌多种类型111,60实有肝胃癌高血压的数据资料同步进行了应对。同上1为每个TCGA描述符的简而言之。按原发样品根据分子会相同之处选入每个描述符,面部黑色素肿(SKCM)的原发和移往灶两种多种类型都有,其它极极少数的原发与移往多种类型也有数据资料量化。

布1. 皆科数据资料定位和一原理及4个主要皆科起点都是以和检验举实有来说

同上1. TCGA 蓝营胃癌描述符相同之处

皆科结果起点OS、PFI、DFI和DSS

总求生存期(OS)很极其重要,优点是界定OS事件真相时模糊病态最低。但常用OS都以起点不太可能削弱皆科数据资料量化,因为非胃癌尸检不一定能反映出分子生物学、洪水蓝营滥病态或对皆科手术缓解。常用OS或需要更长的随访一段时间;很多皆科试验当中,通常采用相对于随访一段时间较短的DFI或PFI。针对现有TCGA皆科数据资料,要了解到连续病态皆科随访每隔在洪水蓝营滥病态肝胃癌多种类型结果的极其重要病态,因为不太可能几年内就捕捉到到皆科事件真相,在遇害前已再次出现染病情入院或成效。对洪水蓝营滥病态较弱的肝胃癌多种类型,高血压在数十乃至几十年后入院,随访期间不太可能未捕捉到足够事件真相以默许简单结果供判断。该量化的目的是核对TCGA蓝营胃癌皆科检测的相对于优势和严重不足,指导在短期内的量化和不太可能会随访每隔一段时间严重不足等缺陷。

量化全部TCGA皆科数据资料后,事实如下:在数据资料可拿到时,OS、PFI及DFI相对于精确,但基本上情况下只能至少DSS。布1B为33种相同肝胃癌多种类型的OS K-M圆弧。尽管求生存量化不是TCGA主要目标,基本上肝胃癌多种类型求生存圆弧与过去检验相同求生存起点的统一数据资料量化基本相同,GBM、OV(2008, 2011)和低高级别胶质肿(LGG)(2015)的TCGA结果就是比较好实有证。PFI、DFI和DSS的K-M圆弧见布1C–1E。

布1 B-E皆科数据资料量化

基于每种肝胃癌多种类型4个起点的捕捉到一段时间计算平均系数随访一段时间及事件真相或核对的当中位一段时间(同上2)。所有的当中位随访一段时间为22.1个同年,但相同多种类型肝胃癌该一段时间相似之处极大;GBM和急病态髓系白血染病(LAML)最短约12个同年,而肾嫌色细胞会胃癌(KICH)最长约48个同年。

同上2 更进一步性而言当中位随访一段时间及4个起点的事件真相与捕捉到当中位一段时间

引荐常用的皆科结果起点

皆科结果起点选项相同数据资料量化目标、事件真相数量、描述符一般来说和结果数据资料质量。将这些新方法和开发的其它新方法都以为对单个疾染病数据资料库系统的检测和补足核对,计算出来在每种疾染病多种类型当中常用每个结果起点的决定及情况(同上3)。每种肝胃癌多种类型的求生存起点需要要至极少通过一个主要检测和补足核对才被接受。33种胃癌当中的13种常用全部4个起点:输尿管尿路上皮胃癌(BLCA)、外阴上皮细胞会细胞会胃癌(CESC)、结肠胃癌(COAD)、食管胃癌(ESCA)、褶部上皮细胞会细胞会胃癌(HNSC)、肾状细胞会胃癌(KIRP)、肺腺胃癌(LUAD)、LUSC、OV、胰腺胃癌(PAAD)、肉肿(SARC)、胃腺胃癌(STAD)和子宫丙型肝炎(UCEC)。相反,没一个起点的有嗜铬细胞会肿和副树突肿(PCPG)。肺脏弥漫大B细胞会肺脏肿(DLBC)、LAML和褶腺肿(THYM)非常极少一个起点;剩余肝胃癌多种类型2或3个起点,但其当中一些持保留异议。最简单的是PFI,可无保留地引荐给除LAML(无数据资料)、DLBC和KICH(谨慎常用)和PCPG(不引荐)皆的4种。

同上3 起点OS,PFI,DFI及DSS的检验与引荐常用

检验TCGA-CDR及案实有广蓝营应用

在乳腺胃癌数据资料量化当中,雌激素ER阴病态高血压皆科求生存期预后比ER+高血压反之亦然。分别用OS、PFI、DFI和DSS非常这两类高血压的求生存期(布3A–3D;圆弧截止于10年随访一段时间,但常用整个数据资料库系统同步进行量化)。单情况量化显示,常用PFI(p= 0.005)和DFI(p = 0.001)都以为皆科起点,TCGA当中ER+乳腺胃癌高血压比ER-高血压有更好的求生存期,但常用OS时两类高血压间不普遍存在相似之处(p = 0.097) 。此皆,两类高血压的DSS(p = 0.009)有显着相似之处,断定DSS的潜在价系数。以上发现声称了PFI和DFI是特定多种类型乳腺胃癌分子会数据资料量化的更好起点。

布3 检验和广蓝营应用实实有

此皆还检验了洪水蓝营滥病态GBM求生存结果起点。TCGA当中GBM当中位OS为12.6个同年,介于在此之前报道的国际标准皆科手术的12.1个同年和国际标准皆科手术牵头替莫唑胺的14.6个同年密切关系。当中位PFI是6.1个同年,介于在此之前报道的国际标准皆科手术5个同年和国际标准皆科手术牵头替莫唑胺的6.9个同年密切关系。显然,TCGA数据资料库系统OS和PFI事件真相一段时间与史料保持一致。再次印证OS和PFI都以为GBM分子会数据资料量化的皆科起点效度。

用Cox数量高风险回归数学新方法明确高期(III、IV期)相对于低期(I、II期)肝胃癌高血压的高风险比(HR),检验4个起点的TCGA-CDR数据资料。由于DFI界定与其它结果的界定不保持一致,对引荐常用OS、PFI和DSS的14种多种类型肝胃癌非常logHR(同上3)。随后非常极少对依赖于Cox数量高风险论据的疾染病同步进行统计(布3E–3G)。相较较,14种多种类型肝胃癌当中,除间皮肿(MESO)、PAAD和葡萄膜黑色素肿(UVM)皆,高期对比低期HR在3个引荐起点OS、PFI及DSS上明显较差。采用配对样品的Wilcoxon秩和检验,当常用PFI与DSS(p = 0.0008)或PFI与OS(p = 0.039)测量时,logHR有显着相似之处,显示疾染病成效和求生存起点在HR上普遍存在系统偏移;OS与DSS密切关系没显着相似之处(p = 0.106)。对2个logHR系数的国际标准疑同步进行逆加权平均系数明确Pearson涉及系数, 由logHR至少的3种结果有极显着自始涉及:PFI和OS涉及系数0.96(95%贝叶斯[CI]:0.77–0.99),PFI和DSS为 0.95(95%贝叶斯:0.76–0.99),OS和DSS为0.90(95%贝叶斯:0.61–0.98)。这些依赖病态潜在默许皆科初期用PFI,初期用OS和DSS做起点。

除了定位分子会数据资料,还尝试量化首次皆科手术后无染病高血压与非无染病高血压前提再次出现相同的新事件真相。TCGA-CDR当中29类肝胃癌资讯常用应对该问题,纳入高血压从病因到完成首治并达到无染病平衡状态至极少活到3个同年。以LUSC为实有,有289实有无染病高血压和41实有近十年非无染病高血压,NTE不下分都以21.8%和68.2%。用Cox数量高风险回归数学新方法,发现在非无染病高血压当中NTE高风险显着高于无染病高血压(HR = 6.68,95% CI = 4.25–10.51,FDR优化q系数<0.05)。在另皆21种肝胃癌多种类型当中也有类似结果(同上4)。大部份7种当中没捕捉到到这些相似之处。我们也在检验前提每个数学新方法都依赖于数量高风险论据,其当中有两个不符合,需要要数据资料量化一段时间依赖及多codice_数学新方法来寻找情况。

同上4 非无染病与无染病高血压NTE演进对比

TCGA从全球数百个站点查阅染病症,为应对皆科数据资料相同站点间的可比病态,需要考虑数据资料完整病态、和高血压相同之处等。对每种疾染病而言,我们对比了前两名包括染病症数最多的组织来源站点(TSS)与所有其它TSS的同种疾染病及4个结果起点(同上5)。

同上5 对来自前两位TSS的每个肝胃癌多种类型数据资料量化结果同步进行非常

对于GBM等兼具洪水蓝营滥病态的,前两位TSS(#1和#2)的中风人群与其它TSS相较类似的有OS、PFI和DSS,因事件真相太极少难以量化不引荐DFI做起点。BRCA等较低洪水蓝营滥病态,强而有力引荐常用PFI和DFI,但决定谨慎用OS或DSS检验。TSS #1的皆科数据资料产生不太好的OS和DSS,但没捕捉到到PFI相似之处;另皆,微小上TSS#1有更好的DFI结果,非常极少再次出现3实有 DFI事件真相。这种同上里不一的现象断定该站点的结果数据资料需要更进一步检验。另一方面,TSS #2的4个起点结果与其它地方保持一致。

这个有趣的结果非常断定,当从特定结果量化更进一步性TCGA的皆科数据资料时,需要要考虑TSS的具体资讯。由于年长、应于/分级及皆科手术等情况影响相同TSS得染病人群的起点结果,TSS可以都以为这些和不完全皆科自始文等其它未测量相似之处的替代。

潜在的夹杂情况、垄断结果的

高风险及数学新方法论据

对皆科求生存起点量化来说,决定常用所应对的全部皆科数据资料。但相较分子会/DNA数据资料的定位量化,要同样两个方面。首先,引荐异议基于基线求生存数学新方法,以分子会病毒性都以得出结论因子划分样品集,有不太可能破坏结果统计的显着病态相似之处。因此,从互涉及联的TCGA分子会数据资料或病毒性TCGA-CDR结果数据资料当中推论的事实需要在统一的数据资料库系统当中更进一步声称。

第二,我们决定非常极少常用原发的分子会数据资料,因为高血压初诊时,极其重要一段时间资讯等匹配的皆科数据资料已查阅相对于完整。面部黑色素肿(SKCM)在TCGA多种类型当中非常特殊,470实有当中非常极少103实有原发,其余296实有为原发局部肺脏结移往,68实有远端移往。这与很极少查阅到移往肿的其它TCGA肝胃癌多种类型呈现出鲜明对比。SKCM移往肿很极少不具匹配的原发,而其它TCGA肝胃癌多种类型尽管很极少有移往肿,但都不具匹配的原发样品。因此,对于SKCM结果的依赖病态,决定只常用依赖于数量的原中风实有,尽管SCKM肺脏结移往的III期染病症可都以为统一组群同步进行数据资料量化。

在常用新定位的TCGA-CDR数据资料库系统时,还需要要同样:潜在混淆情况、垄断结果的高风险及数学新方法论据。

夹杂情况

夹杂情况普遍存在但被排除在数学新方法之皆时,偏移不太可能高估或低估真实。如在乳腺胃癌的种族相似之处数据资料量化当中,种族歧视与黑人高血压密切关系普遍存在极其重要的同上观相似之处,然而根据分子会病毒性同步进行优化后,这种相似之处显着减低甚至消失。治果也是潜在的夹杂情况,当资讯可获取时应适当考虑优化。皆科手术推断出时,年长、名医医院及病因年份等国际标准皆科手术都以为替代资讯能减低其余部分疑反之亦然。对这方面的决策建模,鼓励常用标志物预后数据资料量化决定报告(REMARK)。

垄断结果的高风险

测DSS、DFI和PFI起点时,要对没经历极其重要事件真相且无染病的遇害高血压同步进行审查。在这种情况下,如果论据高血压没其它尸检,那她/他最终仍不太可能死于肝胃癌指征。然而,在至少皆科手术等得出结论因子对继发病态肝胃癌或心血管疾染病等非净资产肝胃癌遇害高风险的得出结论灵活病态时,该论据相当可取。

数学新方法论据

广蓝营应用Cox数量高风险(PH)数学新方法必须核对PH论据。除极少数案实有皆,大基本上数学新方法都依赖于Cox PH论据,但需要更进一步探索这些案件以追踪遵从论据的情况,从而对HR做出更准确的至少。尽管已经为清理数据资料和应对问题换来了巨大坚持不懈,但仍普遍存在极其重要的常用限制,访问TCGA皆科数据资料都必须知晓这些限制。

首先,TCGA主要是为分子会数据资料量化设计,最初染病症选项来自多个机构不具更好库存组织的未皆科手术原中风实有,因此这些染病症不构成连续病态。此皆,对于每种相同多种类型/数据资料量化,随访数据资料没统一查阅。同时,皆科数据资料查阅的一些游戏规则在过去不得不随着一段时间的推移而扭曲。TCGA - CDR不包含肝胃癌皆科手术史,并非所有染病症都被自始文。因此,量化特定多种类型或病毒性的皆科手术或多或极少高于概况病态蓝营胃癌量化。当高血压同步进行具体皆科手术时,受益能用DFI和PFI起点必要量化。

其次,TCGA样品皆科随访根据当地诊所的按计划,不太可能为疾染病或特定手部的入院和染病人极其重要生命平衡状态的历史纪录,因此没TCGA登录的皆科随访计划,非常极少计算出来工程建设主要特别强调的分子会相同之处。

最后,依然所有TCGA拿到的样品和DNA及分子会数据资料来自新诊高血压原发的单个切片,由此产生的DNA和分子会数据资料不能在密闭或一段时间任何方面保持一致捕获代同上另一高血压结果codice_的异质病态。该问题不是TCGA独有的,任何模板原发病态数据资料量化都普遍存在。

展望

这项工都以是有史以来第一次更进一步新新方法应对TCGA蓝营胃癌皆科数据资料。由此产生的TCGA-CDR的结果起点与统一非TCGA数据资料量化结果保持一致,说明该资源在空前绝后规模的皆科维度上包括了生物观测新视角。也要了解到TCGA-CDR的内在常用局限病态及关键因素病态指导和引荐异议。已经非常明晰,人类文明疾染病愿景大规模的分子会数据资料量化必须新新方法查阅皆科染病理、皆科手术和转归事件真相数据资料,以坚持最高国际标准的皆科数据资料量化。尽管有其局限病态,TCGA-CDR包括了国际国际标准数据资料库系统,以及清晰的4个皆科结果起点等价,并应对了质量问题,从而在蓝营胃癌和个体水平上同步进行生成数据资料量化。愿景数据资料数据资料量化的融合将提高结果密切关系的可比病态,更好地解释和默许重复。

参考数据资料

An Integrated TCGA Pan-Cancer Clinical Data Resource to Drive High-Quality Survival Outcome Analytics

TAG:
延伸阅读
“糟蹋”卵巢的5类事,你而今了吗?
本文涉及专业知识,仅供医学专业部分人阅读参考发觉就马上预防起来了!对于男士而言,除了青春最美的佳人均,还有一个地方“不想杨家”,那就是...[详细]
2022-05-10
卵巢囊肿是怎么化疗 有哪些方法
腺体溃疡是一种较为常见的女性妇科癌症,这种癌症有单发性的和多发性的这两种,溃疡但会对女性的健康造成非常大的威胁,对于有生子需要的中年女...[详细]
2022-05-05
结核连续性包裹连续性胸腔积液有哪些症状
皮肤病连续性袋中连续性心脏肿大是指病症起初有皮肤病上的病症,并且又引发袋中连续性心脏肿大。对于这一类的病症来说,不但要病人皮肤病的原发...[详细]
2022-05-04
四川乐山急诊抢救人员被曝抢救时遭村民围攻
据@WWW厚-----小妮子爆料11月末13日,对于甘肃天全县第二国民所医院急诊科的全体录愿者而言是一个紫色星期五。这天如此一来次发生的伤医暴力事件全然...[详细]
2022-05-03
**炎有什么症状
**噬是由于寄生虫或致病造成**发噬的征状,该病不会造成**复合、**包裹、肿胀和梗阻等格外为严重中风,甚至造成不孕。...[详细]
2022-05-02
月经咖啡色 男人月经期要谨慎
很多妳朋友常会疑惑为什么排卵乳白色的,今天小编就给大家参考的介绍一下这特别的知识,排卵是每个妳常会遇到的事情,但是排卵乳白色的确实是什...[详细]
2022-05-02
甲状腺功能异常对女性的影响有多大?如何应对受孕和怀孕的挑战?
骨髓长在我们胸部喉结下方方位,形似一个燕子状的腺体,也是我们人体最大的内分泌腺。它的抑制作用,主要是生产并储存骨髓激素,这个激素不具备...[详细]
2022-04-28
盆腔炎怎么放射治疗最佳 尽早摆脱困扰
盆腔炎怎么病患最佳?当你肺结核盆腔炎的时候,你一定很想知道有哪些妥善解决的好方式,盆腔炎传染病严重起来的话,对青年人的受到影响是很大的...[详细]
2022-04-27
JNNP:儿童因胰岛素AQP4 IgG阳性视神经脊髓炎谱系疾病致残的早期预测因子
视脑脊髓炎谱系阻碍(NMOSD)是一种之中枢脑系统(CNS)的炎性脱髓鞘病症因,主要不良影响视脑和脊髓。约60%–80%的病人毒素之中含有病症因特异性浮...[详细]
2022-04-26
  • 地区医院
  • 医院联盟