Science发表人类疾病-蛋白质-基因组图谱,基于“基因-蛋白-表型三联体”解析疾病致病基因的内在机制:蛋白质是人体的基本功能单位,也是从基因组到表型信息传递的关键媒介。
蛋白质可导致多种疾病的发生发展,因此也是目前药物最常见的作用靶标。
已有研究结果表明,通过对蛋白质数量性状基因座(pQTLs)的临床关联进行研究,有助于更好地理解疾病发生机制。
目前,我们仍然缺乏一个模型来评估位于蛋白质编码基因之外遗传变异的蛋白质特异性、pQTLs与血浆中特定蛋白质的临床相关性。
此外,尚没有研究系统地绘制基因-蛋白-疾病的网络结构,以揭示疾病和蛋白表型之间的联系。
近日,由剑桥大学临床医学院的科学家领导的国际研究团队在顶级期刊Science发表了题为“Mapping the proteo-genomic convergence of human diseases”的研究成果。
研究团队通过对基因组中共同起源蛋白质的分析,鉴定了10674个关联蛋白质变体,发现了其与数百种不同人类疾病之间的联系,并开发了一个模型,以系统地确定蛋白质和通路特异性pQTLs。
同时,通过共定位筛选,研究团队绘制了涵盖1859个基因-蛋白-表型三联体的人类疾病蛋白质基因组图谱,提供了对跨疾病病因的新见解。
文章发表在Science主要研究内容基因蛋白质靶点的关联研究人员对10,708名志愿者的数据进行了全基因组-蛋白质组关联分析,共鉴定2584个基因组区域,发现其至少与3892个显著关联蛋白靶点中的一个相关。
其中,1097个区域包括迄今为止尚未报道的与血浆蛋白相关的变异体。
数据显示,在3892个关联蛋白质中,有26.8%存在顺式pQTLs和反式pQTLs。
进一步分析发现,在这些基因座上存在另外的2346个次级pQTLs,表明顺式pQTLs和反式pQTLs中存在广泛的等位基因异质性。
图1. 遗传变异位点与蛋白靶点的相关性,