大数据在疾病间建立起惊人联系

利用来自近13万个家庭的48多万人的健康保险数据,芝加哥大学的研究人员根据疾病在遗传相关个体中发生的频率,建立了一种新的常见疾病分类方法。研究人员希望8月7日在线发表在Nature Genetics杂志上的这项研究将有助于医生更好地诊断和治疗病因而不是症状。

文章的通讯作者Andrey Rzhetsky教授说:“理解疾病之间的遗传相似性可能意味着对一种疾病有效的药物对另一种也可能是有效的。对于那些有大量环境影响成分的疾病,这意味着我们可以通过改变环境来预防它们。”

大数据产生疾病之间惊人的联系

这项研究的结果表明,基于症状或解剖的标准疾病分类学可能错过疾病之间相同潜在原因的联系。例如,新的研究表明偏头痛(通常被归类为中枢神经系统疾病)似乎最像肠易激综合征(一种肠道炎症性疾病)。

Rzhetsky教授和她的研究小组分析了Truven MarketScan(来自美国超过4000万个已确定的病人家庭)的数据库记录。他们根据父母和他们的孩子在同一保险计划中所涵盖的时间长度选择了一组记录,这样孩子和父母最有可能是住在相同的家庭中。他们用这种海量数据来估计疾病之间的遗传和环境相关性。

接下来,利用统计方法开发生物进化树,研究小组基于两种方法建立了疾病分类。其中一个重点是疾病同享的遗传相关,或者是疾病发生在遗传相关的个体,如父母和孩子之间的频率。另一个则集中在家庭环境,或是家中发生疾病的人数,但没有或仅部分匹配的遗传背景,如配偶和兄弟姐妹。

结果集中在29个、在孩子和父母中都很有代表性的疾病上,以建立新的分类树。树的每一个“分枝”都是由两对彼此高度相关的疾病构成的,这意味着它们经常发生在一起,父母或孩子共享相同的基因,或家庭成员共享相同的生活环境。

两个传统的疾病分类,ICD-9模型(左)与表型或基于症状的模型。

通过分析家庭成员之间的遗传和环境相关性创建新的疾病分类。

生物学分类与传统ICD-9分类比较的意外发现

该研究的第一作者Kanix Wang说:“在这项研究中,大量家庭允许我们获得对遗传和环境相关的精确估计,代表多个不同疾病的常见原因。利用这些共同的遗传和环境原因,我们建立了一个新的系统,根据其固有的生物学来分类疾病。”

疾病之间的遗传相似性往往强于相应的环境相关性。然而,对于大多数精神神经疾病,如精神分裂症、双相情感障碍和药物滥用,环境相关性的强度几乎与遗传相似性一样。这表明有共同的家庭环境的元素可以改变,以帮助防止这些疾病。

研究人员还将其结果与被广泛使用的国际疾病分类9版(ICD-9)比较,对疾病分组有了其它意外的发现。例如,1型糖尿病(一种自身免疫性内分泌疾病)与高血压(一种循环系统疾病)有很高的遗传相关性。研究人员还发现,在常见的、不同的疾病如哮喘、过敏性鼻炎、骨关节炎和皮炎等方面存在着高度的遗传相关性。

参考资料

Classification of common human diseases derived from shared genetic and environmental determinants

Big data yields surprising connections between diseases

来自生物探索编译

 



无觅相关文章插件,快速提升流量

本文标签:

欢 迎 关 注 微 信 号 :i199IT

扫描微信二维码,数据随身查
扫描左侧二维码或搜索添加微信公众号:i199IT
TMT最全的数据微信平台,随时随地获知有价值的数据信息