您的位置首页 >生活 >

计算工具使用DNA编码方法来集成和分析不同的健康数据库

导读 巴西研究人员创建了一种创新且敏捷的计算工具,用于将不同的健康数据库与数百万份患者记录进行链接和分析。该平台名为Tucuxi-BLAST,使用代

巴西研究人员创建了一种创新且敏捷的计算工具,用于将不同的健康数据库与数百万份患者记录进行链接和分析。该平台名为Tucuxi-BLAST,使用代表DNA序列(A,T,C或G)中核苷酸的字母对数据库中的识别记录进行编码,例如患者姓名,母亲的姓名和出生地。这种将个体“转换”为DNA可以实现跨数据库的准确记录链接,尽管存在印刷错误和其他不一致之处。

该工具可用于研究、流行病学分析和公共政策制定。

例如,已经接种过巴西国家卫生服务机构SUS疫苗的人可以交叉参考其他数据集,以找到接种过特定疾病的患者。即使疫苗接种记录包含错误或未完成的字段,Tucuxi-BLAST也能够将其链接到另一个数据库中的同一患者,因为它将不一致视为DNA突变。基因组学工具通常需要比较片段,以确定它们是否更相似而不是不同,以及是否链接有问题的碱基对。如果每个单独的字母对应于一个字母序列,则来自不同存储库的数据可以通过该工具交叉引用和链接。

“SUS是医学和流行病学研究的宝贵信息来源,因为它存储了数百万患者的健康数据。但是,与疾病和其他类型的数据相关的记录存储在不同的数据库中,这些数据库并不总是相互通信。我们开发的方法能够准确,快速地实现记录链接,“在PeerJ杂志上发表的一篇关于该研究的文章的通讯作者赫尔德·中谷告诉Agência FAPESP。

Nakaya是一名免疫学家,隶属于圣保罗大学药学学院(FCF-USP),阿尔伯特爱因斯坦犹太医院(HIAE),巴斯德-USP科学平台和托多斯佩拉索德研究所。他还属于炎症性疾病研究中心(CRID),这是研究,创新和传播中心(RIDC)之一。

在实践中使用该工具

甚至在文章发表之前,图库西-BLAST就开始在实践中部署。例如,它被用来将卫生部疟疾监测系统的四年数据与来自海托·维埃拉·多拉多博士热带医学基金会(位于亚马孙州马瑙斯)的临床数据进行交叉引用,该基金会是该部的另一个分支机构奥斯瓦尔多克鲁兹基金会(Fiocruz)的一个分支机构。

结果表明,艾滋病毒阳性对间日疟原虫疟疾患者来说是一个风险,对公共政策来说是一个额外的挑战。由于缺乏单一的标识符,Tucuxi-BLAST使用了患者姓名,母亲的姓名和出生日期。这些发现在2022年5月发表在《科学报告》上的一篇文章中进行了描述。

该研究由亚马逊州立大学(UEA)的研究人员领导。中谷和FCF-USP的何塞·德尼·阿尔维斯·阿劳霍,PeerJ文章的第一作者,也参加了会议。阿劳霍将工具命名为Tucuxi,以纪念栖息在亚马逊盆地河流中的淡水海豚索塔利亚·弗维阿蒂利斯。

BLAST(基本局部比对搜索工具)是指生物信息学中使用的一套程序,用于在大型数据库中生成核苷酸或蛋白质序列之间的比对。

版权声明:本文由用户上传,如有侵权请联系删除!