MungeSumstats包介绍(二)——rsid和chr:pos转换

MungeSumstats包介绍(二)——rsid和chr:pos转换 https://zhuanlan.zhihu.com/p/648475139MungeSumstats包介绍二——rsid和chr:pos转换今天介绍如何使用MungeSumstats包来转换rsid和chr:pos。MungeSumstats包被开发出来是用来统一GWAS summary格式的因此也可以用它来进行rsid和chr:pos之间的转换具体代码如下library(MungeSumstats) library(tidyverse) library(data.table) ## 示例数据路径 eduAttainOkbayPth - system.file(extdata,eduAttainOkbay.txt, packageMungeSumstats) ## 读取示例数据并删除rsid df - fread(eduAttainOkbayPth) %% dplyr::select(-MarkerName) ## MungeSumstats包检验数据并填充rsid reformatted - format_sumstats(df, ref_genome GRCh37, nThread 2, return_data T)但是这个包对输入数据的格式有要求必须要包含以下几列像EAF和SE可有可没有但是以上几列则必须要有否则该包就会报错。如果我们知道dbSNP的版本号可以使用dbSNP参数指定版本号减少rsid转换后的损失不过目前好像只支持144和155版本其他版本如果有小伙伴感兴趣的可以试一下行不行不过要提前安装相应的数据reformatted2 - format_sumstats(df, ref_genome GRCh37, nThread 2, dbSNP 155, return_data T)当然了我们还可以用这个函数在转换rsid的同时变更参考基因组reformatted2 - format_sumstats(df, ref_genome GRCh37, convert_ref_genome GRCh38, nThread 2, return_data T)如果想转换后直接存储可以设置save_path参数reformatted2 - format_sumstats(df, ref_genome GRCh37, convert_ref_genome GRCh38, nThread 2, save_path path/to/dir)这里还有蛮多参数大家可以自行探索。后面抽空写一下其他可以转换rsid和chr:pos的方法。