如文章“”中介绍的GCTA,是一款基于全基因组关联分析发展的分析工具,除了计算不同性状/表型间(traits)的遗传相关性外,还可以计算亲缘关系、近交系数……,下面简单介绍如何利用GCTA计算不同性状/表型的遗传相关性。
一,在Linux上安装GCTA工具:
wget -r -np -pk -nH -P ./to/your/path/way/gcta http://cnsgenomics.com/software/gcta/gcta_1.26.0.zip #在Linux下下载GCTA工具unzip gcta_1.26.0.zip #解压GCTA工具
“wget -r -np -pk -nH -P”命令完全照搬,“./to/your/path/way/gcta”是指你想把GCTA软件下载在哪个路径,按个人需求适当修改。
二、准备PLINK二进制格式文件,比如 test.fam, test.bim 和 test.bed
三、生成 test.grm.bin, test.grm.N.bin和test.grm.id 格式文件
/gcta/gcta64 --bfile test --autosome --make-grm --out test #生成grm格式文件,方便后面的遗传相关性分析
“/gcta/gcta64”指GCTA软件的位置
“--make-grm”指生成 test.grm.bin, test.grm.N.bin和test.grm.id 格式文件
“--out test”指输出的文件名为test
四、准备性状/表型文件,后缀为.txt格式,不需要表头,第一列为family ID, 第二列为individual ID 第三列和第四列为 phenotypes ,类似于PLINK的表型文件格式
五、计算遗传相关性
gcta/gcta64 --reml-bivar --reml-bivar-nocove --grm test --pheno pheno.txt --reml-bivar-lrt-rg 0 --out test
得到test.hsq 格式的文件
test.hsp文件内容如下:
Source Variance SEV(G)_tr1 0.479647 0.179078 #trait 1 的遗传方差和标准误V(G)_tr2 0.286330 0.181329 #trait 2 的遗传方差和标准误C(G)_tr12 0.230828 0.147958 #trait 1 和 2 之间的遗传协方差和标准误V(e)_tr1 0.524264 0.176650 #trait 1 的剩余方差和标准误V(e)_tr2 0.734654 0.181146 #trait 2 的剩余方差和标准误C(e)_tr12 0.404298 0.146863 #trait 1 和 2 的剩余协方差和标准误Vp_tr1 1.003911 0.033202Vp_tr2 1.020984 0.033800V(G)/Vp_tr1 0.477779 0.176457V(G)/Vp_tr2 0.280445 0.176928rG 0.622864 0.217458 # 遗传相关性和标准误n 3669 # 样本量
其中,rG即为我们想要的遗传相关性,0.622864 和 0.217458分别代表两个性状/表型间的遗传相关性(genetic correlation)和标准误(Stand error)