全基因组关联研究 :
全基因组关联研究(GWAS)的理论基础是连锁不平衡(linkage disequilibrium,即SNPs之间的非随机关联),全基因组范围内的SNPs可以用数量相对较少(50万~100万)的标记SNPs(TagSNPs)来代表。
全基因组关联研究一般采用三阶段实验设计:第一阶段使用全基因组SNP芯片对部分样本进行基因分型,第二阶段至第三阶段使用针对少量SNPs的基因分型技术(如低密度的SNP芯片、质子飞行时间质谱等)在大量样本中对第一阶段筛选得到的少量SNPs进行验证。目前公认的全基因组关联研究的统计显著性阈值为P-值小于5×10-8,即相当于检测一百万个独立的SNPs,具有统计显著性的SNPs的P-值在做完Bonferroni多重检验校正后小于0.05。
第一个全基因组关联研究是2005年在《科学》杂志上发表的关于老年性视网膜黄斑变性的研究。截至2015年2月,已经有2111项全基因组关联研究发表,研究对象涵盖包括心理疾患在内的多种疾病。中国科学家在系统性红斑狼疮、多种肿瘤、干燥综合征、精神分裂症等疾病的全基因组关联研究中取得了重大成果。
全基因组关联研究(GWAS)已经涵盖了多种心理疾患,包括精神分裂症、双相情感障碍、抑郁症、自闭症、创伤后应激障碍等。此外,全基因组关联研究还被用于“大五”人格、认知能力、教育程度、成瘾、结构/功能神经影像等研究中。经过十几年的发展和积累,现在的全基因组关联研究已经呈现出多研究整合和超大样本量的特点。比如:最新的教育程度的全基因组关联研究的样本量已经超过四十万。除了针对人类的研究,全基因组关联研究也应用于动物和植物的复杂性状研究中。