Zeeshan-ul-hassan Usmani的基因组表型SNPs原始数据
基因组学是分子生物学的一个分支,涉及基因组的结构,功能,变异,进化和绘图。有几家公司提供下一代人类基因组测序,从完整的30亿个碱基对到几千个表型SNP。使用23andMe(使用Illumina HumanOmniExpress-24)作为DNA的表型SNP。在这里为国际研究社区分享整个原始数据集
内容
姓名:Zeeshan-ul-hassan Usmani
年龄:38岁
出生国家:巴基斯坦
祖先的国家:印度(Utter Pradesh - UP)
File:GenomeZeeshanUsmani.csv
大小:15 MB
资料来源:23andMe个性化基因组报告
研究界仍在逐步在这一领域开展工作,专业人士一致认为基因组学仍处于起步阶段。您现在有机会通过数据集探索这个新的领域,并成为少数基因组学早期采用者之一。
数据集是从www.23andme.com提取的完整基因组,表示为由以下符号表示的SNP序列:A(腺嘌呤),C(胞嘧啶),G(鸟嘌呤),T(胸腺嘧啶),D (基本删除),I(基本插入)和'_'或' - '如果无法访问特定位置的SNP。它含有染色体1-22,X,Y和线粒体DNA。
有关可用的确切SNP(碱基对)及其数据集索引的完整列表,请访问 https://api.23andme.com/res/txt/snps.b4e00fe1db50.data。
相关链接
您可以使用以下人类基因组数据库站点获取帮助:
- GenBank - https://www.ncbi.nlm.nih.gov/genbank/
- 人类基因组计划 - https://www.genome.gov/hgp/
- 基因组在线数据库(GOLD) - https://gold.jgi.doe.gov
- 完整的基因组学 - http://www.completegenomics.com/public-data/
一些值得探索的想法:
- 有问题的个人是否更容易患癌症?
- 他是否会增加体重?
- 他的出生地在哪里?
- 哪个基因决定某些生物学特征(癌症易感性,脂肪生成率,头发颜色等)。
- 这种表型SNP与来自西方世界的其他类似数据集相比如何?
- 这个人死亡的可能原因是什么?
- 这个人一生中最容易患病的疾病是什么?
- 这个数据集有什么独特之处?
- 在个人特质,智力水平,血统和身体构成方面,您还可以从这个数据集中提取什么?