|
导读:《PLoS One》文章“Genome-wide association study of cassava starch paste properties”fig 2的SNP密度图展示了18条染色体1Mb区间内的SNP数。行是染色体,不同的颜色表示不同的SNP密度,灰色表示没有SNP,绿色表示密度较低,红色表示密度最高。从这张图可以直观地看出SNP的分布情况,为疾病研究提供思路。
SNP简介
SNP(单核苷酸多态性)是指基因组中单个核苷酸变异引起的DNA序列差异。它是基因组中最常见的遗传变异形式,分为转换(嘌呤间或嘧啶间替换)和颠换(嘌呤与嘧啶间替换)。SNP的形成与DNA复制错误、损伤修复错误、自然选择和遗传漂变等因素有关。它在医学中有重要应用,可用于疾病易感基因研究、药物反应预测和法医学鉴定等。例如,某些SNP位点与疾病风险相关,可作为生物标志物;在药物代谢相关基因中的SNP可用于指导个体化用药。
研究SNP密度的意义
1) 基因组结构和进化:高密度区域可能与基因重组热点相关,低密度区域则可能更保守。
2) 辅助疾病研究:高密度区域可能包含疾病相关基因,有助于定位易感基因。
3) 评估遗传多样性:高密度SNP区域通常遗传多样性更高,有助于物种适应环境。
4) 助力基因定位:通过分析SNP分布,可缩小目标基因范围,提高研究效率。
1,打开作图URL
https://www.bioinformatics.com.cn/plot_basic_SNP_density_by_CMplot_107
2,示例数据
点击图片上方的示例数据,下载,并使用excel打开。
示例数据包括2列:
第1列是染色体名字,绘图时按照从上到下出现的顺序绘制,有几条染色体绘制几条染色体。建议在excel中按照染色体编号排序后再作图。若染色体很多,建议仅挑选常规染色体,去掉random之类的染色体。
第2列是SNP所在的染色体位置,必须是正整数。
注:仅使用提供的数据绘制染色体,而没有考虑对应物种的染色体具体长度,所以染色体长度取的是数据中该染色体最后一个SNP位置(数值最大的值)的长度。
例如,实际染色体长度为10M,如果输入数据中最大的SNP坐标是9M,9M后的染色体中没有任何SNP,那么图中的染色体长度就是9M,而不是实际的10M。对实际结果几乎没有影响。
3,输入检查
示例数据:点击输入框下面的“示例”按钮,将载入示例数据。
真实数据:数据放在excel中,调整好后,Ctrl+A选中数据,Ctrl+C拷贝,Ctrl+V粘贴数据到输入框中。
然后使用输入框下面的“输入检查”按钮先对输入数据进行检查。若检查不通过,请根据检查提示重复【修改-输入检查】步骤,直到检查通过(如下图所示),然后可以继续选择参数。
注:输入检查按钮会根据不同模块的输入要求,逐行逐列检查输入数据,并给出提示,确保数据符合模块输入要求。
4,选择参数
图片大小:设置了图片的宽度,图片的高度。建议根据染色体的长度和条数进行调整,若染色体较多,可以将高度设置大点
binsize:计算密度时所使用的区间大小,也就是图中“The number of SNPs within 1Mb window size”中的1Mb。数值越大,表示统计的粒度越粗。一般使用1000000,即1Mb作为统计区间
字体大小:
标题字体大小,即图中“The number of SNPs within 1Mb window size”的字体大小;
染色体/Mb字体大小:即长度刻度和染色体名字的字体大小,若部分长度刻度被隐藏,可以缩小字体大小,或者增加图片宽度;
图例字体大小;右下角图例的字体大小
注:字体控制不是太精确,请使用inkscape或者acrobat illustrator优化
颜色:设置了低、中、高密度的颜色
字体:设置了期刊杂志中最常用的两种字体:Times New Roman和Arial。如需使用其他字体,可以下载pdf或者svg图片,然后使用acrobat illustrator或者inkscape进行编辑修改
5,提交出图
检查通过,并且参数选好后,点击“提交”按钮,约2s后,会在页面上显示SNP密度图。我们提供了pdf、svg两种矢量图,png、tiff两种标量图供大家下载使用。可以使用acrobat illustrator或者inkscape软件编辑矢量图,进行组图,调整文字位置,添加说明等操作,以满足个性化需求。
同时我们也提供了每条染色体SNP的统计信息,包括每条染色体的SNP数,平均密度等供下载。
在测试数据的统计结果中,平均每条染色体有约135个SNP位点,其中SNP数最多的是chr13,最少的是chr17。密度最大的是chr18,密度最小的是chrX。平均每MB有1.057个SNP。
微生信助力高分文章,用户280000+,谷歌学术5000+
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2025-4-26 09:53
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社