这次的作业是构建系统发育树,又是生物信息学的。
1.序列收集
利用NCBI的blast工具寻找同源序列,随后保存为fasta格式。下载的fasta文件尽量使用英文或数字命名,且保存fasta文件的目录不可包含中文。
这里用上次的作业进行演示。
上次得到的序列:https://www.ncbi.nlm.nih.gov/protein/NP_198372.1?report=genbank&log
点击Run BLAST
,查找同源序列。
等待一段时间后,得到BLAST出的同源序列,选择一些相同的序列合并做多重比对。这里选中前三十条,点击Multiple alignment
。
下载保存为FASTA。
2.序列比对
使用ClustalX
导入上述FASTA格式文件。
如果遇到打不开序列的问题,可能是文件存储路径有中文或空格,注意改正。
Clustalx地址:http://www.clustal.org/clustal2/
在页面找到“Download Clustal W/X”,点击“available for download here”会跳转到下载页面:http://www.clustal.org/download/current
选择适合自己电脑系统的安装包后安装ClustalX,打开应用程序,点击File
,选择Load Sequences
导入上一步下载的FASTA文件。
序列导进去后如图所示:
选中Alignment
菜单,点击Do Complete Alignment
这里.dnd
的是输出的指导树文件,.aln
的是序列比对结果,它们都是纯文本文件,建议重命名避免混淆。
点“OK”之后开始等待,如果序列不多,很快就可以算完。
比对之后可以另存为新的文件。如果用MEGA做系统发育树,就另存为FASTA
,如果用Phylip做系统发育树,就另存为PHYLIP
。
3.构建系统进化树
下面用MEGA演示绘制系统发育树
下载MEGA,选择任意版本,地址:https://www.megasoftware.net/
MEGA
的全称是Molecular Evolutionary Genetics Analysis 分子进化遗传分析,可用于序列比对、进化树的推断、估计分子进化速度、验证进化假说等。MEGA 还可以通过网络(NCBI)进行序列的比对和数据的搜索。这是MEGA X
的主界面:
导入序列
点击File
,选择Convert File Format to MEGA,把上一步获得的FASTA文件导入MEGA
之后会导出一个.meg
格式的新文件,我重命名为new.meg
并保存在桌面上方便查找。
构建发育树
- 选择菜单栏上的
PHYLOGENY
,选中第一栏Construct/Test Maximum ……
,导入上一步生成的new.meg
文件 - 在弹出来的窗口里选择
Protein
(因为咱这是蛋白质嘛) - 然后重复第一步,会弹出这个窗口,选择
YES
,在下一个弹出的窗口选择OK
,就开始构建发育树了,这需要一段时间,耐心等待即可。
动图快速过一遍
最后得到系统发育树,如下图所示
转换成圈图
转换成辐射图
参考
- https://blog.csdn.net/u011262253/article/details/78506951
- https://liucheng.name/509/
- https://www.cnblogs.com/leezx/p/6215402.html
本文作者:mikusa
本文链接:https://www.himiku.com/archives/building-a-phylogenetic-tree.html
版权声明:所有文章除特别声明外均系本人自主创作,转载及引用请联系作者,并注明出处(作者、原文链接等)。
大佬,怎么改系统发育树里的的种属名
时间太过久远,忘了,抱歉 ……
好吧,我再找找其他教程 (´இ皿இ`)
我找到了一个国产的美化系统发育树网站:ChiPlot,此外自展值在MEGA7默认是没有的
在最后运行前,点击 Phylogeny---->Construct ML tree,注意在Phylogeny Test上选择Bootstrap method,下面次数可以自己定义,一般是选1000次,然后点击运行。链接:https://www.jianshu.com/p/0cd366cd9e55
Nice!希望能帮到其他找到这里的人 ٩(ˊᗜˋ*)و
入门级教程
是的
不明觉厉