这次的作业是构建系统发育树,又是生物信息学的。

1.序列收集

利用NCBI的blast工具寻找同源序列,随后保存为fasta格式。下载的fasta文件尽量使用英文或数字命名,且保存fasta文件的目录不可包含中文。

这里用上次的作业进行演示。

上次得到的序列:https://www.ncbi.nlm.nih.gov/protein/NP_198372.1?report=genbank&log

点击Run BLAST,查找同源序列。

等待一段时间后,得到BLAST出的同源序列,选择一些相同的序列合并做多重比对。这里选中前三十条,点击Multiple alignment


下载保存为FASTA。

2.序列比对

使用ClustalX导入上述FASTA格式文件。

如果遇到打不开序列的问题,可能是文件存储路径有中文或空格,注意改正。

Clustalx地址:http://www.clustal.org/clustal2/

在页面找到“Download Clustal W/X”,点击“available for download here”会跳转到下载页面:http://www.clustal.org/download/current

选择适合自己电脑系统的安装包后安装ClustalX,打开应用程序,点击File,选择Load Sequences导入上一步下载的FASTA文件。

序列导进去后如图所示:

选中Alignment菜单,点击Do Complete Alignment

这里.dnd的是输出的指导树文件,.aln的是序列比对结果,它们都是纯文本文件,建议重命名避免混淆。

点“OK”之后开始等待,如果序列不多,很快就可以算完。

比对之后可以另存为新的文件。如果用MEGA做系统发育树,就另存为FASTA,如果用Phylip做系统发育树,就另存为PHYLIP

3.构建系统进化树

下面用MEGA演示绘制系统发育树

下载MEGA,选择任意版本,地址:https://www.megasoftware.net/

MEGA的全称是Molecular Evolutionary Genetics Analysis 分子进化遗传分析,可用于序列比对、进化树的推断、估计分子进化速度、验证进化假说等。MEGA 还可以通过网络(NCBI)进行序列的比对和数据的搜索。这是MEGA X的主界面:

导入序列

点击File,选择Convert File Format to MEGA,把上一步获得的FASTA文件导入MEGA

之后会导出一个.meg格式的新文件,我重命名为new.meg并保存在桌面上方便查找。

构建发育树

  1. 选择菜单栏上的PHYLOGENY,选中第一栏Construct/Test Maximum ……,导入上一步生成的new.meg文件
  2. 在弹出来的窗口里选择Protein (因为咱这是蛋白质嘛)
  3. 然后重复第一步,会弹出这个窗口,选择YES,在下一个弹出的窗口选择OK,就开始构建发育树了,这需要一段时间,耐心等待即可。

动图快速过一遍

最后得到系统发育树,如下图所示

转换成圈图

转换成辐射图

参考

  1. https://blog.csdn.net/u011262253/article/details/78506951
  2. https://liucheng.name/509/
  3. https://www.cnblogs.com/leezx/p/6215402.html