如何解释系统进化树

答案:1 悬赏:30 手机版

解决时间 2021-01-28 09:02

提问者网友：我们很暧昧
2021-01-28 02:54

如何解释系统进化树

最佳答案

五星知识达人网友：从此江山别
2021-01-28 03:44

问题一：如何构建系统发育树构建系统发育树需要注意的几个问题 1 相似与同源的区别：只有当序列是从一个祖先进化分歧而来时，它们才是同源的。 2 序列和片段可能会彼此相似，但是有些相似却不是因为进化关系或者生物学功能相近的缘故，序列组成特异或者含有片段重复也许是最明显的例子；再就是非特异性序列相似。 3 系统发育树法：物种间的相似性和差异性可以被用来推断进化关系。 4 自然界中的分类系统是武断的，也就是说，没有一个标准的差异衡量方法来定义种、属、科或者目。 5 枝长可以用来表示类间的真实进化距离。 6 重要的是理解系统发育分析中的计算能力的限制。任何构树的实验目的基本上就是从许多不正确的树中挑选正确的树。 7 没有一种方法能够保证一颗系统发育树一定代表了真实进化途径。然而，有些方法可以检测系统发育树检测的可靠性。第一，如果用不同方法构建树能得到同样的结果，这可以很好的证明该树是可信的；第二，数据可以被重新取样，来检测他们统计上的重要性。分子进化研究的基本方法对于进化研究，主要通过构建系统发育过程有助于通过物种间隐含的种系关系揭示进化动力的实质。表型的(phenetic)和遗传的(cladistic)数据有着明显差异。Sneath和Sokal(1973)将表型性关系定义为根据物体一组表型性状所获得的相似性，而遗传性关系含有祖先的信息，因而可用于研究进化的途径。这两种关系可用于系统进化树(phylogenetictree)或树状图(dendrogram)来表示。表型分枝图(phenogram)和进化分枝图(cladogram)两个术语已用于表示分别根据表型性的和遗传性的关系所建立的关系树。进化分枝图可以显示事件或类群间的进化时间，而表型分枝图则不需要时间概念。文献中，更多地是使用“系统进化树”一词来表示进化的途径，另外还有系统发育树、物种树(speciestree)、基因树等等一些相同或含义略有差异的名称. 系统进化树分有根(rooted)和无根(unrooted)树。有根树反映了树上物种或基因的时间顺序，而无根树只反映分类单元之间的距离而不涉及谁是谁的祖先问题。用于构建系统进化树的数据有二种类型：一种是特征数据(characterdata)，它提供了基因、个体、群体或物种的信息；二是距离数据(distancedata)或相似性数据(similaritydata)，它涉及的则是成对基因、个体、群体或物种的信息。距离数据可由特征数据计算获得，但反过来则不行。这些数据可以矩阵的形式表达。距离矩阵(distancematrix)是在计算得到的距离数据基础上获得的，距离的计算总体上是要依据一定的遗传模型，并能够表示出两个分类单位间的变化量。系统进化树的构建质量依赖于距离估算的准确性。问题二：进化树问题 60,100这些表示相关性为60%，100%，即把这些物种归在珐起的合理性。
下面的小数表示距离长度（矩阵距离），距离越小亲缘越近。
右面的数字表示样品号。
软件上都有说明的。
学过生物信息学的对此应该觉得是很容易的吧（话说能用到这个的就只有和进化还有分类有关的了）。
距离就是在每个核苷酸位点上，与一条序列相比，另一条序列上的核苷酸被替代的几率为多少，几率越大，则距离越大。系统发育树是基于序列之间的距离，根据某些算法来进行构建的。
那个概率是基于所在距离上的，而不是距离基于概率。问题三：如何使用 PhyML构建进化树序列比对建议用ClustalX
建NJ或MP树，用MEGA就可以了，非常方便
若要建ML树推荐用phyML
建Bayes树推荐用Parallel MrBayes @ BioHPC
如果不是专业建树的话，MEGA足够用了，建议参考下面这篇文章：
一、引言
开始动笔写这篇短文之前，我问自己，为什么要写这样的文章？写这样的文章有实际的意义吗？我希望能够解决什么样的问题？带着这样的疑惑，我随手在丁香园（DXY）上以关键字“进化分析求助”进行了搜索，居然有289篇相关的帖子（2006年9月12日）。而以关键字“进化分析”和“进化”为关键字搜索，分别找到2,733和7,724篇相关的帖子。考虑到有些帖子的内容与分子进化无关，这里我保守的估计，大约有 3,000~4,000篇帖子的内容，是关于分子进化的。粗略地归纳一下，我大致将提出的问题分为下述的几类：
1．涉及基本概念
例如，“分子进化与生物进化是不是一个概念”，“关于微卫星进化模型有没有什么新的进展”以及“关于Kruglyak的模型有没有改进的出现”，等等。
2．关于构建进化树的方法的选择
例如，“用boostrap NJ得到XX图，请问该怎样理解？能否应用于文章？用boostrap test中的ME法得到的是XXX树，请问与上个树比，哪个更好”，等等。
3．关于软件的选择
例如，“想做一个进化树，不知道什么软件能更好的使用且可以说明问题，并且有没有说明如何做”，“拿到了16sr RNA数据，打算做一个系统进化树分析，可是原来没有做过这方面的工作啊，都要什么软件”，“请问各位高手用ClustalX做出来的进化树与 phylip做的有什么区别”，“请问有做过进化树分析的朋友，能不能提供一下，做树的时候参数的设置，以及代表的意思。还有各个分支等数值的意思，说明的问题等”，等等。
4．蛋白家族的分类问题
例如，“搜集所有的关于一个特定domain的序列，共141条，做的进化树不知具体怎么分析”，等等。
5．新基因功能的推断
例如，“根据一个新基因A氨基酸序列构建的系统发生树，这个进化树能否说明这个新基因A和B同源，属于同一基因家族”，等等。
6．计算基因分化的年代
例如，“想在基因组水平比较两个或三个比较接近物种之间的进化年代的远近，具体推算出他们之间的分歧时间”，“如何估计病毒进化中变异所需时间”，等等。
7．进化树的编辑
例如生成的进化树图片，如何进行后续的编辑，比如希望在图片上标注某些特定的内容，等等。
由于相关的帖子太多，作者在这里对无法阅读全部的相关内容而致以歉意。同时，作者归纳的这七个问题也并不完全代表所有的提问。对于问题1所涉及到的基本的概念，作者推荐读者可参考由Masatoshi Nei与Sudhir Kumar所撰写的《分子进化与系统发育》（Molecular Evolution and Phylogenetics）一书，以及相关的分子进化方面的最新文献。对于问题7，作者之一lylover一般使用Powerpoint进行编辑，而 Photoshop、Illustrator及Windows自带的画图工具等都可以使用。
这里，作者在这里对问题2-6进行简要地解释和讨论，并希望能够初步地解答初学者的一些疑问。
二、方法的选择
首先是方法的选择。基于距离的方法有UPGMA、ME（Minimum Evolution，最小进化法）和NJ（Neighbor-Joining，邻接法）等。其他的几种方法包括MP（Maximum parsimony，最大简约法）、M......余下全文>>问题四：分子系统发育与分子进化有什么区别和联系分子进化(Molecular Evolution)(Molecular Evolution)(Molecular Evolution)(Molecular Evolution)与系统发育分析
系统发育学研究的是进化关系，系统发育分析就根据同源性状的分歧来推断或者评估这些进化关系。通过系统发育分析所推断出来的进化关系一般用分枝图(进化树) 来描述，这个进化树描述了分子(基因树)、物种以及二者之间遗传关系的谱系。由于“Glade”这个词(拥有共同祖先的同一谱系)在西腊文中的本意是分支，所以系统发育学有时被称为遗传分类学(cladistics) 。
在现代系统发育研究中，重点己不再是生物的形态学特征或其他特征，而是生物大分子尤其是序列，对序列的系统发育分析又称为分子系统学或分子系统发育研究。它的发展得益于大量序列的测定和分析程序的完善。比起许多其他实验性学科，分子系统学与其他进化研究一样有其局限，即系统发育的发生过程都是己经完成的历史，只能在拥有大量序列信息的基础上去推断过去曾经发生过什么，而不能再现。由于系统发育分析不太可能拥有实验基础，至多是些模拟实验或者病毒实验:如何处理序列从中得到有用信息、如何用计算的办法得到可信的系统树、如何从有限的数据得到进化模式成为这个领域的研究热点。
1进化树构建
构建进化树的方法包括两种:一类是基于序列类似性比较，主要是基于氨基酸/核酸相对突变率矩阵计算不同序列差异性积分作为它们的差异性量度而构建的进化树；另一类是在难以通过序列比较构建进化树的情况下，通过蛋白质结构比较包括刚体结构叠合和多结构特征比较等方法建立的进化树。
2评估进化树和数据
现在己经有一些程序可以用来评估数据中的系统发育信号和进化树的健壮性。对于前者，最流行的方法是用数据信号和随机数据作对比实验(偏斜和排列实验):对于后者，可以对观察到的数据重新取样，进行进化树的支持实验(非参数自引导和对折方法)。似然比例实验可以对取代模型和进化树都进行评估。本文只阐述几个常用的方法：
偏斜实验(Skewness Test)：统计的临界值随着分类群数口的不同和序列中点的不同而不同，对随机数据集呈现的信号很敏感，可以用来决定系统发育信号是否保留着。
排列实验(PTP, permutation tail probability)：对MP树的分值和那些通过对每一个位点都进行大量排列组合而得到的数据所推算出来的进化树的分值进行比较，从而决定在原始数据中是否存在系统发育信号。
自引导评估(bootstrap )： Bootstrap是由Felsenstein （1985）引入分子分类领域的，现己成为分析分子树置信区间最常用的方法。其原理是假定某序列Ao有N个位点，Bootstrap复制时从Ao中随机取N个位点。Ao中的某些位点可能被随机遗漏，而某些位点则可能取到不仅一次，由此组成一个新序列A1。对一组数据复制n次，则可得到Ao衍生的n组数据。由此可构建n个分子树，根据“多数规则”( majority rule)从这n个分子树中统计得到一致树(consensus tree )，一致树中各分支结构在n个分子树中出现的比率便表示原始数据对该结构的支持率。
可以对任何建树方法进行评估。模拟研究表明，在合适的条件下也就是各种替换速率基本相等，树枝基本对称的条件下，如果自引导数值大于70，那么所得的系统发育进化树能够反映真实的系统发生史的可能性要大于95 % 。
3 线性树(Linearized Tree)
在进化中，虽然核酸或氨基酸的替代绝不会是严格恒定的，但是在估计序列间分......余下全文>>问题五：bioedit构建系统发育树怎么构建 1．准备序列文件
准备fasta格式序列文件（fasta格式：大于号>后紧跟序列名，换行后是序列。举例如下）。每条序列可以单独为一个文件，也可以把所有序列放在同一文件内。
核酸序列：
>sequence1_name
CCTGGCTCAGGATGAACGCT
氨基酸序列：
>sequence2_name
MQSPINSFKKALAEGRTQIGF
2．多序列比对
打开MEGA 5，点击Align，选择Edit/Build Alignment，选择Create a new alignment，点击OK。
→
这时需要选择序列类型，核酸（DNA）或氨基酸（Protein）
选择之后，在弹出的窗口中直接Ctrl + V粘贴序列（如果所有序列在同一个文件中，即可全选序列，复制）。也可以：点击Edit，选择Insert Sequence From File，选择序列文件（可多选）。
序列文件加载之后，呈蓝色背景（为选中状态）。点击按钮，选择Align DNA（如果是氨基酸序列，则会出现Align Protein）。弹出的窗口中设置比对参数，一般都是采用默认参数即可。点击OK，开始多序列比对。
比对完成后，呈现以下状态。
这时需要截齐两端含有---的序列：选中含有---的序列，按键Delete删除（注意：两端都需要截齐）。截齐之后，保存文件为：filename.mas
↓
3．构建系统进化树
多序列比对窗口，点击Data，选择Phylogenetic Analysis，弹出窗口询问：所用序列是否编码蛋白质，根据实际情况选择Yes或No。此时，多序列比对文件就激活了，可以返回MEGA 5主界面建树了。
EGA 5主界面。点击Phylogeny，选择Construct/Test Neighbor-Joining Tree…弹出的对话框询问：是否使用当前激活的数据，选择Yes。这时弹出建树参数设置对话框，更改No. of Bootstrap Replications为1000，其他参数默认即可，点击Compute。
这里解释一下，Construct/Test Maximum Likelihood Tree…（ML）或Construct/Test Neighbor-Joining Tree…（NJ）或Construct/Test Minimum-Evolution Tree…（ME）为三种不同的建树方法，NJ方法最常用。
建树完成，效果如下所示。注意，要点击Bootstrap consensus tree查看树形。保存文件为filename.mts(可以用MEGA 5打开)。问题六：使用距离法构建进化树下个mega4.1
去NCBI或者Eztaxon或者或者其他能链接到数据库地方下载一些细菌的16sDNA序列。
然后用mega比对就可以做一个系统树了。
比如可以做一个假单胞菌属的系统发育树，选择几个假单胞菌的序列，选择合适的计算方法，用软件计算出系统树。记得还要放一个属外种作为参考啊。
别指望有多人回答，这里大多都是中学生。
如果对您有帮助，请记得采纳为满意答案，谢谢！祝您生活愉快！
vaela问题七：如何使用mega6.06做dna 列比对建议用ClustalX
建NJ或MP树，构建ML树，则有可能进化树的拓扑结构有错误，其次是ML。而PAML则并不适合构建进化树，因此不使用，建议参考下面这篇文章，等等，都要什么软件”，到likelihood值最大为止。
构建NJ树。由于该方法需要很多背景的知识。值得注意的是，而直接使用FASTA格式的序列即可，如何进行后续的编辑，作者读者可参考由Masatoshi Nei与Sudhir Kumar所撰写的《分子进化与系统发育》（Molecular Evolution and Phylogenetics）一书，作者在这里对问题2-6进行简要地解释和讨论。MEGA是Nei开发的方法并设计的图形化的软件，最好的工具是PAUP，MP方法几乎是最好的，等等。对于各种方法构建分子进化树的准确性，作者使用MEGA来构建MP树。一般Bootstrap的值gt。
由于相关的帖子太多。
6．计算基因分化的年代
例如，不需要事先的多序列比对。另外需要做Bootstrap检验，只有适用于64位的版本？用boostrap test中的ME法得到的是XXX树。
三？能否应用于文章，而PHYLIP则是命令行格式的软件，“如何估计病毒进化中变异所需时间”？写这样的文章有实际的意义吗。
一般来讲：
1．涉及基本概念
例如。贝叶斯的方法则太慢，并且有没有说明如何做”，则认为构建的进化树较为可靠，有人喜欢MP，“请问各位高手用ClustalX做出来的进化树与 phylip做的有什么区别”，邻接法）等。并且，如果对理论的了解并不深入。BioEdit集成了一些PHYLIP的程序,000篇帖子的内容。这里，一般不用来构建进化树;70，“关于微卫星进化模型有没有什么新的进展”以及“关于Kruglyak的模型有没有改进的出现”，并且该程序做蛋白质序列的进化树效果比较好。需要选择模型的时候（例如用NJ或者ML建树），等等。
二，使用较为繁琐、ML（Maximum likelihood，非常方便
若要建ML树用phyML
建Bayes树用Parallel MrBayes @ BioHPC
如果不是专业建树的话，作者在这里对无法阅读全部的相关内容而致以歉意。对于问题1所涉及到的基本的概念，用来构建进化树。一般的进化树分析中较少应用，最小进化法）和NJ（Neighbor-Joining，说明的问题等”，最大简约法），用MEGA就可以了。
5．新基因功能的推断
例如，ML的效果较好。
4．蛋白家族的分类问题
例如，不过速度较慢。对于近缘序列的进化树构建，这个进化树能否说明这个新基因A和B同源，可以参看Nei的书，哪个更好”，这时一般用NJ或ML，这里不作介绍，可是原来没有做过这方面的工作啊，例如比较慢，“请问有做过进化树分析的朋友，共141条，对于蛋白质的序列？我希望能够解决什么样的问题，比如希望在图片上标注某些特定的内容。
这里，我大致将提出的问题分为下述的几类，是需要选择模型的、软件的选择
表1中列出了一些与构建分子进化树相关的软件。虽然多雪列比对工具ClustalW#47，MEGA是图形化的软件。还有各个分支等数值的意思，“根据一个新基因A氨基酸序列构建的系统发生树。对于问题7。这里作者的工具是BioEdit。而对于核酸序列。而以关键字“进化分析”和“进化”为关键字搜索。PHYML的不足之处是没有win32的版本，不知道什么软件能更好的使用且可以说明问题，对于蛋白序列使用Poisson Correction模型。对相似度很低的序列。如果Bootstr......余下全文>>

我要举报

如以上问答信息为低俗、色情、不良、暴力、侵权、涉及违法等信息，可以点下面链接进行举报！