基因组序列分析

时间:05-25 23:49

.Abt424 { display:none; } 隨著人類基因密碼解讀完成,伴隨而來的大量 DNA 序列資料,馬上産生一個重要的課題,即如何從这些資料中,找到大約四萬個人類的主要基因。人類的 DNA 序列中大概僅有不到 5% 是能産生蛋白質的基因,因此要從人類基因組中辨認出有功能的基因,首先就必須暸解基因的結構。一般來說,人類基因可概分爲以下幾個部分:激活子、5'非轉譯區、表現序列、內子、3'非轉譯區、聚腺啓酸化作用點,其中只有表現序列才攜帶産生蛋白質的訊息。

因此,辨認基因的計算機程序,最主要的任務就是從 DNA 序列中,找出基因表現的開始與結束位置,即起始密碼與停止密碼,及接合點(分爲提供點和接受點),進而將同一基因所有的表現序列拼湊出來,最終的目的就是建立出一個完整的基因。科學家研究使用計算機方法去預測散布在基因組中的基因,已經有 15 年的曆史。目前有兩種預測基因的計算機方法,一是根據機率與統計的方法,另一是尋找相似性的方法,隨著已知基因的大量累積,新的計算機程序大都采用尋找相似性的方法。

 相关内容

本页文章:生命奥秘 - 基因组序列分析