在估算LTR(Long Terminal Repeat)逆转录病毒样转座子插入时间时,应当选择“完整的LTR”对”进行分析,而不是全部LTR。
为什么选择“完整的LTR对”?
LTR插入时间估算的基本原理是:LTR类转座子在插入时,其两端的LTR序列是完全相同的。插入后,随着时间推移,这两个LTR由于中性突变会逐渐发生序列差异,我们可以通过计算它们之间的差异来推算插入时间。
因此,必须满足以下条件:
-
必须是同一个转座子的5'和3' LTR序列;
-
必须能正确配对并比对这两个序列;
-
单独一个LTR(如只有5'或3')不能用于估算插入时间。
插入时间估算公式
T=K2rT = \frac{K}{2r}
-
T:插入时间(单位:年)
-
K:两个LTR之间的碱基替代率(可以用Jukes-Cantor模型等校正)
-
r:中性突变率(例如植物常用 1.3×10−81.3 \times 10^{-8} 或根据物种估计)
实际流程(常用软件如LTR_retriever):
-
使用LTRharvest、LTR_Finder 等工具识别成对LTR结构
-
利用LTR_retriever提取完整的LTR对
-
对LTR对进行比对并计算序列差异(如用MAFFT)
-
计算K并代入突变率r
-
得到每个LTR插入时间
小结
项目 | 是否用于计算 |
---|---|
完整LTR对(5' 和 3') | ✅ 必须使用 |
单独LTR(只有5'或3') | ❌ 不可用 |
不完整或退化LTR对 | ⚠️ 精度差,不推荐 |