引物设计的原则
引物设计3 条基本原则:首先引物与模板的序列要紧密互补,其次引物与引物之间避免形成稳定的二聚体或发夹结构,再次引物不能在模板的非目的位点引发DNA 聚合反应(即错配)
具体实现这3 条基本原则需要考虑到诸多因素,如引物长度(primer length),产物长度(product length),序列Tm (melting temperature),引物与模板形成双链的内部稳定性(internal stability, ?G 值反映),形成引物二聚体(primer dimer)及发夹结构(duplex formation and hairpin)的能值,在错配位点(false priming site)的引发效率,引物及产物的GC 含量(composition),等等。必要时还需对引物进行修饰,如增加限制性内切酶位点,引进突变等。根据有关参考资料和笔者在实践中的总结,引物设计应注意如下要点:
1. 引物的长度一般为15-30 bp,常用的是18-27 bp,但不应大于38,因为过长会导致其延伸温度大于74℃,不适于Taq DNA 聚合酶进行反应[2]
2. 引物序列在模板内应当没有相似性较高,尤其是3’端相似性较高的序列,否则容易导致错配。引物3’端出现3 个以上的连续碱基,如GGG CCC,也会使错误引发机率增加[2]
3. 引物3’端的末位碱基对Taq 酶的DNA 合成效率有较大的影响。不同的末位碱基在错配位置
导致不同的扩增效率,末位碱基为A 的错配效率明显高于其他3 个碱基,因此应当避免在引物的3’端使用碱基A[3][4]。另外,引物二聚体或发夹结构也可能导致PCR 反应失败。5’端序列对PCR 影响不太大,因此常用来引进修饰位点或标记物[2]
4. 引物序列的GC 含量一般为40-60%,过高或过低都不利于引发反应。上下游引物的GC含量不能相差太大[2][5]
5. 引物所对应模板位置序列的Tm 值在72℃左右可使复性条件最佳。Tm 值的计算有多种方法,如按公式Tm4(G+C)2(A+T),在Oligo 软件中使用的是最邻近法(the nearest neighbor method) [6][7]
6. ?G 值是指DNA 双链形成所需的自由能,该值反映了双链结构内部碱基对的相对稳定性。应当选用3’?G 值较低(绝对值不超过9),而5’端和中间?G 值相对较高的引物。引物的3’端的?G 值过高,容易在错配位点形成双链结构并引发DNA 聚合反应[6]
7. 引物二聚体及发夹结构的能值过高(超过4.5kcal/mol)易导致产生引物二聚体带,并且降低引物有效浓度而使PCR 反应不能正常进行[8]
8. 对引物的修饰一般是在5’端增加酶切位点,应根据下一步实验中要插入PCR 产物的载体的相应序列而确定。
值得一提的是,各种模板的引物设计难度不一。有的模板本身条件比较困难,例如GC含量偏高或偏低,导致不到各种指标都十分合适的引物;在用作克隆目的的PCR 因为产物序列相对固定,引物设计的选择自由度较低。在这种情况只能退而求其次,尽量去满足条件。


引物的自动搜索和评价分析
软件的引物设计功能主要体现在两个方面:首先是引物分析评价功能,该功能只有少数商业版软件能够做到,其中以Oligo 6”最优秀;其次是引物的自动搜索功能,各种软件在这方面的侧重点不同,因此自动搜索的结果也不尽相同。据笔者的经验,自动搜索功能以Premier Primer”为最强且方便使用,Oligo 6”其次,其他软件如Vector NTI Suit”、Dnasis”、Omiga”和Dnastar”都带有引物自动搜索功能,但搜索结果不是十分理想。要想得到效果很好的引物,在自动搜索的基础上还要辅以人工分析。笔者认为引物设计软件的最佳搭配是Oligo”和Premier”软件合并使用,以Premier”进行自动搜索,Oligo”进行分析评价,如此可快速设计出成功率很高的引物。
 
 
Primer Premier 5.0 的使用技巧简介
1. 功能
Premier”的主要功能分四大块,其中有三种功能比较常用,即引物设计( )、限制性内切酶位点分析( )DNA 基元(motif)( )Premier”还具有同源性分析功能(),但并非其特长,在此略过。此外,该软件还有一些特殊功能,其中最重要的是设计简并引物,另外还有序列朗读DNA 与蛋白序列的互换( )、语音提示键盘输入( )等等。
有时需要根据一段氨基酸序列反推到DNA 来设计引物,由于大多数氨基酸(20 种常见结构氨基酸中的18 种)的遗传密码不只一种,因此,由氨基酸序列反推DNA 序列时,会遇到部分碱基的不确定性。这样设计并合成的引物实际上是多个序列的混和物,它们的序列组成大部分相同,但在某些位点有所变化,称之为简并引物。遗传密码规则因物种或细胞亚结构的不同而异,比如在线粒体内的遗传密码与细胞核是不一样的。Premier”可以针对模板DNA 的来源以相应的遗传密码规则转换DNA 和氨基酸序列。软件共给出八种生物亚结构的不同遗传密码规则供用户选择,有纤毛虫大核(Ciliate Macronuclear)、无脊椎动物线粒体(Invertebrate Mitochondrion)、支原体(Mycoplasma)、植物线粒体(Plant Mitochondri
on)、原生动物线粒体(Protozoan Mitochondrion)、一般标准(Standard)、脊椎动物线粒体(Vertebrate Mitochondrion)和酵母线粒体(Yeast Mitochondrion)。
2. 使用步骤及技巧
Premier”软件启动界面如下:
(转载的时候就没有图)
其主要功能在主界面上一目了然(按钮功能如上述)。限制性酶切点分析及基元查功能比较简单,点击该功能按钮后,选择相应的限制性内切酶或基元(如-10 序列,-35 序列等),按确定即可。常见的限制性内切酶和基元一般都可以到。你还可以编辑或者添加新限制性内切酶或基元。
进行引物设计时,点击按钮,界面如下:
进一步点击按钮,出现search criteria”窗口,有多种参数可以调整。搜索目的(Seach For)有三种选项,PCR 引物(PCR Primers),测序引物(Sequencing Primers),杂交探针(Hybridization Probes)。搜索类型(Search Type)可选择分别或同时查上、下游引物(Sense/Anti-sense Primer,或Both),或者成对查(Pairs),或者分别以适合上、下游引物为主(Compatible with Sense/Anti-sense Primer)。另外还可改变选择区域(Searc
h Ranges),引物长度(Primer Length),选择方式(Search Mode),参数选择(Search Parameters)等等。使用者可根据自己的需要设定各项参数。如果没有特殊要求,建议使用默认设置。然
后按,随之出现的Search Progress 窗口中显示Search Completed 时,再按,这时搜索结果以表格的形式出现,有三种显示方式,上游引物(Sense),下游引物(Anti-sense),成对显示(Pairs)。默认显示为成对方式,并按优劣次序(Rating)排列,满分为100,即各指标基本都能达标(如下图)。
点击其中一对引物,如第1#引物,并把上述窗口挪开或退出,显示Peimer Premier”主窗口,如图所示:
该图分三部分,最上面是图示PCR 模板及产物位置,中间是所选的上下游引物的一些性质,最下面是四种重要指标的分析,包括发夹结构(Hairpin),二聚体(Dimer),错误引发情况(False Priming),及上下游引物之间二聚体形成情况(Cross Dimer)。当所分析的引物有这四种结构的形成可能时,按钮由变成,点击该按钮,在左下角的窗口中就会出现该结构的形成情况。一对理想的引物应当不存在任何一种上述结构,因此最好的情况是最下面的分析栏没有,只有。值得注意的是中间一栏的末尾给出该引物的最佳退火温度,可参考应用。

在需要对引物进行修饰编辑时,如在5’端加入酶切位点,可点击,然后修改引物序列。若要回到搜索结果中,则点击按钮。如果要设计简并引物,只需根据源氨基酸序列的物种来源选择前述的八种遗传密码规则,反推至DNA 序列即可。对简并引物的分析不需像一般引物那样严格。总之,Premier”有优秀的引物自动搜索功能,同时可进行部分指标的分析,而且容易使用,是一个相当不错的软件。


Oligo 6.22 使用技巧简介
1. 功能
在专门的引物设计软件中,Oligo”是最著名的。它的使用并不十分复杂,但初学者容易被其复杂的图表吓倒。Oligo 5.0 的初始界面是两个图:Tm 图和ΔG 图;Oligo 6.22 的界面更复杂,出现三个图,加了个Frq 图。Oligo”的功能比Premier”还要单一,就是引物设计。但它的引物分析功能如此强大以至于能风靡全世界。
2. 使用(以Oligo 6.22 为例)
Oligo 6.22 的启动界面如下:
图中显示的三个指标分别为TmΔG Frq,其中Frq 6.22 版本的新功能,为邻近67 个碱基组成的亚单位在一个指定数据库文件中的出现频率。该频率高则可增加错误引发的可能性。因为分析要涉及多个指标,起动窗口的cascade 排列方式不太方便,可从windows菜单改为tili 方式。如果觉得太拥挤,可去掉一个指标,如Frq,这样界面的结构同于Oligo5.0,只是显示更清楚了。
经过Windows/Tili 项后的显示如图:
在设计时,可依据图上三种指标的信息选取序列,如果觉得合适,可点击Tm 图块上左下角的Upper 按钮,选好上游引物,此时该按钮变成,表示上游引物已选取好。下游引物的选取步骤基本同上,只是按钮变成Lower?G 值反映了序列与模板的结合强度,最好引物的?G 值在5’端和中间值比较高,而在3’端相对低(如图:)
Tm 值曲线以选取72℃附近为佳,5’3’的下降形状也有利于引物引发聚合反应。Frq 曲线为Oligo 6”新引进的一个指标,揭示了序列片段存在的重复机率大小。选取引物时,宜选用3’Frq 值相对较低的片段。
当上下游引物全选好以后,需要对引物进行评价并根据评价对引物进行修改。首先检查引物
二聚体尤其是3’端二聚体形成的可能性。需要注意的是,引物二聚体有可能是上游或下游引物自身形成,也有可能是在上下游引物之间形成(cross dimer)。二聚体形成的能值越高,越不符合要求。一般的检测(非克隆)性PCR,对引物位置、产物大小要求较低,因而应尽可能选取不形成二聚体或其能值较低的引物。第二项检查是发夹结构(hairpin);与二聚体相同,发夹结构的能值越低越好。一般来说,这两项结构的能值以不超过4.5 为好。
当然,在设计克隆目的的PCR 引物时,引物两端一般都添加酶切位点,必然存在发夹结构,而且能值不会太低。这种PCR 需要通过灵活调控退火温度以达到最好效果,对引物的发夹结构的检测就不应要求太高。第三项检查为GC 含量,以45-55%为宜。有一些模板本身的GC 含量偏低或偏高,导致引物的GC 含量不能被控制在上述范围内,这时应尽量使上下游引物的GC 含量以及Tm 值保持接近,以有利于退火温度的选择。如果PCR 的模板不是基因组DNA,而是一个特定模板序列,那么最好还进行False priming site 的检测。这项检查
可以看出引物在非目的位点引发PCR 反应的可能性。如果引物在错配位点的引发效率比较高,就可能出假阳性的PCR 结果。一般在错配引发效率以不超过100 为好,但对于特定的模板序列,还应结合比较其在正确位点的引发效率。如果两者相差很大,比如在正确位点的引发效率为450 以上,而在错误位点的引发效率为130,那么这对引物也是可以接受的。当我
们结束以上四项检测,按Alt+P 键弹出PCR 窗口,其中总结性地显示该引物的位置、产物大小、Tm 值等参数,最有用的是还给出了推荐的最佳退火温度和简单的评价。
由于Oligo”软件的引物自动搜索功能与Primer Premier 5”的相类似,并且似乎并不比后者更好用,在此不再赘述。其实,使用软件自动搜索引物就是让计算机按照人的要求去寻最佳引物,如果参数设置得当将大大提高工作效率。
除了本地引物设计软件之外,现在还有一些网上引物设计软件,如由Whitehead Institute开发的Primer 3”等(本网站210.72.11.60/ 已引进并调试好该软件,欢迎使用)。该软件的独特之处在于,对全基因组PCR 引物设计;可以将设计好的引物对后台核酸数据库进行比对,发现并排除可引发错配的引物。因此建议经常做全基因组PCR 的用户试用。
 
    PCR引物设计的目的是为了到一对合适的核苷酸片段,使其能有效地扩增模板DNA序列。因此,引物的优劣直接关系到PCR的特异性与成功与否。
要设计引物首先要到DNA序列的保守区。同时应预测将要扩增的片段单链是否形成二级结构。如这个区域单链能形成二级结构,就要避开它。如这一段不能形成二级结构,那就可以
在这一区域设计引物。
现在可以在这一保守区域里设计一对引物。一般引物长度为15~30碱基,扩增片段长度为100~600碱基对。
让我们先看看P1引物。一般引物序列中G+C含量一般为40%~60%。而且四种碱基的分布最好随机。不要有聚嘌呤或聚嘧啶存在。否则P1引物设计的就不合理。应重新寻区域设计引物。
   
  同时引物之间也不能有互补性,一般一对引物间不应多于4个连续碱基的互补。
 
规则门  引物确定以后,可以对引物进行必要的修饰,例如可以在引物的5′端加酶切位点序列;标记生物素、荧光素、等,这对扩增的特异性影响不大。但3′端绝对不能进行任何修饰,因为引物的延伸是从3′端开始的。这里还需提醒的是3′端不要终止于密码子的第3位,因为密码子第3位易发生简并,会影响扩增的特异性与效率。
 
    综上所述我们可以归纳十条PCR引物的设计原则:
 
引物应用核酸系列保守区内设计并具有特异性。
产物不能形成二级结构。
引物长度一般在15~30碱基之间。
G+C含量在40%~60%之间。
碱基要随机分布。
引物自身不能有连续4个碱基的互补。
引物之间不能有连续4个碱基的互补。
引物5′端可以修饰。
引物3′端不可修饰。
引物3′端要避开密码子的第3位。
 
 
  PCR引物设计的目的是到一对合适的核苷酸片段,使其能有效地扩增模板DNA序列。如前述,引物的优劣直接关系到PCR的特异性与成功与否。对引物的设计不可能有一种包罗万象的规则确保PCR的成功,但遵循某些原则,则有助于引物的设计。
 
1.引物的特异性
 
引物与非特异扩增序列的同源性不要超过70%或有连续8个互补碱基同源。
 
2.避开产物的二级结构区
 
某些引物无效的主要原因是引物重复区DNA二级结构的影响,选择扩增片段时最好避开二级结构区域。用有关计算机软件可以预测估计mRNA的稳定二级结构,有助于选择模板。实验表明,待扩区域自由能(G°)小于58.6lkJ/mol时,扩增往往不能成功。若不能避开这一区域时,用7-deaza-2-脱氧GTP取代dGTP对扩增的成功是有帮助的。
 
3.长度
 
寡核苷酸引物长度为15~30bp,一般为20~27mer。引物的有效长度:Ln=2G+C+A+T+Ln值不能大于38,因为>38时,最适延伸温度会超过Taq DNA聚合酶的最适温度(74),不能保证产物的特异性。
 
4.G+C含量
 
G+C含量一般为40%~60%。其Tm值是寡核苷酸的解链温度,即在一定盐浓度条件下,50%
寡核苷酸双链解链的温度,有效启动温度,一般高于Tm5~10℃。若按公式Tm=4G+C+2A+T)估计引物的Tm值,则有效引物的Tm55~80℃,其Tm值最好接近72℃以使复性条件最佳。
 
5.碱基础随机分布
 
引物中四种碱基的分布最好是随机的,不要有聚嘌呤或聚嘧啶的存在。尤其3′端不应超过3个连续的GC,因这样会使引物在G+C富集序列区错误引发。
 
6.引物自身
 
引物自身不应存在互补序列,否则引物自身会折叠成发夹状结构牙引物本身复性。这种二级结构会因空间位阻而影响引物与模板的复性结合。若用人工判断,引物自身连续互补碱基不能大于3bp
 
7.引物之间
 
两引物之间不应不互补性,尤应避免3′端的互补重叠以防引物二聚体的形成。一对引物间不应多于4个连续碱基的同源性或互补性。
 
8.引物的3′端
 
引物的延伸是从3′端开始的,不能进行任何修饰。3′端也不能有形成任何二级结构可能,除在特殊的PCRAS-PCR)反应中,引物3′端不能发生错配。
 
在标准PCR反应体系中,用2U Taq DNA聚合酶和800μmol/L dNTP(四种dNTP200μmol/L)以质粒(103拷贝)为模板,按95℃,25s55℃,25s72℃,1min的循环参数扩增HIV-1 gag基因区的条件下,引物3′端错配对扩增产物的影响是有一定规律的。AA错配使产量下降至1/20AGCC错七下降至1/100。引物A:模板G与引物G:模板A错配对PCR影响是等同的。
 
9.引物的5′端
 
引物的5′端限定着PCR产物的长度,它对扩增特异性影响不大。因此,可以被修饰而不影响扩增的特异性。引物5′端修饰包括:加酶切位点;标记生物素、荧光、、Eu3+等;引入蛋白质结合DNA序列;引入突变位点、插入与缺失突变序列和引入一启动子序列等。
 
10.密码子的简并
 
如扩增编码区域,引物3′端不要终止于密码子的第3位,因密码子的第3位易发生简并,会影响扩增特异性与效率。
 
特殊目的的引物设计将在有关章节讨论。随着人们对引物的认识,一些引物的计算机设计程序也应运而生,下面将讨论有关引物计算机设计方法。