小中大
首先,什么是保护碱基? 为什么要加保护碱基: 常用限制性内切酶多为回文序列,是为识别位点. 限制酶的分子,通常为二聚体,会结合在这个识别位点上,而特异切开序列. PCR的引物导入的序列,或其它方式得到的序列, 如果该位点处于线性片段的末端,酶切的效率可能会受到影响而导致酶切不开或不完全, 所以通常要在识别序列前, 即线行片段的末端加入几个碱基,将位点保护起来,使得它不是处于"最边缘"; 序列内识别序列的另一端,本身不是什么末端,就别去管它了.
其次,加几个和加哪几个的问题: 明白了上面说的内容,很容易知道,加什么碱基都是可以的.Biolabs的目录和网站里有个资料,是不同内切酶识别序列,两端加入不同数目的碱基并检测其切割效率的, 这个表, 成为很多人产生错误结论的"理论根据", 很多人以为,某个酶的保护碱基就应该加那几个碱基, 人家Biolabs可没这么说. 老实说,这个表参考意义没那么大,Oligo的切割,和长片段内部或长片段末端位点的切割行为是不一样的, 那个表也就是个参考而已. 而宝生物产品目录里,对pUC18多克隆位点的相邻位点顺序酶切的酶切效率的表, 更有实际参考意义. 实际工作中,比如设计引物5'端导入酶切位点的时候, 一般导入3~4个;导入的碱基, 最好是A/G/C/T比较平均,并能部分平衡整个引物的GC%和Tm;G/C为主,可以使引物5'形成所谓GC Clamp(有的软件,认为这样好). 别的就没什么了.
另外, 如果不考虑经济上的问题, PCR扩增的片段,还是要先TA克隆一下,测序验证后,再考虑亚克隆;最好不要直接酶切后装入表达载体. 因为表达载体的拷贝数及操作,通常不如常用的克隆载体容易. 在克隆载体上测序不正确,可以重来,费不了多少工夫.很多人是参考发表的文献, 要知道,发表的文献,其Material and Methods,一般是一带而过的, 一般杂志是这样,Nature和Science也是如此, 除非是专门讲方法的文章. 对分子克隆上游操作来说,如果看文献的描述, 估计两天不睡觉也就搞完了, 谁遇到过这么便宜的事? 失败和反复文献中是不提的.