1、过滤文章内容的链接:
广告过滤正则设置:“<a [!--ad--]>,</a>”
2、同上得出,过滤font之类的标签:
广告过滤正则:“<font[!--ad--]>,</font>”
,其他依此类推。
3、同一链接的页面如何重复采集:
到“管理采集节点”那清空节点即可重复采集已入库的页面。
4、采集内容分页正则说明:
如果是全部列表式,则只需看第一页的页面HTML
代码。
常见问题
1、提示信息:Warning: preg_replace() [function.preg-replace]: Compilation failed: range out of order in character class at offset 83 in
答:你的采集正则变量名写错导致,请检查你的正则变量。
猜你喜欢 怎样清洗茶杯里的茶垢 杯子有茶垢对身体有害吗 去角质最好方法 去角质的详细步骤介绍 wzry是什么意思 wzry的解释如下 啥是佩奇是什么梗 啥是佩奇的梗简述 如何洗掉玻璃胶 如何洗掉玻璃上的胶 饺子一般煮多长时间 饺子一般煮多长时间就熟了