火车采集器软件交流官方论坛's Archiver
论坛
›
采集器基础使用讨论区
› 如何过滤分页字符
xuanzsheng
发表于 2008-8-9 10:35:48
如何过滤分页字符
大家看一下这个网址,华声娱乐频道的一个内容页:http://yule.voc.com.cn/article/200808/200808071755013290.html
想要把内容底下分页的信息都去掉,就是“上一页 1 2 3 4 .....下一页”这些东西去掉
其中上一页和下一页都是图片,而要采集的内容也是图片,因此不能直接过滤img标签..
还有要把1 2 3 4 这样的字符去掉,应该怎么做呢?
高手给指点下~!谢谢。
pagedown231
发表于 2008-8-9 22:30:11
看了一下,的确有点烦!
页:
[1]
查看完整版本:
如何过滤分页字符