xuanzsheng 发表于 2008-8-9 10:35:48

如何过滤分页字符

大家看一下这个网址,华声娱乐频道的一个内容页:http://yule.voc.com.cn/article/200808/200808071755013290.html

想要把内容底下分页的信息都去掉,就是“上一页 1 2 3 4   .....下一页”这些东西去掉

其中上一页和下一页都是图片,而要采集的内容也是图片,因此不能直接过滤img标签..

还有要把1 2 3 4 这样的字符去掉,应该怎么做呢?

高手给指点下~!谢谢。

pagedown231 发表于 2008-8-9 22:30:11

看了一下,的确有点烦!
页: [1]
查看完整版本: 如何过滤分页字符