阿里巴巴信息中心-采集分页的问题-这东西怎么去除?
有谁成功采集阿里巴巴信息中心的网页,不知道大家怎么处理分页的问题?我采集后的页面,在分页的地方都有这样的东西:
http://img.china.alibaba.com/images/cn/news/newsdetail/detail_news/page_r1_c1.gif 1 2 http://img.china.alibaba.com/images/cn/news/newsdetail/detail_news/page_r1_c3.gif
我哪里做错了? 我不要这样的东西。。。。
页:
[1]