zb848 发表于 2011-7-8 15:53:34

看着简单,就是采集不到。请高手指教一下

本帖最后由 zb848 于 2011-7-8 16:07 编辑

http://www.hntax.gov.cn/12366_article_list.jsp?pagenum=0&smallclassid=20081205027885

这页面看着应该是简单的采集,可就是无法采集到文章列表,

就是包含http://www.hntax.gov.cn/article_content.jsp?articleid= 的文章内容的列表

那位兄弟指教一下

从源代码看,列表中的地址是类似<a href="article_content.jsp?articleid=20110707632602">  ,没有http://,所以采集不到,正确的应该是
<a href="http://www.hntax.gov.cn/article_content.jsp?articleid=20110707632602"> 这样就可以采集到 

leejunji 发表于 2011-7-8 16:12:30

这个你可以用 手动填写链接规则   凑出你要的地址

zb848 发表于 2011-7-8 16:15:02

这个你可以用 手动填写链接规则   凑出你要的地址
leejunji 发表于 2011-7-8 16:12 http://bbs.locoy.com/images/common/back.gif


    谢谢,请问怎么写规则,我是新手请指教一下

zb848 发表于 2011-7-8 16:46:29

已搞定,再次谢谢这位兄弟
页: [1]
查看完整版本: 看着简单,就是采集不到。请高手指教一下