http://foodcert.cnca.cn/foodcertWeb/web/certSearch.jsp
这个地址,如何把第一层列表的信息及下一层点击某个企业之后的具体内容都采集出来?
(第一层列表取证书号、企业名称两个字段就行;第二层具体信息取发证日期和认证范围就行。整个抓取前两页就行。)
非常感谢。 12# caidong
自己排除一下就好来,把那源代码中间你不想要的层次 排除掉。或打钩 那些你想要排除的代码即可! 请问下采集一篇文章,想自动在后面加本文转自***,该如何实现?
谢谢
内容规则里
本帖最后由 hl3653h 于 2009-11-9 11:15 编辑14# beiai
正规则+参数1 就可以了、 http://bbs.duote.com/
希望楼主可以随便找个页面给我做个内容采集规则谢谢!
我同样是会写简单的网址采集规则就是内容规则不知道怎么写?
只需要里面的内容 不需要回复什么的 谢谢! 希望楼主可以随便找个DZ的论坛写个规则给我参考下谢谢! 16# lp1232003
晚上 给你写。请稍等 好的 谢谢楼主了~ 朱老师,您好!我是16楼的我通过学习您以前写的一个迅雷下载的采集规则 已经得到我要的答案了~所以不必麻烦您再写一个了
真诚的表示感谢!谢谢!{:4_197:}