hl3653h 发表于 2009-11-7 17:06:12

自己顶一下,做好事 做到低 永不过期!

caidong 发表于 2009-11-7 21:23:16

请教一个问题:
http://foodcert.cnca.cn/foodcertWeb/web/certSearch.jsp
这个地址,如何把第一层列表的信息及下一层点击某个企业之后的具体内容都采集出来?
(第一层列表取证书号、企业名称两个字段就行;第二层具体信息取发证日期和认证范围就行。整个抓取前两页就行。)
非常感谢。

hl3653h 发表于 2009-11-8 11:44:49

12# caidong

自己排除一下就好来,把那源代码中间你不想要的层次 排除掉。或打钩 那些你想要排除的代码即可!

beiai 发表于 2009-11-8 21:00:26

请问下采集一篇文章,想自动在后面加本文转自***,该如何实现?
谢谢

hl3653h 发表于 2009-11-9 10:20:26

内容规则里

本帖最后由 hl3653h 于 2009-11-9 11:15 编辑

14# beiai

正规则+参数1    就可以了、

lp1232003 发表于 2009-11-9 19:02:24

http://bbs.duote.com/

希望楼主可以随便找个页面给我做个内容采集规则谢谢!
我同样是会写简单的网址采集规则就是内容规则不知道怎么写?
只需要里面的内容 不需要回复什么的   谢谢!

lp1232003 发表于 2009-11-9 19:03:05

希望楼主可以随便找个DZ的论坛写个规则给我参考下谢谢!

hl3653h 发表于 2009-11-10 12:37:06

16# lp1232003
晚上 给你写。请稍等

lp1232003 发表于 2009-11-10 13:46:40

好的 谢谢楼主了~

lp1232003 发表于 2009-11-10 15:56:33

朱老师,您好!我是16楼的我通过学习您以前写的一个迅雷下载的采集规则 已经得到我要的答案了~所以不必麻烦您再写一个了
真诚的表示感谢!谢谢!{:4_197:}
页: 1 [2] 3 4 5 6
查看完整版本: 回报火车头【免费】写网站论坛规则,包括回答火车头采集问题