帮忙看下这个网页的内容规律,谢谢,我晕了。
看了下,几乎没有规律可循。。。。高手看下有无解决办法?
谢谢。
http://www.bjkp.gov.cn/shmk/shxqm/index1.htm 回贴说有些不规则,我自己改了一下采集规则,看看你能不能用,
你重新下载一下我做的规则,我重新上传了~~
如果有什么问题,可以QQ我,我的QQ: 573583
www.rwfzl.cn
[ 本帖最后由 hellof 于 2008-5-26 12:20 编辑 ] 高手.厉害. 呵呵 ,多谢2楼朋友热心帮助。
不过你这个方法,我之前试过过的了,有的采集不到标题、有的采不到内容、还有的2项都采不到。
主要是因为网页是站长自己一篇一篇编写的,好多篇代码都不一样,没有什么规律。
算了,采不出来的,我手动复制吧,还好不多。
还是要谢谢你。 不信,你自己试试这篇http://www.bjkp.gov.cn/shmk/shxqm/k1130-19.htm
或者采集出来的最下面(最后)一篇。
[ 本帖最后由 echoway 于 2008-5-24 22:08 编辑 ] 我试试...应该是不会的
有几个文章好像是生成的源码不大一样,
不过我看了大部份的源码都是差不多,估计有个别吧~~~
不知道是不是故意为之~~
我自己改了下采集规则,还是能采到的~~
[ 本帖最后由 hellof 于 2008-5-26 11:52 编辑 ]
页:
[1]