原帖由 财子加人 于 2008-8-17 02:51 发表 http://bbs.locoy.com/images/common/back.gif
http://club.auto.tom.com/forum_116_0_0_0_0.html 分页、图片 、回复完整采集
http://club.news.tom.com/forum_211_0_0_0_0.html分页、图片 、回复完整采集
http://club.news.tom.com/forum_230_0_0_0_0.html分页 ...
请看贴子说明,谢谢,或者,你还可以去其它的贴看看,有好几个免费做规则的,他们会帮你的
呵呵谢谢了哈:lol
老大帮我写一个驱动之家的规则吧!主要是笔记本的,最好能详细点 我新手 !~
http://drivers.mydrivers.com/drivers-1102-notebook-soft/
主要是有一个多页面采集 我不会写 昨天弄了一宿 哎 上来求救了 呵呵
[ 本帖最后由 nbtools 于 2008-8-18 12:34 编辑 ]
原帖由 ghosten 于 2008-8-15 13:59 发表 http://bbs.locoy.com/images/common/back.gif
老大,先谢谢你!
还是想麻烦你,我想以下面这个地址为例,帮我做做,我学习着演化一下,呵呵。
源地址:http://www.chinacrops.org/zwxb/cn/gkll.asp
采集地址如:(为源地址下2008期NO.8的连接地址)http:/ ...
已基本搞定 利用分页采集可以实现目的 谢谢你的关注。呵呵
不好意思哦,我都没有为你做什么
http://www.hljrstbb.gov.cn:8103/ ... ydwgkzpzw_index.htm
黑龙江人事编制信息网,这个网址是我以前收藏的,现在页面全换成java了,从首页点超链接根本无法看到静态页面,
我遇到的问题:无法从该链接获取“下一页”网址,后面的采集内容头就更大了,附该页部分代码,请楼主帮助一下,谢谢
<TABLE >
<TR >
<TD ><img src='/public/common/icon/sq-02-dot-01.gif' border=0 align='absmiddle' > <a href="javascript:templateSubmit('AD','1','12325','1445','_blank');" >黑龙江省轻工设计院二00八年补招人员方案</a></TD>
</TR>
<TR >
<TD ><img src='/public/common/icon/sq-02-dot-01.gif' border=0 align='absmiddle' > <a href="javascript:templateSubmit('AD','1','12301','1445','_blank');" >黑龙江省社会科学院2008年公开招聘专业技术人员方案</a></TD>
</TR>
<TR >
<TD ><img src='/public/common/icon/sq-02-dot-01.gif' border=0 align='absmiddle' > <a href="javascript:templateSubmit('AD','1','12140','1445','_blank');" >黑龙江省农科院2008年补招人员方案 </a></TD>
</TR>
<TR >
<TD ><img src='/public/common/icon/sq-02-dot-01.gif' border=0 align='absmiddle' > <a href="javascript:templateSubmit('AD','1','12130','1445','_blank');" >黑龙江省广播电视局部分所属事业单位2008年招聘专业技术人员工作方案</a></TD>
</TR>
<TR >
<TD ><img src='/public/common/icon/sq-02-dot-01.gif' border=0 align='absmiddle' > <a href="javascript:templateSubmit('AD','1','12129','1445','_blank');" >黑龙江省广播电视局公开考试选调机关工作人员工作方案</a></TD>
</TR>
<TR >
<TD ><img src='/public/common/icon/sq-02-dot-01.gif' border=0 align='absmiddle' > <a href="javascript:templateSubmit('AD','1','12110','1445','_blank');" >黑龙江朝鲜民族出版社2008年公开招聘人员方案</a></TD>
</TR>
<TR >
<TD ><img src='/public/common/icon/sq-02-dot-01.gif' border=0 align='absmiddle' > <a href="javascript:templateSubmit('AD','1','12101','1445','_blank');" >黑龙江农垦职业学院2008年增加公开招聘计划</a></TD>
</TR>
<TR >
<TD ><img src='/public/common/icon/sq-02-dot-01.gif' border=0 align='absmiddle' > <a href="javascript:templateSubmit('AD','1','12087','1445','_blank');" >省食品药品监督管理局2008年部分事业单位公开招聘人员方案</a></TD>
</TR>
<TR >
<TD ><img src='/public/common/icon/sq-02-dot-01.gif' border=0 align='absmiddle' > <a href="javascript:templateSubmit('AD','1','12074','1445','_blank');" >黑龙江省冶金设计规划院2008年公开招聘专业技术人员方案</a></TD>
</TR>
<TR >
<TD ><img src='/public/common/icon/sq-02-dot-01.gif' border=0 align='absmiddle' > <a href="javascript:templateSubmit('AD','1','12070','1445','_blank');" > 黑龙江省畜牧研究所二○○八年公开招聘人员方案</a></TD>
</TR>
</TABLE><table border="0" width="100%" cellpadding="0" cellspacing="0">
<tr align='right'><td>
<table border="0" cellpadding="0" cellspacing="0">
<tr align=right>
<td><a href="javascript:chaxun_templateSubmit('AD_sydwgkzpzw_index.htm','query_AD_sydwgkzpzw.xml','1','_self');">首页</a>
上一页
<a href="javascript:chaxun_templateSubmit('AD_sydwgkzpzw_index.htm','query_AD_sydwgkzpzw.xml','2','_self');">下一页</a>
<a href="javascript:chaxun_templateSubmit('AD_sydwgkzpzw_index.htm','query_AD_sydwgkzpzw.xml','26','_self');">尾页</a>
共26页</td>
</tr></table>
</td></tr>
</table>
[ 本帖最后由 ice_free 于 2008-8-19 08:44 编辑 ]
原帖由 ice_free 于 2008-8-19 08:26 发表 http://bbs.locoy.com/images/common/back.gif
http://www.hljrstbb.gov.cn:8103/ ... ydwgkzpzw_index.htm
黑龙江人事编制信息网,这个网址是我以前收藏的,现在页面全换成java了,从首页点超链接根本无法看到静态页面,
我遇到的问题:无法从该链接获取“ ...
不好意思,这个我也不会,看了很久都没有找到方法,所以,只有对你说,对不起了,唉,活到老,学到老,还要多多学习
原帖由 chenfy 于 2008-8-18 15:53 发表 http://bbs.locoy.com/images/common/back.gif
不好意思哦,我都没有为你做什么
又来请教了,如何让采集到的内容能像源内容一样具有相同的排版方式,或者所如何在火车(免费版)里达到重新排版的目的?
我采集到的内容要不就是排版比较乱,去了代码标签后就到处是空格空行,我掖不是很理解发布中的html发布和ubb发布的区别,自己选的是ubb的。谢谢!
原帖由 chenfy 于 2008-8-19 12:06 发表 http://bbs.locoy.com/images/common/back.gif
不好意思,这个我也不会,看了很久都没有找到方法,所以,只有对你说,对不起了,唉,活到老,学到老,还要多多学习
没关系,同样感谢!
学习学习一起学习:ali10ls
原帖由 ghosten 于 2008-8-19 12:22 发表 http://bbs.locoy.com/images/common/back.gif
又来请教了,如何让采集到的内容能像源内容一样具有相同的排版方式,或者所如何在火车(免费版)里达到重新排版的目的?
我采集到的内容要不就是排版比较乱,去了代码标签后就到处是空格空行,我掖不是很理解 ...
我用的是html发布,采集的时候尽量保留格式相关的标签,版式就和原文一样了,重新排版这个不太清楚,我也是新手,ubb发布也没研究,呵呵