光辉 发表于 2006-2-22 15:01:48

太平洋汽车网论坛采集规则

我采集的是福克斯版块的

http://autobbs.pconline.com.cn/forum.jsp?fid=14637

<TbxUrl>http://autobbs.pconline.com.cn/forum.jsp?pid=&amp;fid=14637&amp;commend=&amp;award=&amp;pageSize=30&amp;pageNo=2</TbxUrl>
<TxtMust>topic</TxtMust>
<TxtForbidden>&amp;page</TxtForbidden>
<SimilarUrl>http://autobbs.pconline.com.cn/forum.jsp?pid=&amp;fid=14637&amp;commend=&amp;award=&amp;pageSize=30&amp;pageNo=(*)</SimilarUrl>



<太平洋>
    <标签1 标签名="标题" 开始字符串="&lt;title&gt;" 结束字符串="- 福克斯 - 太平洋汽车网论坛 PCauto&lt;/title&gt;" 内容排除="" 内容替换="" 采集形式="采集内容" 连接中必须包含="" 连接中不得包含="" 探测真实地址="否" />
    <标签2 标签名="内容" 开始字符串="style=&quot;width:640px;height:auto;overflow:auto;overflow-y:visible;&quot; class=&quot;article&quot;&gt;" 结束字符串="&lt;/div&gt;&lt;/td&gt;" 内容排除="&lt;a href=&quot;(*)&quot; target=&quot;_blank&quot;&gt;○&lt;img src=&quot;○&quot; border=0 alt=&quot;按此在新窗口浏览图片&quot; onload=&quot;javascript:if(this.width&gt;screen.width-500)this.width=screen.width-500;&quot; /&gt;○&lt;/a&gt;" 内容替换="&lt;BR&gt;→&#xD;&#xA;○&lt;br&gt;→&#xD;&#xA;" 采集形式="采集内容" 连接中必须包含="" 连接中不得包含="" 探测真实地址="否" />
    <分页设置 形式="全部" 分页开始="" 分页结束="" />
    <分页合并 形式="回车" 分页代码="#p#" />
    <内容循环 次数="1" 测试页面="http://autobbs.pconline.com.cn/topic.jsp?tid=216959&amp;topicPage=2" />
    <源站编码 编码="Default" />
</太平洋>

netdream 发表于 2006-2-22 16:06:17

谢谢分享!

baobao 发表于 2006-5-21 19:54:55

好啊好啊
谢谢了先

☆令¤狐★ 发表于 2006-8-18 04:05:00

谢谢! 谢谢分享!

kaka 发表于 2006-11-5 04:19:07

:Q 还不知道咋用。。。
页: [1]
查看完整版本: 太平洋汽车网论坛采集规则