paul9801 发表于 2006-3-1 20:54:27

分享一个图片站采集规则,另有一个疑问

[采集目标站]http://www.mmku.cn/Get/zhipai/index.htm
[网址规则]
1."手动添加相似网址"处 输入 http://www.mmku.cn/Get/zhipai/index_(*).htm
    通配符范围 为 2-96 之间的任何数 我自己选择的是 2-96
   “添加单条网址”处输入http://www.mmku.cn/Get/zhipai/index.htm
   单击 “生成网址”   
2. 钩掉 “系统自动识别网址连接” ,选择“自定义网址连接格式”
    在此栏中输入以下内容 <a    href="(*)" title(*)">.*</a>
   然后再分别点击“生成网址”和“采集多页二级连接”
3. 保存上述设置
4. 进入“全局配置” ---“新建规则”
   标题开始字串和结束字串分别为 为 <H3>和</H3> , 标题排除 为 <FONT color=#ff0000>|</FONT>

   内容 开始字串和结束字串分别为<TR height=10>
<TD>
<TABLE cellSpacing=4 cellPadding=0 width="100%" border=0>
<TBODY>
<TR>
<TD>
<DIV align=center>和 </A><P>&nbsp;</DIV></TD></TR>

然后保存命名。
通过上述的设置,我已经成功采集到了图片
演示见: http://www.best1.cn/phpcms/data/pic/



我还有一个疑问,请热心的高手赐教解答
[采集目标站]http://www.zrit.com/flash/Html/Flashyx/index.html
[网址规则]
1."手动添加相似网址"处 输入 http://www.zrit.com/flash/Html/Flashyx/index_(*).html
    通配符范围 为 2-5之间的任何数 我自己选择的是 2-5
   “添加单条网址”处输入http://www.zrit.com/flash/Html/Flashyx/index.html
   单击 “生成网址”   
2. 钩掉 “系统自动识别网址连接” ,选择“自定义网址连接格式”
    在此栏中输入以下内容 <atarget="_blank"href="(*)l" title="(*)">.*</a>
   然后再分别点击“生成网址”和“采集多页二级连接”
3. 保存上述设置
4. 进入“全局配置” ---“新建规则”
   标题开始字串和结束字串分别为 为 <title>和</title> , 标题排除 为

   内容 开始字串和结束字串分别为<div class="qwnr"><div class="znr">和 <br />            
</div>
<br>

   内容代替部分,由/myjs代替为 http://www.zrit.com/flash/Html/Flashyx/myjs

最后保存命名。

但是采集之后,均为“未知” 不知道是不是采集规则有问题,请高手指教。

路明 发表于 2006-3-5 02:59:45

内容 开始字串和结束字串分别为


<div class="znr">


结束部分
<br />

阿成 发表于 2006-7-31 23:56:17

不错!

mmjjh 发表于 2006-8-6 12:58:37

拿分``走人`````

paopao 发表于 2006-8-15 15:32:03

为什么按你说的一字不差的做,还是采集不成功,提示“内容出现错误!”,晕~~~从来没成功采集过一次,我崩溃~~
页: [1]
查看完整版本: 分享一个图片站采集规则,另有一个疑问