发新话题
打印

分享一个图片站采集规则,另有一个疑问

分享一个图片站采集规则,另有一个疑问

[采集目标站]http://www.mmku.cn/Get/zhipai/index.htm
[网址规则]
1."手动添加相似网址"处 输入
复制内容到剪贴板
代码:
http://www.mmku.cn/Get/zhipai/index_(*).htm
通配符范围 为 2-96 之间的任何数 我自己选择的是 2-96
   “添加单条网址”处  输入
复制内容到剪贴板
代码:
http://www.mmku.cn/Get/zhipai/index.htm
单击 “生成网址”   
2. 钩掉 “系统自动识别网址连接” ,  选择“自定义网址连接格式”
    在此栏中输入以下内容
复制内容到剪贴板
代码:
<a    href="(*)" title(*)">.*</a>
然后再分别点击“生成网址”和“采集多页二级连接”
3. 保存上述设置
4. 进入“全局配置” ---“新建规则”
     标题开始字串和结束字串分别为 为
复制内容到剪贴板
代码:
<H3>和</H3>
, 标题排除 为
复制内容到剪贴板
代码:
<FONT color=#ff0000>|</FONT>
内容 开始字串和结束字串分别为
复制内容到剪贴板
代码:
<TR height=10>
<TD>
<TABLE cellSpacing=4 cellPadding=0 width="100%" border=0>
<TBODY>
<TR>
<TD>
<DIV align=center>
复制内容到剪贴板
代码:
</A><P>&nbsp;</DIV></TD></TR>
然后保存命名。
通过上述的设置,我已经成功采集到了图片
演示见: http://www.best1.cn/phpcms/data/pic/  




我还有一个疑问,请热心的高手赐教解答
[采集目标站]http://www.zrit.com/flash/Html/Flashyx/index.html
[网址规则]
1."手动添加相似网址"处 输入
复制内容到剪贴板
代码:
http://www.zrit.com/flash/Html/Flashyx/index_(*).html
通配符范围 为 2-5之间的任何数 我自己选择的是 2-5
   “添加单条网址”处  输入
复制内容到剪贴板
代码:
http://www.zrit.com/flash/Html/Flashyx/index.html
单击 “生成网址”   
2. 钩掉 “系统自动识别网址连接” ,  选择“自定义网址连接格式”
    在此栏中输入以下内容
复制内容到剪贴板
代码:
<a  target="_blank"  href="(*)l" title="(*)">.*</a>
然后再分别点击“生成网址”和“采集多页二级连接”
3. 保存上述设置
4. 进入“全局配置” ---“新建规则”
     标题开始字串和结束字串分别为 为
复制内容到剪贴板
代码:
<title>和</title>
, 标题排除 为 [code—太阳人FLASH[/code]

     内容 开始字串和结束字串分别为
复制内容到剪贴板
代码:
<div class="qwnr"><div class="znr">
复制内容到剪贴板
代码:
<br />            
  </div>
  <br>
内容代替部分,由
复制内容到剪贴板
代码:
/myjs
代替为
复制内容到剪贴板
代码:
http://www.zrit.com/flash/Html/Flashyx/myjs
最后保存命名。

但是采集之后,均为“未知” 不知道是不是采集规则有问题,请高手指教。

TOP

内容 开始字串和结束字串分别为


<div class="znr">


结束部分
<br />

TOP

不错!

TOP

拿分``走人`````

TOP

为什么按你说的一字不差的做,还是采集不成功,提示“内容出现错误!”,晕~~~从来没成功采集过一次,我崩溃~~

TOP

发新话题
Powered by Discuz! 6.0.0  © 2001-2007 Comsenz Technology Ltd
Processed in 0.214557 second(s), 7 queries, Gzip enabled
当前时区 GMT+8, 现在时间是 2008-11-23 21:10 皖ICP备06000549 清除 Cookies - 联系我们 - 火车采集器官方站 - 静态归档