分享一个图片站采集规则,另有一个疑问
[采集目标站]http://www.mmku.cn/Get/zhipai/index.htm[网址规则]
1."手动添加相似网址"处 输入 http://www.mmku.cn/Get/zhipai/index_(*).htm
通配符范围 为 2-96 之间的任何数 我自己选择的是 2-96
“添加单条网址”处输入http://www.mmku.cn/Get/zhipai/index.htm
单击 “生成网址”
2. 钩掉 “系统自动识别网址连接” ,选择“自定义网址连接格式”
在此栏中输入以下内容 <a href="(*)" title(*)">.*</a>
然后再分别点击“生成网址”和“采集多页二级连接”
3. 保存上述设置
4. 进入“全局配置” ---“新建规则”
标题开始字串和结束字串分别为 为 <H3>和</H3> , 标题排除 为 <FONT color=#ff0000>|</FONT>
内容 开始字串和结束字串分别为<TR height=10>
<TD>
<TABLE cellSpacing=4 cellPadding=0 width="100%" border=0>
<TBODY>
<TR>
<TD>
<DIV align=center>和 </A><P> </DIV></TD></TR>
然后保存命名。
通过上述的设置,我已经成功采集到了图片
演示见: http://www.best1.cn/phpcms/data/pic/
我还有一个疑问,请热心的高手赐教解答
[采集目标站]http://www.zrit.com/flash/Html/Flashyx/index.html
[网址规则]
1."手动添加相似网址"处 输入 http://www.zrit.com/flash/Html/Flashyx/index_(*).html
通配符范围 为 2-5之间的任何数 我自己选择的是 2-5
“添加单条网址”处输入http://www.zrit.com/flash/Html/Flashyx/index.html
单击 “生成网址”
2. 钩掉 “系统自动识别网址连接” ,选择“自定义网址连接格式”
在此栏中输入以下内容 <atarget="_blank"href="(*)l" title="(*)">.*</a>
然后再分别点击“生成网址”和“采集多页二级连接”
3. 保存上述设置
4. 进入“全局配置” ---“新建规则”
标题开始字串和结束字串分别为 为 <title>和</title> , 标题排除 为
内容 开始字串和结束字串分别为<div class="qwnr"><div class="znr">和 <br />
</div>
<br>
内容代替部分,由/myjs代替为 http://www.zrit.com/flash/Html/Flashyx/myjs
最后保存命名。
但是采集之后,均为“未知” 不知道是不是采集规则有问题,请高手指教。 内容 开始字串和结束字串分别为
<div class="znr">
结束部分
<br /> 不错! 拿分``走人````` 为什么按你说的一字不差的做,还是采集不成功,提示“内容出现错误!”,晕~~~从来没成功采集过一次,我崩溃~~
页:
[1]