andis01 发表于 2012-2-29 17:25:10

采集月光博客的规则

采集月光博客的规则,
第一步,
起始网址
在博客上查看网址是这样的http://www.williamlong.info/cat/?cate=3&page=10
总共有13页
生成起始网址为
http://www.williamlong.info/cat/?cate=3&page=<0, 1, 13, 1, False, False>
多级网址获取:
选择从页面自动分析得到地址链接
    从该选定区域中获得网址
      从<h2 class="post-title"><a href="到"
             必须包含http://www.williamlong.info/archives/(*)
测试网址采集, 居然为空, 有人能告诉我为什么吗?
谢谢

sss 发表于 2012-2-29 19:39:09

你也是7.0?
我测试了下的,你下载看看

四川开来 发表于 2012-3-1 12:25:26

<div id="divMain">这个开始吧!
H2标签每个标题前面都是!
<div class="post pagebar">这里结束!

andis01 发表于 2012-3-24 09:55:27

<h2 class="post-title"><a href="[参数]" rel="bookmark">
我修改成这样, 就是正确的了, 谢谢大家的帮助
页: [1]
查看完整版本: 采集月光博客的规则