采集月光博客的规则
采集月光博客的规则,第一步,
起始网址
在博客上查看网址是这样的http://www.williamlong.info/cat/?cate=3&page=10
总共有13页
生成起始网址为
http://www.williamlong.info/cat/?cate=3&page=<0, 1, 13, 1, False, False>
多级网址获取:
选择从页面自动分析得到地址链接
从该选定区域中获得网址
从<h2 class="post-title"><a href="到"
必须包含http://www.williamlong.info/archives/(*)
测试网址采集, 居然为空, 有人能告诉我为什么吗?
谢谢 你也是7.0?
我测试了下的,你下载看看
<div id="divMain">这个开始吧!
H2标签每个标题前面都是!
<div class="post pagebar">这里结束! <h2 class="post-title"><a href="[参数]" rel="bookmark">
我修改成这样, 就是正确的了, 谢谢大家的帮助
页:
[1]