火车头能用文章链接URL识别规则来采集列表么~?
我看规则里面只有,文章URL必须包含某某字节和连接的大概必须用某某字段
但是如果采集BLOG的话,这样就不太好了
火车头能采集到列表区域,但是区域内能定义列表连接规则么?
譬如:<h2><a href="" rel="bookmark"><span id="*">*</span></a></h2>
这样 :) 这样的也能采集,但是要换个方法,不能直接采!象你这样的做法,目前还不支持! :L 说说~。。。!!!!怎么采集? 可以呀,用自定义网址................ 他的所有文章网址都是类似于
http://www.adfasdfasf.com/2003-3-12/文章标题.html
在文章网址地址里面没有栏目名称
如果是http://www.adfasdfasf.com/栏目名称/文章标题.html
我就可以用过滤字段采集了~。。。。
而且他的列表里面还可能有其他栏目的文章 目前还不支持!
页:
[1]