照着教程做,采集到过滤那步有点问题.求助.
本帖最后由 chazi 于 2009-4-22 18:21 编辑原来,中间有个空格...
俺也这样写... 结果,过滤不掉.
看看俺写的.
第2个图中间的通配符加不加都过滤不掉. 汗换成<div id="Reading">(*)<!-->|xGv00|d12fa259091f22c7a77a14e1cdbed9dd<!-->可以.在研究下. 不要两个过滤的写再一起 一个过滤的写一个 <!-->|xGv00|d12fa259091f22c7a77a14e1cdbed9dd<!-->
<!--> <!-->中间的是变动的 最好也换成(*) 4# 专业收费采集
谢谢大大.
没看懂你意思,不要2个过滤一起写,一个过滤写一个.什么意思?添加2条过滤? <div id="Reading">(*)</div><!-->(*)<!-->
这个是完整的过滤.
试采集的是火车2009程序自带教程:http://news.qq.com/a/20090204/000175.htm
按照上面的过滤规则,应该没错的啊.
对了,这个选择是按照第一条出现的开始选择过滤.还是查找该页唯一标识然后过滤?如果查找到标识很多怎么说? 是的 你就把需要过滤的 一条作为一个过滤的记录
不要把多条写一起 你测试看下 把变东的都设置*
页:
[1]