chazi 发表于 2009-4-22 18:06:39

照着教程做,采集到过滤那步有点问题.求助.

本帖最后由 chazi 于 2009-4-22 18:21 编辑

原来,中间有个空格...




俺也这样写... 结果,过滤不掉.

看看俺写的.



chazi 发表于 2009-4-22 18:07:29

第2个图中间的通配符加不加都过滤不掉.

chazi 发表于 2009-4-22 18:09:21

汗换成<div id="Reading">(*)<!-->|xGv00|d12fa259091f22c7a77a14e1cdbed9dd<!-->可以.在研究下.

专业收费采集 发表于 2009-4-22 18:10:05

不要两个过滤的写再一起   一个过滤的写一个

afanfan2007 发表于 2009-4-22 18:13:25

<!-->|xGv00|d12fa259091f22c7a77a14e1cdbed9dd<!-->
<!--> <!-->中间的是变动的 最好也换成(*)

chazi 发表于 2009-4-22 18:14:46

4# 专业收费采集

谢谢大大.



没看懂你意思,不要2个过滤一起写,一个过滤写一个.什么意思?添加2条过滤?

chazi 发表于 2009-4-22 18:18:20

<div id="Reading">(*)</div><!-->(*)<!-->

这个是完整的过滤.

试采集的是火车2009程序自带教程:http://news.qq.com/a/20090204/000175.htm

按照上面的过滤规则,应该没错的啊.

对了,这个选择是按照第一条出现的开始选择过滤.还是查找该页唯一标识然后过滤?如果查找到标识很多怎么说?

专业收费采集 发表于 2009-4-22 18:43:54

是的   你就把需要过滤的 一条作为一个过滤的记录
不要把多条写一起 你测试看下 把变东的都设置*
页: [1]
查看完整版本: 照着教程做,采集到过滤那步有点问题.求助.