发新话题
打印

[3.2版] 采集到的空白内容怎么处理

采集到的空白内容怎么处理

怎么处理采集到的空白内容啊
用替换的话,要替换很多,而且不匹配各网页
用正则可以解决吗?
附件: 您所在的用户组无法下载或查看附件

TOP

吃了空白页....然后再采.............期待高手回答

TOP

那都是些空格或制表符,过滤了就可以了

TOP

我已经用标签过滤了,再用内容排除,但还是一样。而且每个页面的空白大小不一样

TOP

这些天脚受伤,闲着无聊,花了几分钟帮楼主修正了.效果见图

[ 本帖最后由 fireye 于 2008-6-29 11:08 编辑 ]
附件: 您所在的用户组无法下载或查看附件
http://www.qinday.com  承接高难度采集业务,数据专卖,模块制作,小站大站天下站,站站采集,小单大单长期单,单单承接! QQ:11281816 火车QQ交流群9482037

TOP

忘了上传规则.这些天痛的真有些神智不清了.
附件: 您所在的用户组无法下载或查看附件
http://www.qinday.com  承接高难度采集业务,数据专卖,模块制作,小站大站天下站,站站采集,小单大单长期单,单单承接! QQ:11281816 火车QQ交流群9482037

TOP

先做个记号。

TOP

多谢了,好人真多。我也要做好人

TOP

感谢采色。

TOP

发新话题
Powered by Discuz! 6.0.0  © 2001-2007 Comsenz Technology Ltd
Processed in 0.119399 second(s), 6 queries, Gzip enabled
当前时区 GMT+8, 现在时间是 2008-10-15 04:52 皖ICP备06000549 清除 Cookies - 联系我们 - 火车采集器官方站 - 静态归档