火车采集器软件交流官方论坛's Archiver
论坛
›
采集器基础使用讨论区
› 超乱的标签怎么采?
干燥时间
发表于 2010-11-30 11:18:31
超乱的标签怎么采?
像taobao店、博客、QQ空间这种类型的站点,其用户可以自行编辑店里/空间里的html风格,也就是说,每个内容页的标签都不一样,太乱了,没有统一的标签结构。而且站点又不开rss、wap的话,还有可能采它吗?
rq204
发表于 2010-11-30 12:36:03
如果您担心在wap系统中显示有问题的话,您可以考虑保留部分必要的html标签,其它的全部过滤掉.
justinhotban
发表于 2010-12-2 10:53:55
基本都过滤了的啊所以不好采集
页:
[1]
查看完整版本:
超乱的标签怎么采?