干燥时间 发表于 2010-11-30 11:18:31

超乱的标签怎么采?

像taobao店、博客、QQ空间这种类型的站点,其用户可以自行编辑店里/空间里的html风格,也就是说,每个内容页的标签都不一样,太乱了,没有统一的标签结构。而且站点又不开rss、wap的话,还有可能采它吗?

rq204 发表于 2010-11-30 12:36:03

如果您担心在wap系统中显示有问题的话,您可以考虑保留部分必要的html标签,其它的全部过滤掉.

justinhotban 发表于 2010-12-2 10:53:55

基本都过滤了的啊所以不好采集
页: [1]
查看完整版本: 超乱的标签怎么采?