发新话题
打印

[3.2版] 火车不能过滤<table>和</table>之间的大量内容

火车不能过滤<table>和</table>之间的大量内容

比如这个网址http://zone.it.sohu.com/forums/thread-992390-1-1.html

没办法过滤<table cellspacing="0" class="t_table" style="width:90%">到</td></tr></table></div>这一大段的表格和之间内容。

试了很多,遇到这种情况的都没法过滤的???

请问大家,究竟该怎么过滤这种情况的表格和里面的内容啊?

TOP

为什么不能过滤呢

TOP

你们试验过了吗?想完美采集下那个页面,似乎不可能啊

TOP

用通配符什么都能过滤啊...

TOP

不行,我选择了过滤表格,但是这个表格包含的内容没办法过滤

TOP

那你就过滤 <table(*)</table>

TOP

引用:
原帖由 sushy 于 2008-7-21 20:44 发表
那你就过滤  
完全没用的。。。。。

TOP

发新话题
Powered by Discuz! 6.0.0  © 2001-2007 Comsenz Technology Ltd
Processed in 0.182431 second(s), 6 queries, Gzip enabled
当前时区 GMT+8, 现在时间是 2008-12-2 01:23 皖ICP备06000549 清除 Cookies - 联系我们 - 火车采集器官方站 - 静态归档