遇到FONT-FAMILY: \'Arial\' \'Times New Roman\之类的代码,就无法采集
碰到类似FONT-FAMILY: \'Arial\'\'Times New Roman\之类的代码,接下去的内容就无法采集,只能采集到这些类似的代码之前的内容。不知道是什么原因。 规则有问题吧. 同样的规则采集同个网站下的内容没问题啊。就是有些网页的样式比较特色,采集到\'Times New Roman\ 这样的下面的就采不到了,不知道为什么。 遇到同样问题,好象是只要有' ,后面就不行.过滤'也过滤不掉
页:
[1]