谁帮我看看,这是那里出错了
在测试采集 http://fushi.27.cn/c/200910/23/1256263500_83987400.html 这个网页的时候内容页 开始字串 <div class="inle-cont" id="icontent"> 结束字串</div>
内容排除:
<p(*)相关推荐(*)</p>
<p class=(*)><a(*)html(*)</a></p>
<p class=(*)><a(*)html(*)</a></p> 这个排除出现问题加上这个排除项目的话
<p> 90后绝对是一个非常热门的词,关于80后的谈论似乎已经逐渐淡出,90后横空出世,他们以强劲的实力和足够多的话题抢占了大片市场,吸引着观众的注意,特别是欧美明星,真是出名要趁早,他们的话题天天新,无论是电影领域还是品味都能征服观众挑剔的眼光,他们稚嫩年轻但名利双收,涉世未深但品味非凡,并成为新一代的时尚领导人,下面一起来看看当红的90后女性的时尚穿着,走进他们的华丽世界。</p> 这部分就莫名奇妙的被排除掉了
谁知道是为什么啊 应该是排除写错了,这样<p class=(*)>(*)</p>,你就可以得到内容了 谢了,朋友。。。。
页:
[1]