luino 发表于 2010-1-15 18:52:21

谁帮我看看,这是那里出错了

在测试采集 http://fushi.27.cn/c/200910/23/1256263500_83987400.html 这个网页的时候

内容页    开始字串 <div class="inle-cont" id="icontent">      结束字串</div>


内容排除:
         <p(*)相关推荐(*)</p>
             <p class=(*)><a(*)html(*)</a></p>
   
            <p class=(*)><a(*)html(*)</a></p> 这个排除出现问题加上这个排除项目的话


       <p>  90后绝对是一个非常热门的词,关于80后的谈论似乎已经逐渐淡出,90后横空出世,他们以强劲的实力和足够多的话题抢占了大片市场,吸引着观众的注意,特别是欧美明星,真是出名要趁早,他们的话题天天新,无论是电影领域还是品味都能征服观众挑剔的眼光,他们稚嫩年轻但名利双收,涉世未深但品味非凡,并成为新一代的时尚领导人,下面一起来看看当红的90后女性的时尚穿着,走进他们的华丽世界。</p> 这部分就莫名奇妙的被排除掉了


谁知道是为什么啊

xinzhi9090 发表于 2010-1-17 10:03:36

应该是排除写错了,这样<p class=(*)>(*)</p>,你就可以得到内容了

luino 发表于 2010-1-23 11:51:06

谢了,朋友。。。。
页: [1]
查看完整版本: 谁帮我看看,这是那里出错了