gunjack945 发表于 2008-12-24 14:57:47

没车厢了,求助一个采集不全的问题

表达能力有点差,举例说明:
采集
http://www.bbr.cn/fl/2008/12/06/1046962464.shtml

标签定义:
开始字符串
/* 200x200, 创建于 08-11-9 */

结束字符串
</div></div><div class="flxx_zwxx1">

内容排除一
google_ad_slot = "0590649405";
google_ad_width = 200;
google_ad_height = 200;
//-->
</script>
<script type="text/javascript"
src="http://pagead2.googlesyndication.com/pagead/show_ads.js">
</script></div>

内容排除二
<span style="DISPLAY: none">蚌埠人网站www.bbr.cn</span>



把里面所有图片都替换成文字了。采集出来的结果是↓
工面议&#xFF0E;

少了不少东西,到底是哪地方出现问题了。求解!谢谢

gunjack945 发表于 2008-12-24 15:03:53

求助呀,急等~~~

afanfan2007 发表于 2008-12-24 16:49:59

很明显你的开始字符 就不应该去那个,
排除也有问题..
问题多多 加群讨论

gunjack945 发表于 2008-12-29 08:51:12

自己解决了。谢谢楼上的哥们的热心
页: [1]
查看完整版本: 没车厢了,求助一个采集不全的问题