buyetian 发表于 2009-10-27 19:17:26

这个网站内容怎么采集啊

http://www.kuqin.com/shuoit/20091025/71792.html

采集内容不成功啊,在内容开头或结束填了代码,采集的内容是空白的。

zjyk1984 发表于 2009-10-27 19:32:01

这个网站采集很简单啊,
开头:<div class=content>
结束:<script type="text/javascript"><!--
google_ad_client = "pub-9317413389774415";
/* 底部广告336x280, 创建于 08-7-23 */
google_ad_slot = "9618407928";
google_ad_width = 336;
google_ad_height = 280;
//-->
</script>
<script type="text/javascript"
src="http://pagead2.googlesyndication.com/pagead/show_ads.js">
</script>

buyetian 发表于 2009-11-1 22:38:16

还是没采到内容。

啤酒盖子 发表于 2009-11-1 23:27:03

这个太简单了
开始:
<div class=content>
<div class=tbody>
<div style="float:right">

结束:
</div>
</div>
</div>

过滤掉不想要的,这个,简单过头了

buyetian 发表于 2009-11-2 01:03:37

四楼的方法不错,可惜连他的googleadsense也采啦。

我按2楼的方法又折腾了一下,开头动了一下,成功了,谢谢各位

开头:</center><br />
</div>
结束:<script type="text/javascript"><!--
google_ad_client = "pub-9317413389774415";
/* 底部广告336x280, 创建于 08-7-23 */
google_ad_slot = "9618407928";
google_ad_width = 336;
google_ad_height = 280;
//-->
</script>
<script type="text/javascript"
src="http://pagead2.googlesyndication.com/pagead/show_ads.js">
</script>
页: [1]
查看完整版本: 这个网站内容怎么采集啊