用火车头采集器采不到内容
我要下载的内容是搜狐奥运频道的奥运滚动新闻,其中一篇文章(图文:阿根廷圣火传递即将开始 老外舞龙)的代码如下:<h1>图文:阿根廷圣火传递即将开始 老外舞龙</h1>
<div class="article_info">
<div class="date">
<span class="c">2008年04月11日23:45</span>[<a href="http://comment2.news.sohu.com/viewcomments.action?id=256243757" target="_blank" class="blue1">我来说两句</a><font class="red"><span id="commentCount"></span></font>] [字号:<a href="javascript:doZoom(16)" class="blue1">大</a> <a href="javascript:doZoom(14)" class="blue1">中</a> <a href="javascript:doZoom(12)" class="blue1">小</a>]
</div>
<div class="source">
<div class="left pic">
</div>
<div class="left text">
来源:第29届奥林匹克运动会官方网站
作者:摄/王飞
</div>
</div>
<div class="ad_h_25"></div>
<div class="clear"> </div>
</div>
<div class="article" id="sohu_content">
<p><P> 北京奥运官网布宜诺斯艾利斯4月11日电 北京奥运圣火10日抵达阿根廷首都布宜诺斯艾利斯,11日在这座南美名城进行传递。预计有80名火炬手将参加在布宜诺斯艾利斯举行的火炬传递,其中包括阿根廷体坛的诸多名人。布宜诺斯艾利斯这座美丽的城市也有着南美巴黎的美誉。名人和名胜都为此次火炬传递增设了不少亮点。图为布宜诺斯艾利斯火炬传递起跑仪式现场准备现场(奥运官网报道团记者 王飞 发于布宜诺斯艾利斯)</P>
<TABLE cellSpacing=0 cellPadding=0 align=center border=0>
<TBODY>
<TR>
<TD align=middle><table cellspacing=0 cellpadding=0 border=0><tr><td><IMG alt=老外舞龙 src="http://photocdn.sohu.com/20080411/Img256243758.JPG" align=middle></td></tr></table></TD></TR>
<TR>
<TD style="FONT-SIZE: 12px" align=middle scw_ig="yes">老外舞龙</TD></TR></TBODY></TABLE>
<P> </P>
<TABLE cellSpacing=0 cellPadding=0 align=center border=0>
<TBODY>
<TR>
<TD align=middle><table cellspacing=0 cellpadding=0 border=0><tr><td><IMG alt=外国人舞中国龙 src="http://photocdn.sohu.com/20080411/Img256243778.JPG" align=middle></td></tr></table></TD></TR>
<TR>
<TD style="FONT-SIZE: 12px" align=middle scw_ig="yes">外国人舞中国龙</TD></TR></TBODY></TABLE><BR>
<P><BR></P>
<P> </P><table border=0 cellspacing=0 cellpadding=0align="left"> <tr><td valign=top>
</td></tr> <tr><td> </td></tr></table></p>
<div class="editUsr" align="right">(责任编辑:pengren)</div>
<div class="newsComment">[<a href="http://comment2.news.sohu.com/viewcomments.action?id=256243757" target="_blank">我来说两句</a><span id="commentAllCountin"></span>]</div>
</div>
<!--相关区 st-->
<div class="mutualityNEW">
<div class="mu_news">
<h2>相关新闻</h2>
我想用火车头采集这篇文章的内容,可试了很多起始标签和结束标签都没办法得到内容,内容显示为空白,我设的内容起始标签是<div class="article" id="sohu_content">结束标签是:</div><div class=,请问我这样设置正确吗?为什么得不到内容呢?
[ 本帖最后由 小孩子 于 2008-4-12 15:05 编辑 ] <div class="article" id="sohu_content">
<div class="editUsr" align="right">
[ 本帖最后由 fireye 于 2008-4-12 00:59 编辑 ] 我没有车厢,不知道怎么得,我也是新手,想借此地问个问题对不起楼主了,为什么我会发布的东西会发两遍?
页:
[1]