求助,采集到的网址和看到的不一样
这个列表页http://www.zww.cn/zw/sect2/jxw.asp?c2=-1&ct=%E5%B0%8F%E5%AD%A6
<tr><tdclass=ClsTextBG><div>· <a href='/zuowen/html/382/840725.htm' class='list' target=_blank>第一次打网球</a> <i>468字</i><script>try {drawMng(840725,3,'0','游客',2,'赵凯悦','',12);}catch(e){}</script> (赵凯悦点击-次 得0分)</div><div class=zwintro>虽然我打的还不够好,可毕竟是我第一次打网球呀,有这么多的进步,我知足了,如果要打的更好,就要多多练习哦!</div></td></tr>
采集到的网址是这一部分的{drawMng(840725,3,'0','游客',2,'赵凯悦','',12);}
html后面本来是382的,但是采到的是3
http://www.zww.cn/zuowen/html/3/840725.htm
这样的应该是怎么写规则呢
What? 没看明白啥意思。您是想采集这个文章列表,是吗? 是的,
规则写的也对,但是采集出来的内容页不对
页:
[1]