flyer2080 发表于 2016-1-5 13:42:36

求助,采集到的网址和看到的不一样

这个列表页
http://www.zww.cn/zw/sect2/jxw.asp?c2=-1&ct=%E5%B0%8F%E5%AD%A6
<tr><tdclass=ClsTextBG><div>· <a href='/zuowen/html/382/840725.htm' class='list' target=_blank>第一次打网球</a> <i>468字</i><script>try {drawMng(840725,3,'0','游客',2,'赵凯悦','',12);}catch(e){}</script> (赵凯悦点击-次 得0分)</div><div class=zwintro>虽然我打的还不够好,可毕竟是我第一次打网球呀,有这么多的进步,我知足了,如果要打的更好,就要多多练习哦!</div></td></tr>

采集到的网址是这一部分的{drawMng(840725,3,'0','游客',2,'赵凯悦','',12);}


html后面本来是382的,但是采到的是3


http://www.zww.cn/zuowen/html/3/840725.htm
这样的应该是怎么写规则呢

老雷 发表于 2016-1-5 14:47:38

What? 没看明白啥意思。您是想采集这个文章列表,是吗?

flyer2080 发表于 2016-1-5 15:01:28

是的,
规则写的也对,但是采集出来的内容页不对
页: [1]
查看完整版本: 求助,采集到的网址和看到的不一样