|
搞了好几天才发现,原来火车头不能采集分页形式为"下一页"的网站,NND,累死我了.
建议火车头把用"下一页"形式来获得文章列表页面的功能做好.
文章列表分页的代码是不规则的,只好用正则提取分页地址.
<div class="page">
文章列表分页:<a href="ahjdhxxx.html">下一页</a>
</div><!--}}}end:page -->
文章列表分页:<a href="xxahsdsdfxxx.html">下一页</a>
源地址
http://www.xxx.com/xasdfasdhsdsdfxxx.html
设置正则参数:
源代码开始:
<div class="page">
结束:
</div><!--}}}end:page -->
脚本规则:
<a href="[参数]">下一页
实际地址是:
http://www.xxx.com/[参数1]
为什么这样做无法提取分页地址呢???
[ 本帖最后由 cofcn 于 2008-2-26 14:27 编辑 ] |
|