无法采集这个站..那位帮忙一下..
我想采集这个站..http://games.52pk.com/sh/sh_wz/list_261_80.html.....测试就出现这样..那位愿意帮我一下.谢谢[ 本帖最后由 卖身葬二奶 于 2007-12-6 16:15 编辑 ] :ali10ls 用自定义连接.别让火车自己认.
<a href=' http://games.52pk.com/sh/sh_wz/20060807/74724.html' target=
源码里在http://前多了一个空格.所以火车把这个地址认成了相对地址.自动补了地址.
从这个现象来看.火车对相对地址和绝对地址的判断应该是对A标签里的href="后前四个字如果不是http就判断为相对地址. 感谢楼主... ???楼上的,最后问题解决了吗????
页:
[1]