火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 2320|回复: 1

这样的文章地址该如何采集呢?

[复制链接]
发表于 2008-9-4 10:46:11 | 显示全部楼层 |阅读模式
这样的文章地址该如何采集呢?

列表页面很正常就采集下来了,
可是,他的网站文章页面的url每个url后面都跟了一个随机数值,
像这样
http://127.0.0.1/show.php?id=1&articleid=3&url=aHR0cDovL3BsdXMuaGF
其中的  
url=aHR0cDovL3BsdXMuaGF
是随机数值
这个数值我试验了一下,好像随便填写一个就可以打开了,
即直接输入
http://127.0.0.1/show.php?id=1&articleid=3
http://127.0.0.1/show.php?id=1&articleid=3&url=random
..
都可以打开
但是由于他的随即数值是不断变化的,
往往还没有采集完一个列表,他的随机值就变化了,
这样就造成了重复采集,
请问该如何过滤掉  
&url=aHR0cDovL3BsdXMuaGF  
这个变量呢?
发表于 2008-9-4 11:53:18 | 显示全部楼层
用(*)替代aHR0cDovL3BsdXMuaGF
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2024-11-18 16:53

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表