火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 4374|回复: 9

没见过这么无耻的网站,URL ID 竟然这么长找不到规则,怎么办?标题好长好长

[复制链接]
发表于 2009-11-21 09:43:37 | 显示全部楼层 |阅读模式
http://www.fjax.gov.cn/news/newslist.aspx?articletypeid=%7b6609C1BC-FCE2-4B8C-A812-8215BD8ED061%7d

看看上面这个URL  如何采集啊。。。哭啊。

http://www.fjax.gov.cn/news/newslist.aspx?articletypeid={AF1DBBE9-EBC7-47E0-8047-91572A5B7E57}
全部都是这样的。。。。要怎么编写规则呢??还有一个更变态的,文章页面也全是不规则的。。。搞不定。。
发表于 2009-11-21 09:58:31 | 显示全部楼层
的确够变态的,好像参数都传递到服务器端处理了
发表于 2009-11-21 10:25:33 | 显示全部楼层
这种很简单啊,是你搞错了吧
发表于 2009-11-21 10:56:35 | 显示全部楼层
这种站都拿不下来 ?
发表于 2009-11-21 12:04:00 | 显示全部楼层
的确很难。我承认。有搞的出来的讲一下吧
发表于 2009-11-27 07:55:57 | 显示全部楼层
呵呵 偷人家东西偷不着就说人家无耻?
发表于 2009-11-27 08:59:19 | 显示全部楼层
本帖最后由 闲鸟归来 于 2009-11-27 09:04 编辑

无语!
发表于 2009-11-27 10:34:03 | 显示全部楼层
这个是GUID码编排方式,对于这种无规律的URL采集,需要对每个母页面做文章即可.不难,只是你可能没试过这种方法.
发表于 2009-12-9 20:40:15 | 显示全部楼层
呵 楼主言语不对....
发表于 2009-12-9 21:27:46 | 显示全部楼层
我估计是链接数据库的物理地址,读物理地址比读ID快多了
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2024-11-19 02:35

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表