火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 2880|回复: 4

请问如何才大量的规则网址,如:com/?id=10000至10000000

[复制链接]
发表于 2015-3-11 11:53:50 | 显示全部楼层 |阅读模式
请问如何才大量的规则网址?

如:
http://www.demotest.com/index.php?oid=10000
...
...
http://www.demotest.com/index.php?oid=10000000

我只需要采集页面里的固定内容(大部分页面里还没有内容是空的)。可以要采集的网址实在太多了,不想采集网址导致数据库超大,也不能几百天每天都要设定采集阶梯页面。

逻辑是:读取页面内容,判断采集内容是否为空,不为空就保存。这样数据库也就不会太大。

谢谢!
发表于 2015-3-11 13:35:02 | 显示全部楼层
一定要有网址库的。要不采不了内容的。
发表于 2015-3-11 13:37:03 | 显示全部楼层
大家来顶帖啊。。。
 楼主| 发表于 2015-3-12 12:19:35 | 显示全部楼层
303718 发表于 2015-3-11 13:35
一定要有网址库的。要不采不了内容的。

谢谢你的答复,我就放弃了。自己写php来完成这个任务吧。
发表于 2015-3-12 13:26:11 | 显示全部楼层
路过留脚印。。。
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2024-11-25 05:28

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表