mykk123 发表于 2011-12-30 16:00:31

关于"火车采集器V2010SP3免费版"采集时候如何保留原采集id到数据库???

本帖最后由 mykk123 于 2011-12-30 16:01 编辑

先写下使用感想

下午 试了下"火车采集器V2010SP3免费版" ,感觉软件写的非常不错,试了下采集数据很快,可以批量设置采集地址 这个我喜欢 ,因为有时候采集的地方多,又可以分任务,很好!
同时针对cookie可欺骗采集很实用!
可能开始刚用对火车头的正则表达式规则还不清楚(呵呵帮助其实没怎么看),有空研究下,毕竟用正则表达式才准确抓取.

现在遇到一个使用的实际问题,用火车头没法解决!!!
就是如何在采集到的数据保存的access的同时如何把取得被抓取页面的id,现在是数据库中会自动记录被采集文件的地址链接,可以在编辑数据库时候对改地址链接进行处理得到id,但是麻烦一点.
我想问的是,如何在采集数据库的同时 可以得到被抓取的页面地址 直接进行处理在保存到数据库????????

呵呵 罗嗦一堆 ,那位高人知道 帮指点一下

mykk123 发表于 2011-12-30 16:50:24

对了还有个问题 免费版会链接 61.191.55.91 ip,好像是locoy.com的服务器ip,不知道是在发送什么数据或者是接收什么数据?

leejunji 发表于 2011-12-30 17:15:20

如何在采集数据库的同时 可以得到被抓取的页面地址 直接进行处理在保存到数据库????????
你说的这个页面地址是不是这个呢 采集器的【采集页地址】这个标签呢

leejunji 发表于 2011-12-30 17:16:45

mykk123 发表于 2011-12-30 16:50 static/image/common/back.gif
对了还有个问题 免费版会链接 61.191.55.91 ip,好像是locoy.com的服务器ip,不知道是在发送什么数据或者是接 ...

【采集页地址】这个标签吗 是这个吗
页: [1]
查看完整版本: 关于"火车采集器V2010SP3免费版"采集时候如何保留原采集id到数据库???