关于"火车采集器V2010SP3免费版"采集时候如何保留原采集id到数据库???
本帖最后由 mykk123 于 2011-12-30 16:01 编辑先写下使用感想
下午 试了下"火车采集器V2010SP3免费版" ,感觉软件写的非常不错,试了下采集数据很快,可以批量设置采集地址 这个我喜欢 ,因为有时候采集的地方多,又可以分任务,很好!
同时针对cookie可欺骗采集很实用!
可能开始刚用对火车头的正则表达式规则还不清楚(呵呵帮助其实没怎么看),有空研究下,毕竟用正则表达式才准确抓取.
现在遇到一个使用的实际问题,用火车头没法解决!!!
就是如何在采集到的数据保存的access的同时如何把取得被抓取页面的id,现在是数据库中会自动记录被采集文件的地址链接,可以在编辑数据库时候对改地址链接进行处理得到id,但是麻烦一点.
我想问的是,如何在采集数据库的同时 可以得到被抓取的页面地址 直接进行处理在保存到数据库????????
呵呵 罗嗦一堆 ,那位高人知道 帮指点一下
对了还有个问题 免费版会链接 61.191.55.91 ip,好像是locoy.com的服务器ip,不知道是在发送什么数据或者是接收什么数据? 如何在采集数据库的同时 可以得到被抓取的页面地址 直接进行处理在保存到数据库????????
你说的这个页面地址是不是这个呢 采集器的【采集页地址】这个标签呢
mykk123 发表于 2011-12-30 16:50 static/image/common/back.gif
对了还有个问题 免费版会链接 61.191.55.91 ip,好像是locoy.com的服务器ip,不知道是在发送什么数据或者是接 ...
【采集页地址】这个标签吗 是这个吗
页:
[1]