|
本帖最后由 mykk123 于 2011-12-30 16:01 编辑
先写下使用感想
下午 试了下"火车采集器V2010SP3免费版" ,感觉软件写的非常不错,试了下采集数据很快,可以批量设置采集地址 这个我喜欢 ,因为有时候采集的地方多,又可以分任务,很好!
同时针对cookie可欺骗采集很实用!
可能开始刚用对火车头的正则表达式规则还不清楚(呵呵帮助其实没怎么看),有空研究下,毕竟用正则表达式才准确抓取.
现在遇到一个使用的实际问题,用火车头没法解决!!!
就是如何在采集到的数据保存的access的同时如何把取得被抓取页面的id,现在是数据库中会自动记录被采集文件的地址链接,可以在编辑数据库时候对改地址链接进行处理得到id,但是麻烦一点.
我想问的是,如何在采集数据库的同时 可以得到被抓取的页面地址 直接进行处理在保存到数据库????????
呵呵 罗嗦一堆 ,那位高人知道 帮指点一下
|
|