luck2009year 发表于 2011-8-16 11:07:08

来晚了,采集标签可以支持顺序提取,标签能按顺序输出0,1,2,3。。。n.

luck2009year 发表于 2011-8-16 11:09:39

发布的文章页网址和标题能收集起来,方便插入文章页做连接,建议看虫虫的一些功能,整合下,火车头是最万能的。

28xl 发表于 2011-8-26 03:42:53

在内容标签那加上一个该内容采集结果要大于多少字节,
现在有时源站问题或规则原因仅采集几个字或几个<br><p>

tj_iceman2008 发表于 2011-8-26 09:11:56

强烈建议:采集支持使用动态cookie的网站!

tj_iceman2008 发表于 2011-8-26 13:55:16

回复 7# 孤魂

tj_iceman2008 发表于 2011-8-26 13:56:12

回复 7# 孤魂

tj_iceman2008 发表于 2011-8-26 13:56:54

强烈建议支持动态cookie。
数字校园里的文章,通过统一身份认证单点登录后显示文章列表页,登录的时候是用的动态cookies,用火车获取的cookie有两部分,JSESSIONID=随机值;JSESSIONIDSSO=随机值,每次登录都不一样。有时间限制,在限制时间内能采集成功,失效后就无法采集了,必须重新获取cookie值,才能再采集,挺麻烦,不知这个有没有好的解决办法呢!!!

luck2009year 发表于 2011-9-1 09:45:33

强烈建议可以自由控制标题和内容的采集字数,早点出来,期待

active 发表于 2011-9-27 23:37:20

希望火车能增加更强大的功能吧,身边不少搞采集的都跑到隔壁那两家去了,郁闷

ffzzhuaer 发表于 2011-10-14 22:57:57

学习,,了解下!!!!
页: 1 2 3 4 5 [6] 7
查看完整版本: 火车采集器2011版功能建议帖