让火车功能更实用,采网址时加个模块判断。支持的顶哦!~
1。在采网址时加个判断,比如是精华贴才采集、是推荐贴才采集,标题包含“奥运”才采集。这样采回来的数据就不会是全部一样的,质量也高点。2。要采网址时加个来路设置,因为有的网站的列表页就只有一个地址,POST内部完成了,估计这个有点难,呵呵。
[ 本帖最后由 idtown888 于 2008-4-6 22:51 编辑 ] 这个比较难实现,估计目前是不会加的。 是的,通过程序自动识别比较难实现,目前是不会加的。
如果楼主有编程基础的话可以通过个人变通的去采集
第一点:使用的正则,匹配关键字采集.或者采集完毕后写程序进行数据过滤,或者使用单独的接口程序.
第二点:通过截取Cookie以及提交Post数据,可以分析出分页信息。 新版本会考虑加这个功能的~~~ 老大发话了..大家期待了 爪,以后学习下。。
页:
[1]