idtown888 发表于 2008-4-6 22:49:06

让火车功能更实用,采网址时加个模块判断。支持的顶哦!~

1。在采网址时加个判断,比如是精华贴才采集、是推荐贴才采集,标题包含“奥运”才采集。这样采回来的数据就不会是全部一样的,质量也高点。

2。要采网址时加个来路设置,因为有的网站的列表页就只有一个地址,POST内部完成了,估计这个有点难,呵呵。

[ 本帖最后由 idtown888 于 2008-4-6 22:51 编辑 ]

飛越無限 发表于 2008-4-6 23:14:56

这个比较难实现,估计目前是不会加的。

沦陷今生 发表于 2008-4-6 23:21:11

是的,通过程序自动识别比较难实现,目前是不会加的。

如果楼主有编程基础的话可以通过个人变通的去采集

第一点:使用的正则,匹配关键字采集.或者采集完毕后写程序进行数据过滤,或者使用单独的接口程序.
第二点:通过截取Cookie以及提交Post数据,可以分析出分页信息。

c868 发表于 2008-4-7 00:23:35

火车头 发表于 2008-4-7 01:12:05

新版本会考虑加这个功能的~~~

沦陷今生 发表于 2008-4-7 01:31:21

老大发话了..大家期待了

lbjyuer 发表于 2016-2-10 08:17:40

爪,以后学习下。。
页: [1]
查看完整版本: 让火车功能更实用,采网址时加个模块判断。支持的顶哦!~