netdream 发表于 2006-6-21 18:41:20

建议

建议在采集 网址链接地址 那里增加 网址替换功能

火车头 发表于 2006-6-21 21:41:19

netdream能不能把具体思路说清楚下

netdream 发表于 2006-6-25 22:19:19

比如:有的带汉字的网址要换成代码才能采到内容页,还有采无图版时网址中会多出一个目录地址,这些时候就特别需要网址的 批量替换功能.
哟,我试了下可以直接在地址文件里替换的

dr5d 发表于 2006-6-30 13:38:33

同意。现在也遇到有这样的问题。

在列表中,可能得到的地址内容分别是:123, 456,56等几个,但实际上对应的链接应该是:
http://xxx/123.html
http://xxx/456.html
http://xxx/56.html

即,需要一个链接构造功能,我以前好像和火车头说过。

dr5d 发表于 2006-6-30 13:39:48

即:自动生成链接 功能

largecat 发表于 2006-7-5 14:46:09

采集复杂地址时,我都是把错的地址导出来,在用软件编辑好了,导入到火车程序里去采集。

在实际采集中会碰到很多种地址错误形式。有的只能根据函数采集到数据的ID数,所以我一般软件批量修改。

目前如此。
不过替换功能的确能省心不少。

insun 发表于 2006-7-11 00:47:07

我遇到最多的是中文网址的问题,这个功能确实需要
页: [1]
查看完整版本: 建议