fyouck 发表于 2007-2-7 15:18:30

我在文章列表页面获得的文章内容页面地址能不能替换一下再进行下一步采集

我在文章列表页面获得的文章内容页面地址能不能替换一下再进行下一步采集

因为文章页面地址有时候会根据文章的状态而自动跳转到不同的页面,导致有些页面采集不到我想要的东西,我想让这些在列表页获得的文章页地址都进行一定规律的替换,这样即使文章的状态如何,我都能够通过替换后在我指定的地址内获得我需要的数据,请问火车头有没有这样的功能?

fyouck 发表于 2007-2-7 15:20:10

在线等结果。。。

在线等结果。。。

amd5452 发表于 2007-2-8 01:57:27

文章列表 页面 替换不了什么
根据内容自动跳转?   再详细点

fyouck 发表于 2007-2-8 12:10:42

文章列表页面采集回来的页面地址需要替换一下

因为采集回来的页面地址,有时候会根据文章的状态跳转一下,所以我希望讲采集回来的地址做一下有规则的替换,变成我想要的那种地址。

rq204 发表于 2007-2-8 15:15:03

那应该不是很难,只要能采到的里面有你要的东西,其它的只是后续工作了,你可以贴一下网址,大家都来试试。

fyouck 发表于 2007-2-9 18:12:07

现在我就是要分两步来,先导出采集的链接,然后进excel里批量修改链接,然后新建一个站点和任务,把采集来的链接导入,再来采集。。。。

可以还是可以的,美中不足啦。。。凭火车开发者的功力,我想实现这个功能是很容易的事情。
页: [1]
查看完整版本: 我在文章列表页面获得的文章内容页面地址能不能替换一下再进行下一步采集