火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 2341|回复: 4

求助@求助@求助@

[复制链接]
发表于 2008-10-3 14:45:55 | 显示全部楼层 |阅读模式
我要采[标题].[时间].[作者]和[其它]四个标签作为一条记录发布到我的网站上~
默认页是~~
www.***.com/a/999999/   这个页有标题.时间.作者.还有个列表
列表在默认页的代码里这样的:
"/a/999999/1"  第一章
"/a/999999/2"  第二章  
........
"/a/999999/N"  第N章
而[其它]标签的真实地址就在这个列表的地址页代码里面~~

我现在的问题是[其它]标签应该=第一章的真实地址+@第二章的真实地址+@第N章的真实地址
可是[其它]标签我用多页采..就只能采到第一个地址的真实地址..其它的地址他都不采...

多页用的正则:
/a/[参数]/[参数]             组合结果:       [url=http://www.***.com/a/[参数1]/]www.***.com/a/[参数1]/[/url][参数2]/   
测试结果也是对的..只是只有第一条..

我用的是2008免费版的..我看了论坛..好像说免费版的多页不能循环~~不知道是不是这个问题~~

如果真是这样还有没有其它的方法能采这样的网?


最后感谢下火车头免费给我们提供这么好的软件~~~感谢!!感谢~~~

发表于 2008-10-3 14:54:37 | 显示全部楼层
首先,你要搞清楚一点,要分清楚采集的目标站和发布的目标站规则不同。

也就是说,采集的目标站是  /a/999999/1 这样的形式,但是发布的时候,是否也是这样的形式,需要看你的发布网站的网站程序 静态化功能 是否支持。

也就是说,我们用火车采集器提交和人工从后台提交是一样的。当火车采集器提交一条数据的时候,和人工从后台提交一条数据是一样的。

如果你人工提交一条数据,网站能生成  /a/999999/1, /a/999999/2……,那么火车采集器也是一样。

火车不过代替了手工操作。

举例来说:

如果你手工提交一个content 为

11111
222222

的数据,你的发布目标站能把他拆成2个页面,
一个是/a/999999/1,内容是 11111
另一个是 /a/999999/2 ,内容是 222222

那么火车也可以做这个工作。否则的话,火车也没办法。

评分

1

查看全部评分

 楼主| 发表于 2008-10-3 15:41:43 | 显示全部楼层
原帖由 sushy 于 2008-10-3 14:54 发表
首先,你要搞清楚一点,要分清楚采集的目标站和发布的目标站规则不同。

也就是说,采集的目标站是  /a/999999/1 这样的形式,但是发布的时候,是否也是这样的形式,需要看你的发布网站的网站程序 静态化功能 是否 ...



可能我的意思没表达清楚~~

我的采集的目标站是  /a/999999/里的部分内容+/a/999999/N/里面的部队内容

发布的时候  /a/999999/里的部分内容+/a/999999/N/里面的部队内容  作为一条记录发布~~

现在的问题就是N并不是只有一页~~而是有多页~~~(N的形式:1.2.3...N)

但设置多页采集的话只能采到  /a/999999/1/ 的内容~就是第一条的内容~~其它的就采不到了
发表于 2008-10-3 16:21:14 | 显示全部楼层
手动采集嘛

去掉参数1 ,只保留参数2 部分

最后页面 /../[参数2]

也就是说,不写绝对地址,只写相对地址,你试试,由于你没给目标站,所以请自行测试。
发表于 2008-10-3 16:25:41 | 显示全部楼层
最好能贴代码,或者贴网址,没有人会对你采集的目标站感兴趣的。不放心的话,可以找一个放心的人,PM一下他网址。
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2026-4-22 18:46

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表