火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 3803|回复: 5

获取文章列表页值(新浪读书为例)

[复制链接]
发表于 2013-3-10 13:16:23 | 显示全部楼层 |阅读模式
本帖最后由 fancyd 于 2013-3-10 13:18 编辑

火车头自动获取网址功能能很强大,我多数都会使用这个功能,但有时候我们需要同时取到列表页的值,这时候就得用手动获取网址的功能了,现在我用新浪读书来举例说明。

网址:http://book.sina.com.cn/news/list/58.shtml

我们发现列表里的标题是跟内容里的标题不同的,我这时候需要列表的标题。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?加入会员

x
 楼主| 发表于 2013-3-10 13:19:59 | 显示全部楼层
我们在列表页查看源代码,找到这段
{"title":"奥巴马如何重建美国文化领导权","url":"http://blog.sina.com.cn/s/blog_6395e8020101d0mz.html?
复制

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?加入会员

x
 楼主| 发表于 2013-3-10 13:23:57 | 显示全部楼层
fancyd 发表于 2013-3-10 13:19
我们在列表页查看源代码,找到这段
{"title":"奥巴马如何重建美国文化领导权","url":"http://blog.sina.co ...

打开火车头,新建任务,贴上网址,添加多级网址,网址获取方式选择手动,把上面复制的代码粘贴到“脚本规则”,把我们需要的列表页的值改写成[标签:biaoti],名字自己定义一个喜欢的就行。
【参数】就是我们需要的下一级的网址, [标签:biaoti]就是我们需要的列表页的值。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?加入会员

x
 楼主| 发表于 2013-3-10 13:27:10 | 显示全部楼层
本帖最后由 fancyd 于 2013-3-10 13:30 编辑
fancyd 发表于 2013-3-10 13:23
打开火车头,新建任务,贴上网址,添加多级网址,网址获取方式选择手动,把上面复制的代码粘贴到“脚本规 ...


保存规则,回到网址采集界面,点击测试网址,然后就可以看到我们列表页的值了,这就证明获取列表页值成功,然后再去标签页定义你想要的内容,这样我们既取得了列表页的标题,也同时取出了最后我们需要的内容。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?加入会员

x
 楼主| 发表于 2013-3-10 13:40:25 | 显示全部楼层
希望这个小小的教程能对大家有帮助,谢谢
感谢小芳大神的幕后指导
发表于 2013-3-11 09:09:14 | 显示全部楼层
{:soso_e142:} 写的非常清楚 呢 非常感谢 ~~~~~~~~~
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2024-11-22 10:57

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表