获取文章列表页值（新浪读书为例）

fancyd 发表于 2013-3-10 13:16:23

本帖最后由 fancyd 于 2013-3-10 13:18 编辑

火车头自动获取网址功能能很强大，我多数都会使用这个功能，但有时候我们需要同时取到列表页的值，这时候就得用手动获取网址的功能了，现在我用新浪读书来举例说明。

网址：http://book.sina.com.cn/news/list/58.shtml

我们发现列表里的标题是跟内容里的标题不同的，我这时候需要列表的标题。

fancyd 发表于 2013-3-10 13:19:59

我们在列表页查看源代码，找到这段
{"title":"奥巴马如何重建美国文化领导权","url":"http://blog.sina.com.cn/s/blog_6395e8020101d0mz.html?
复制

fancyd 发表于 2013-3-10 13:23:57

fancyd 发表于 2013-3-10 13:19 static/image/common/back.gif
我们在列表页查看源代码，找到这段
{"title":"奥巴马如何重建美国文化领导权","url":"http://blog.sina.co ...

打开火车头，新建任务，贴上网址，添加多级网址，网址获取方式选择手动，把上面复制的代码粘贴到“脚本规则”，把我们需要的列表页的值改写成[标签:biaoti]，名字自己定义一个喜欢的就行。
【参数】就是我们需要的下一级的网址， [标签:biaoti]就是我们需要的列表页的值。

fancyd 发表于 2013-3-10 13:27:10

本帖最后由 fancyd 于 2013-3-10 13:30 编辑

fancyd 发表于 2013-3-10 13:23 static/image/common/back.gif
打开火车头，新建任务，贴上网址，添加多级网址，网址获取方式选择手动，把上面复制的代码粘贴到“脚本规 ...

保存规则，回到网址采集界面，点击测试网址，然后就可以看到我们列表页的值了，这就证明获取列表页值成功，然后再去标签页定义你想要的内容，这样我们既取得了列表页的标题，也同时取出了最后我们需要的内容。

fancyd 发表于 2013-3-10 13:40:25

希望这个小小的教程能对大家有帮助，谢谢
感谢小芳大神的幕后指导

leejunji 发表于 2013-3-11 09:09:14

{:soso_e142:} 写的非常清楚呢非常感谢 ~~~~~~~~~

页: [1]

火车采集器软件交流官方论坛's Archiver

获取文章列表页值（新浪读书为例）