火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 5460|回复: 2

悬赏:抓取天涯易读网内容,规则给力,价钱更给力

[复制链接]
发表于 2011-11-1 20:14:04 | 显示全部楼层 |阅读模式
1火车车厢
要求:
    抓取天涯易读网版块内容,比如莲蓬鬼话版块:http://tianyayidu.com/channel.php?

aid=23,要求抓取鬼话版块的前20页文章列表中每篇文章的内容,比如

http://tianyayidu.com/article-a-468531.html这个帖子。它有96个分页,但是最后一个分页

的内容可能不完整,下次更新时会继续在最后一个分页插入内容。


注意:由于文章是每天更新的,要求能够识别已经抓取过的内容,抓取过的帖子如有更新,则

将更新抓取下来。

自己想过的一些思路:自己写一个抓取网址的插件,采集每个帖子的分页网址,比如一个帖子

有19个分页,则只采集前18个分页地址,然后根据采集到的网址进行内容采集。各位大侠如有

其它解决办法更好。


价格我也不知道给多少合适,只要规则能够满足要求,可以商议。联系方式:1632863520

发表于 2012-2-25 20:42:36 | 显示全部楼层
我帮您,QQ:972130397
发表于 2012-3-10 11:26:04 | 显示全部楼层
有空 聊聊 1121210525
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2024-11-23 15:37

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表