BMB悬赏定制论坛信息采集规则
基本需求如下:目标网站1. 绿野http://bbs.lvye.cn/forum-2934-1.html2. 手电http://www.shoudian.org/ (需要登录采集)
采集内容1. 帖子标题2. 帖子正文(包括图片)3. 采集同个帖子的多个楼层主贴(一篇帖子分多个楼层发布,例如http://bbs.lvye.cn/thread-2353092-1-3.html)4. 帖子作者5. 发布时间
注意:http://www.shoudian.org/ 的图片不登录是看不到大图的,采集的数据发布到自己网站上没法显示图片,这个问题能否解决?
我现在遇到的问题是,用其他程序采集下来的帖子内容是html代码,直接以代码形式发布到论坛或者网站上之后,显示异常。
将这些html代码用程序转成ubb代码之后,又会丢失内容。不知道用火车能否解决。
发布操作可以在http://www.shoudian.org/测试,跟我自己网站发布效果一样的,预览一下即可,不用真实发布
发布内容:将采集的内容,发布到自己网站上(这个需求具体谈)发布操作可以在http://www.shoudian.org/测试,跟我自己网站发布效果一样的,预览一下即可,不用真实发布
请有时间的大侠们帮帮忙,能做的请联系我,酬金好说。
我的联系方式:qq22576085
需要登录的可以采集定做插件的方式来解决
页:
[1]