发新话题
打印

采集回帖方面

采集回帖方面

首先我们要采集的回帖都是基本上要有实际内容的回帖,通常是采集内容字数较多的,要么就是只需要采集楼主一个人的回帖,因为这个帖子有可能都是楼主发的教程之类,中间会有其他人的评论,通常这些没有意义的评论的字数都是很少,所以,如果能在采集的时候判断多少字以下的回帖不进行采集,给过滤掉;另外如果能设置只采集楼主的帖子及回复,而不采集其他人的回复,那样就更完美了

TOP

希望能通过关键字选择性的采集回帖

TOP

关注~~~~~~~~~~~~~

TOP

那如果他人的回答也是比较好的呢?当然也要采的。要根据内容好差采估计难度加大

TOP

这样需要添加些判断语句,估计比较麻烦,关键是如何对不需要的内容进行过滤?

TOP

程序调试方面没有什么经验,莫见笑!

TOP

发新话题
Powered by Discuz! 6.0.0  © 2001-2007 Comsenz Technology Ltd
Processed in 0.180853 second(s), 6 queries, Gzip enabled
当前时区 GMT+8, 现在时间是 2008-11-23 04:00 皖ICP备06000549 清除 Cookies - 联系我们 - 火车采集器官方站 - 静态归档