采集回帖方面
首先我们要采集的回帖都是基本上要有实际内容的回帖,通常是采集内容字数较多的,要么就是只需要采集楼主一个人的回帖,因为这个帖子有可能都是楼主发的教程之类,中间会有其他人的评论,通常这些没有意义的评论的字数都是很少,所以,如果能在采集的时候判断多少字以下的回帖不进行采集,给过滤掉;另外如果能设置只采集楼主的帖子及回复,而不采集其他人的回复,那样就更完美了 希望能通过关键字选择性的采集回帖 关注~~~~~~~~~~~~~ 那如果他人的回答也是比较好的呢?当然也要采的。要根据内容好差采估计难度加大 这样需要添加些判断语句,估计比较麻烦,关键是如何对不需要的内容进行过滤? 程序调试方面没有什么经验,莫见笑!
页:
[1]