lyo623 发表于 2011-10-29 20:06:06

采集分页第一页老是重复

采集http://ent.daqi.com/article/3204231.html这个的时候分页总是多出第一页,因为它的第一页有2个网址,一个是http://ent.daqi.com/article/3204231.html另一个是http://ent.daqi.com/article/3204231_1.html 不知道有没有办法避免这个重复页面?

303718 发表于 2011-10-30 16:25:00

你写分页代码的时候把_1.html也加到前面的部分里去
页: [1]
查看完整版本: 采集分页第一页老是重复