zengxming 发表于 2008-4-17 23:02:41

求助,测试有内容,但采集不到内容

求助,测试有内容,但采集不到内容,要采集这个网页上的内容
http://www.ednchina.com/Issue/128.aspx?tid=28
标题,内容都采集不到,提示“采集内容全部完成√共采集到有效内容30条”
但打开“SpiderResult.mdb” content 表,内容、标题为空,没有采集到。
求一采集正则,多谢!!!

ab173 发表于 2008-4-18 00:21:00

测试有没有标题
可能这个连接已经采集过了

zengxming 发表于 2008-4-18 09:17:09

测试有标题,有内容,采集时标题,内容都为空

zydxdx 发表于 2008-4-18 12:01:21

也碰到这种情况 打开数据库文件有空行但是发布的时候确又正常。。

zengxming 发表于 2008-4-18 12:19:41

多谢楼上提醒,把mdb的列表框拉大,发现 标题和内容都是有的,只是前面有很多空格,应该是 utf-8 转gb2312造成的空格
页: [1]
查看完整版本: 求助,测试有内容,但采集不到内容