fkenuiabcd 发表于 2012-10-29 19:58:16

我采集过程中这种网址采集不到的

http://www.pmsjw.com/html/艾.html

就是网址中带有字的

你们看看采集的网址是这样的

fkenuiabcd 发表于 2012-10-30 08:39:56

没人可以采的吗?这个站的网址是这样的,
http://www.pmsjw.com/html/艾.html

http://www.pmsjw.com/html/艾/艾福昌.html

http://www.pmsjw.com/html/艾/艾福昌/2457736.html

wxl08 发表于 2012-10-30 09:29:39

采集编码选择与采集网站保持一致

fkenuiabcd 发表于 2012-10-30 17:59:58

wxl08 发表于 2012-10-30 09:29 static/image/common/back.gif
采集编码选择与采集网站保持一致

你好谢谢你说了这个,这们采集到栏目还不到采集到内容 呀,
因为栏目打开还不是内容来的来的
这个站有点难度呀,
这个采集到的栏目打开你看看
里面还有同标题又是一个栏目来的,
就比如这个吧
http://www.pmsjw.com/html/艾/艾福昌.html

艾福昌这个名字下面又同名字的点开这个才是内容

pidansafe 发表于 2012-11-2 12:14:26

用分页就可以搞定

页: [1]
查看完整版本: 我采集过程中这种网址采集不到的