我采集过程中这种网址采集不到的
http://www.pmsjw.com/html/艾.html就是网址中带有字的
你们看看采集的网址是这样的 没人可以采的吗?这个站的网址是这样的,
http://www.pmsjw.com/html/艾.html
http://www.pmsjw.com/html/艾/艾福昌.html
http://www.pmsjw.com/html/艾/艾福昌/2457736.html 采集编码选择与采集网站保持一致 wxl08 发表于 2012-10-30 09:29 static/image/common/back.gif
采集编码选择与采集网站保持一致
你好谢谢你说了这个,这们采集到栏目还不到采集到内容 呀,
因为栏目打开还不是内容来的来的
这个站有点难度呀,
这个采集到的栏目打开你看看
里面还有同标题又是一个栏目来的,
就比如这个吧
http://www.pmsjw.com/html/艾/艾福昌.html
艾福昌这个名字下面又同名字的点开这个才是内容 用分页就可以搞定
页:
[1]