采集信息出错
为什么我采集图片的时候采集的连接会自动把bbs字符删掉.比如:原网页<IMG src="http://www.v181.com/bbs/UploadFile/2006-11/2006112416331431955.jpg" alt="我的性感学姐"></P>
采集后<IMG src="http://www.v181.com/ /UploadFile/2006-11/2006112416331431955.jpg" alt="我的性感学姐"> 内容没有任何排除和替换。只是排除了所有HTML标签,光留下一个img的, 找到问题了,是排除空格标签的事
页:
[1]