callwo 发表于 2016-3-21 13:42:19

【5元红包解决一个困难】采集大神请进!


用免费版火车头V9,采集下方网页内的【图片+文字】当内容——[标签:内容],遇到如下难题 :

http://www.at008.com/thread-1592-1-1.html   
这个页面里,要求采集图片(注意:保留原地址链接)+文字内容,因免费版的火车不支持正则表达式,能否正确提取原地址链接在结果里。


想得到的图文结果:

【正文】
【插图地址链接】data/attachment/forum/201512/02/095416u8crczujz2my5gu9.jpg这段图片链接。





实际我采集的结果是:
<img id="aimg_2551" aid="2551" src="static/image/common/none.gif" zoomsrc="data/attachment/forum/


只有一半 图片链接,不知道是怎么回事。

请明白的大神指点一下。
页: [1]
查看完整版本: 【5元红包解决一个困难】采集大神请进!