callwo 发表于 2016-3-16 16:51:52

大家来挑战一个采集难题。

不能用 正则表达式 提取 图片链接,第一名发5元红包。
http://www.at008.com/thread-1592-1-1.html   
这个页面里,要求采集图片(保留原地址链接)+文字内容,因免费版的火车不支持正则表达式,能否正确提取原地址链接在结果里。

如下所示:要提取data/attachment/forum/201512/02/095416u8crczujz2my5gu9.jpg这段图片链接。


<img id="aimg_1941" aid="1941" src="static/image/common/none.gif"

zoomfile="data/attachment/forum/201512/02/095416u8crczujz2my5gu9.jpg"

file="data/attachment/forum/201512/02/095416u8crczujz2my5gu9.jpg" class="zoom" onclick="zoom

(this, this.src, 0, 0, 0)" width="282" id="aimg_1941" inpost="1" alt="Kumon Workbooks下载"

title="Kumon Workbooks下载" onmouseover="showMenu({'ctrlid':this.id,'pos':'12'})" />




页: [1]
查看完整版本: 大家来挑战一个采集难题。