如果内容页代码不一样如何采集
比如 网页的代码 如下1,<div=body>内容</div>
2,<div=neirong>内容</div>
3,<div=content>内容</div>
这样该如何采集 这样呢
<div=(*)>内容</div>
或者你找一下有没有别的代码。 用正则多模板匹配~ 回复 3# 专业收费采集
能详细说一下嘛? 正则表达式也是可以的。
这里有资料,你看看http://bbs.locoy.com/viewthread.php?tid=22091&highlight=%D5%FD%D4%F2%B1%ED%B4%EF%CA%BD
页:
[1]