fanadu 发表于 2011-2-14 09:21:39

如果内容页代码不一样如何采集

比如 网页的代码 如下
1,<div=body>内容</div>
2,<div=neirong>内容</div>
3,<div=content>内容</div>
这样该如何采集

303718 发表于 2011-2-14 10:58:03

这样呢
<div=(*)>内容</div>
或者你找一下有没有别的代码。

专业收费采集 发表于 2011-2-14 11:49:48

用正则多模板匹配~

fanadu 发表于 2011-2-14 13:07:39

回复 3# 专业收费采集


能详细说一下嘛?

303718 发表于 2011-2-14 13:21:31

正则表达式也是可以的。
这里有资料,你看看http://bbs.locoy.com/viewthread.php?tid=22091&highlight=%D5%FD%D4%F2%B1%ED%B4%EF%CA%BD
页: [1]
查看完整版本: 如果内容页代码不一样如何采集