ccqzzx 发表于 2011-6-26 01:03:17

我用的网钛系统,请求支援

他们的官网是:http://www.otcms.com/    不会找被采集对象的列表开始和结束,标题开始和结束,正文的开始和结束,高手帮帮忙啊

303718 发表于 2011-6-27 08:20:14

比如这个http://www.otcms.com/news/3031.html

标题开始
<title>
结束
_

正文开始
<div id='newsContent'>
结束
</div>

这只是例子,具体可以自己调整。

dg769 发表于 2011-8-21 00:51:36

前后截断,唯一值!正则也可以,基本都是这样,可以看看火车软件自带的帮助文档!
页: [1]
查看完整版本: 我用的网钛系统,请求支援