我要采集<h1>和 简介 或者 剧情 之间的文本,怎么办呢?正则?
我想采集电影的信息,一般都是<h1>标题</h1>
..
..
..
<p>简介</p>
简介 这一行可能会出现其他情况
<p>剧情</p>
<p>剧情简介</p>
我用“前后截取”的形式没办法匹配多个情况了,请问有什么方法可以截取呢?正则表达式? 你可以分多个标签来采集 本帖最后由 doufuguolyl 于 2013-7-6 08:56 编辑
303718 发表于 2013-7-6 08:34 static/image/common/back.gif
你可以分多个标签来采集
你的意思是
<h1>.....简介
<h1>.....剧情
<h1>.....剧情简介
这三种情况,都采集发布到同一个标签里面去?
可能我理解有问题,这方法不行,三种情况同时出现,就会都采集到内容
页:
[1]