godmaster 发表于 2008-11-2 01:06:28

救命哪!标签规则问题!

网页源代码:<div class="left_list"><a href="/">小说</a> / <a href="/ch/12.html">短篇作品</a> / <a href="/ch/13.html">短篇小说</a> / 最后的疯狂</div> 
</div>

我要取文章所属的栏目ID,就是<a href="/ch/13.html">短篇小说</a>这里面的"13",不管我怎么设开始字符串都取的是"12",求高人指点!
注1:“ / ”这3个字符只在这一行才有,我是以这个为开始字符串;
注2:其中“小说”是固定格式,“短篇作品”和“短篇小说”都是变量。


多谢rq204的帮助,我再补充一点,栏目有二级的,也有三级的,我认为的难点就在这里,因为前面两个栏目是一样的标识,不好区分,如果按三级的写,那只有二级的文章就取不到值了。

[ 本帖最后由 godmaster 于 2008-11-2 01:33 编辑 ]

rq204 发表于 2008-11-2 01:09:55

小说</a>(*)</a>(*)/ch/

godmaster 发表于 2008-11-2 01:28:40

回复 2楼 的帖子

多谢!但我忘了说我觉得最难的地方,栏目不是固定格式,这篇是三级分类,有的文章是二级分类。

rq204 发表于 2008-11-2 09:17:38

回复 3楼 的帖子

正则表达式   <div class="left_list">.*?(\d+)\.html[^html]*</div>
页: [1]
查看完整版本: 救命哪!标签规则问题!