请问高人,同时有多种形式的分页地址如何采集?
分页地址有以下等形式<A hrEf=99_2.htm>2</a>
<A class=“red” hrEf="199_2.htm">2</a>
<a id=“red” href=‘199_2.htm’>2</a>
字母有大小写
href后的地址有的有单引号,有的有双引号,有的没有引号
有时候用class关联样式,有时用id关联样式,有时没有样式
这种用插件即可解决 有的href后=前后有空格,如
Href=‘199_2.htm’ 这个插件怎么写啊?
高人帮忙哦 分页网址提取区域自动识别
试试呢?
页:
[1]