wmai0513 发表于 2011-12-27 15:07:27

内容排除怎么写

地址来源:
http://www.meishichina.com/Eat/LMenu/200709/20224.html
我是想把开头的来源排除掉

每页都有:
target=_blank>可变的一个标题</A> <SMALL>

内容排除规则应该这么写吧?
target=_blank>(*)</A> <SMALL>

怎么会不正确呢

303718 发表于 2011-12-27 15:52:12

你代码好像弄借了。你贴出来的这个代码上面的网址里的内容开头里没有呢

wmai0513 发表于 2011-12-27 17:23:48

303718 发表于 2011-12-27 15:52 static/image/common/back.gif
你代码好像弄借了。你贴出来的这个代码上面的网址里的内容开头里没有呢

http://www.meishichina.com/Eat/LMenu/201112/110304.html
这页里面
target=_blank>小小为爱走天涯</A> <SMALL>这个地方

我想把标签中间的文字排除怎么写呢?

四川开来 发表于 2011-12-27 17:27:36

wmai0513 发表于 2011-12-27 17:23 static/image/common/back.gif
http://www.meishichina.com/Eat/LMenu/201112/110304.html
这页里面
target=_blank>小小为爱走天涯 这 ...

你刚才那个就对了!
其实排除链接(也就是A标签,前面打钩钩)貌似就可以解决了!
注意的是,排除的时候要排除的是原始代码!
就是源文件里面的。

wmai0513 发表于 2011-12-28 09:39:49

四川开来 发表于 2011-12-27 17:27 static/image/common/back.gif
你刚才那个就对了!
其实排除链接(也就是A标签,前面打钩钩)貌似就可以解决了!
注意的是,排除的时候 ...

A标签是排除了
可以文字没排除。。教我。。

303718 发表于 2011-12-28 09:45:00

你不要勾选排除A标签,然后把这个放里面target=_blank>(*)</A> <SMALL>

四川开来 发表于 2012-1-13 09:33:53

排除不掉就按6楼说的来排除了!
但是。貌似我觉得一直都是那么排除的啊!,按道理说,你采集的时候,里面的文字是要的……超链接不要的!
页: [1]
查看完整版本: 内容排除怎么写