关于&字符的问题
把规则都写好后,看测试没有有问题,就是在导库的时候。遇到&这个字符就过不去了!认为到了结束点了!总是不能导入完整的内容。
在导库时内容里遇到“&”这个字符就结束了!是在单单这个这字符时,像空格 这样的组合没有问题,可以过去!
这样的问题主要是在下载地址里出现,还不能过滤掉
这是一个下载地址:http://www.ttbt.cn/down.asp?id=52187&no=1
其中的&就出现这样的问题。希望大家给帮忙看下。是替换还是其他办法!
也希望管理员注意下,在年前就提出过这个问题,可能作为管理员忙,没有来的急给解决。不过希望在百忙之中帮忙解决 怎么没有人回答啊!
帮忙啊! 管理员来看下,这是为什么 :( 何谓过不去? 打个如方:'
原内容代码是这样:
XXXXXXXXXXXXXXXXXXXXXXXXXX-----<a href="httP://www.ttbt.cn/down.asp?id=52187&no=1" target="_blank">‘........
wwwwwwwwwwwwwwwwwwwwwwwwww
导完后的内容代码是:
XXXXXXXXXXXXXXXXXXXXXXXXXX-----<a href="httP://www.ttbt.cn/down.asp?id=52187
就是到& 就好像是个结束符号是的。&后的内容没有导进去 用替换吧。。可以采的,采完后再替换一次。。。:lol 应该可以的。。。。 火车采集太简单了,自己看一下就可以 替换这个我想倒是可以实现的。 应该没有问题了。就是要再费一倍的工夫。
谢谢大家的帮忙
还有没有更好的办法? 这是个比较严重的问题,只要是特殊的字符都有问题,这样替换,何时是个头?
页:
[1]
2