Unicode采集
http://gz.homephoto.com.cn/Vendue/InformationDetail.aspx?NewsId=bf5d3059-7254-4f35-92c0-7c35d5290bed在测试此页时,用默认得到乱码,用UTF-8得到正确内容,用Unicode得不到内容。在IE中看编码形式,发现是Unicode(UTF-8)。所以,在内容规则中,我设置为UTF-8
但是,在发表内容时,状态是得到“未知”,经winsock和接口检查,发现并没有将数据发表到接口。 我将内容发表到discuz模块,发表成功,证实内容规则没问题。
而将其它内容发表到我自己写的模块,成功,证实我的模块没问题。
我找了两个网友测试。他们自己写的规则。也遇上这个问题。 我模块内容如下,运行在windows 2003环境下,没有指定编码。:
<%
Set conn = Server.CreateObject("Adodb.Connection")
conn.open "..."
querystring = Request.QueryString
If querystring = "" Then
querystring= Request.Form
End If
sql = "insert into test(querystring) values('" & querystring &"')"
response.write sql
conn.execute sql
conn.close
set conn = nothing
%>
ok 昨天和今天我所说的问题,解决了,是模块问题。不好意思。
但我自己用另一模块试,也是同样的错,所以才怀疑是采集器的BUG。
如果火车采集器将发表后的提示显示出来,则我当时就能发现,可惜没这功能。且winsock expert又没有监测到响应结果!
用Wkiller也没有监测到响应结果。 火车,我确认过,如果模块没有注明编码,你的程序会“未知”状态
我的问题是因为这个引起的。在接收gb2312不会有问题,而接收UTF8就有问题了。 我是分析成功。发表时提示未知 是的,我当时也是这原因。 这有可能是标签不匹配,或网速过慢。
页:
[1]