xiaoyongwudi 发表于 2013-1-15 09:03:33

大神来看看,采集分类标题,采集到的内容却为空?


最近碰到有几个站,想采集产品,可是发现产品类名采不到,查看了网页源代码里确实有存在类名,可是采到的结果却是空的。跟人间蒸发一样。百思不得其解。麻烦大家帮我看看吧。问题网站网址:http://www.hisjersey.com/2012-2013-senegal-home-soccer-jersey.html   想采集的类名:Home / National Teams / Senegal /   

xiaoyongwudi 发表于 2013-1-15 09:04:02

帮我顶顶看吧!!

wxl08 发表于 2013-1-15 10:06:52

打开采集地址返回的源文件查看,没看到有这个类目的导航栏

lmj243 发表于 2013-1-15 11:16:37

home: http://www.hisjersey.com/
national:http://www.hisjersey.com/national-teams.html
..........
汗汗,不是直接看到的嘛!你的分类名是分类的网址还是啥?

xiaoyongwudi 发表于 2013-1-16 08:50:38

lmj243 发表于 2013-1-15 11:16 static/image/common/back.gif
home: http://www.hisjersey.com/
national:http://www.hisjersey.com/national-teams.html
..........


你好,分类名不是网址,就是要把这些分类名的名称采下来。我采的时候是空的。你能帮忙采采看看吗?谢谢了

xiaoyongwudi 发表于 2013-1-16 08:52:39

xiaoyongwudi 发表于 2013-1-16 08:50 static/image/common/back.gif
你好,分类名不是网址,就是要把这些分类名的名称采下来。我采的时候是空的。你能帮忙采采看看吗?谢谢了

简单的说就是这个网址http://www.hisjersey.com/2012-2013-senegal-home-soccer-jersey.html,你能不能把这些字符:   Home / National Teams / Senegal /采到

xiaoyongwudi 发表于 2013-1-16 09:07:21

xiaoyongwudi 发表于 2013-1-16 08:50 static/image/common/back.gif
你好,分类名不是网址,就是要把这些分类名的名称采下来。我采的时候是空的。你能帮忙采采看看吗?谢谢了

你好,很感谢你的回复。很奇怪的是直接在浏览器中打开这个网址,然后右键查看源代码能发现这串源代码:                <div class="breadcrumbs">
    <ul>
                  <li class="home">
                            <atitle="Go to Home Page">Home</a>
                                        <span>/ </span>
                        </li>
                  <li class="category119">
                            <atitle="">National Teams</a>
                                        <span>/ </span>
                        </li>
                  <li class="product">
                            <strong>2012-2013 Senegal home Soccer Jersey </strong>
                                    </li>
            </ul>
</div>


但是用火车头软件里的查看源代码,却变成了这个:<div class="breadcrumbs">
    <ul>
                  <li class="home">
                            <atitle="Go to Home Page">Home</a>
                                        <span>/ </span>
                        </li>
                  <li class="product">
                            <strong>2012-2013 Senegal home Soccer Jersey </strong>
                                    </li>
            </ul>
</div>
缺少了我要的采的那段内容。。 很奇怪,为什么同是查看源代码,却会不一样呢?望请回复,不胜感激!

leejunji 发表于 2013-1-16 09:13:43

我知道你的问题了这些外贸站 只有从分类列表那里点击产品在产品页面才能看到 分类名称的 你可以试试 直接复制一个产品的页面 然后换个浏览器 看下就知道 产品分类看不到的 我遇到很多这样的网站

xiaoyongwudi 发表于 2013-1-16 11:31:15

leejunji 发表于 2013-1-16 09:13 static/image/common/back.gif
我知道你的问题了这些外贸站 只有从分类列表那里点击产品在产品页面才能看到 分类名称的 你可以试试...

谢谢大神回复啊。我试了下还真是这么回事,同样的产品页面网址换个浏览器再看,就还真消失了。请问这是怎么回事呀?遇到这种站很头疼

leejunji 发表于 2013-1-16 14:39:18

leejunji 发表于 2013-1-16 09:13 static/image/common/back.gif
我知道你的问题了这些外贸站 只有从分类列表那里点击产品在产品页面才能看到 分类名称的 你可以试试...

它是记录了cookie好像目前搞不定你按照分类采集吧 想要采集分类的话
页: [1]
查看完整版本: 大神来看看,采集分类标题,采集到的内容却为空?