请问通过script引入的网页内容应该怎么采集?
腾讯的网页,列表页和内容都是通过script引入的内容,尝试过抓包也没抓到啥有效的内容,但是chrome检查网页能直接看到网页的内容,所以应该是能采的,但是没搞懂方法,有大佬指教一下么?如图地址:https://gp.qq.com/web20190423/listpage_news.html
使用fiddler抓包分析下实际加载所需数据的请求, 你去分析一段代码,还不如直接抓包获取网址就好了
https://apps.game.qq.com/wmp/v3.1/?p0=182&p1=searchNewsKeywordsList&page=2&pagesize=10&order=sIdxTime&r0=script&r1=NewsObj2875543879499025&type=iTarget&id=3996&source=web_pc https://apps.game.qq.com/wmp/v3.1/?p0=182&p1=searchNewsKeywordsList&page=2&pagesize=10&order=sIdxTime&r0=script&r1=NewsObj19409148100147178&type=iTarget&id=3996&source=web_pc
page=2 这个就是分页参数
页:
[1]