请指教如何在不同页面取到想要的值并组库??
先叙述流程:有一列数据表格,共为6项。
先去找链接,火车提供了几中级别供选择。
现在的问题在于,由根链接能找到1.htm 和 2.htm
其中表格中的内容项和标题项能由1.htm得到.
如何从2.htm中得到图片项和说明项???并和由1.htm中得到的数据组成一个表??
由2.htm中能得到一个链接3.htm,由3.htm能得到一个大图片的绝对地址和一个备注项.
请问:1、如何能把从各个互相链接的页面去取得数据,并组成表的一列?
2、如何下载图片,而不是把图片的绝对地址写入数据库,如:http://t3.baidu.com/it/u=731906431,2717632597&fm=0&gp=48.jpg 不懂,帮你顶下。。 如果是多页采集的话,采到的内容是分到每一个标签里的,如果你要将所有标签里的内容整理成一定的格式,只能使用外部接口编程实现.
页:
[1]