首页 >> 知识问答 >

火车头采集规则大全(火车头采集规则)

2022-08-29 08:28:06

问题描述:

火车头采集规则大全(火车头采集规则),求路过的大神留个言,帮个忙!

最佳答案

推荐答案

2022-08-29 08:28:06

大家好,小讯来为大家解答以上的问题。火车头采集规则大全,火车头采集规则这个很多人还不知道,现在让我们一起来看看吧!

1、试了下,火车头确实不行,因为它起始网址的参数就一个*,没法对两个动态的数据描述。

2、那不妨换个角度来思考,为什么不把这些网址变成1级网址让火车头以采集的方式把它采集出来呢。

3、比如//i.html?_pgn=2&_skc=50&rt=nc把这个设置为起始网址(0级网址),那么你在设置采集网址的1级网址。

4、而//i.html?_pgn=2&_skc=50&rt=nc这个页面肯定会有下一页,那么下一页的网址应该就是://i.html?_pgn=3&_skc=100&rt=nc,这个页面的下一页的网址就是//i.html?_pgn=4&_skc=150&rt=nc,依次类推,层层采集,最终会把你要得网址采集完。

5、那么可能会问起始网址就一个,怎么会采集到那么多的“下一页”呢,这个可以用分页的效果来实现,因为你设置好了分页,火车头就会自动跳到下一页去采集,分页的功能就把一个起始网址扩展出N个起始网址了!。

本文到此分享完毕,希望对大家有所帮助。

  免责声明:本答案或内容为用户上传,不代表本网观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 如遇侵权请及时联系本站删除。

 
分享:
最新文章