火车头/高铁采集器采集规则之采集目标站的下载地址进行组合教程

在我们做网站用火车头进行内容采集过程中,难免会遇到有的下载站把下载地址进行了隐藏,并且下载地址不统一,如下:

图片[1]-火车头/高铁采集器采集规则之采集目标站的下载地址进行组合教程-HostJL-VPS主机交流

 

可以到下载地址有的是相对地址

 <ul class="ul_Address"><script>_downInfo ={Address:"/anzhuo1/homie_v1.0.4_2265.com.apk",TypeID:"1",SoftLinkID:"137056",SoftID:"118759",Special:"0"}</script>

有的是绝对地址:

<script>_downInfo ={Address:"https://ugame.9game.cn/game/downloadGame?pack.cooperateModelId=51319&pack.id=21974768",TypeID:"0",SoftLinkID:"417736",SoftID:"267030",Special:"0"}</script>

 

我们在用火车头进行采集过程中,对这样的就需要进行一个组合判断。

首先新建标签  下载地址1,如图:

图片[2]-火车头/高铁采集器采集规则之采集目标站的下载地址进行组合教程-HostJL-VPS主机交流

 

然后新建标签下载地址2:获取

图片[3]-火车头/高铁采集器采集规则之采集目标站的下载地址进行组合教程-HostJL-VPS主机交流

数据处理里新建同义词替换:

图片[4]-火车头/高铁采集器采集规则之采集目标站的下载地址进行组合教程-HostJL-VPS主机交流

然后新建标签下载地址,组合下载地址2+下载地址1即可。

 

参考规则附上:生活休闲

目标站地址:

http://www.2265.com/game/267030.html

下载地址typeID路径:

http://www.2265.com/inc/SoftLinkType.js

© 版权声明
THE END
喜欢就支持一下吧
点赞8分享
评论 抢沙发
头像
欢迎您留下宝贵的见解!
提交
头像

昵称

取消
昵称表情代码图片

    暂无评论内容