标签:火车头采集

火车头采集之采集内容获取

前言 昨天一篇文章简单教大家怎么设置网址的采集规则,今天这篇文章教大家如何设置内容的采集规则。 采集内容规则设置 1.  明确采集内容 首先我们要先明白需要采集什么内容,其实你采集的内容最终会进入数据库,一般情况下你的一个采集标签会对应一个数据库字段。 我们接着昨天的网站说。我的网站是一个资源收集网站。其实归根到底就是一个文章发布,及文章展示的网站。我们文……

火车头采集之采集规则编写

前言 上一篇火车头采集系列主要给大家一个引导作用,让大家简单了解火车头采集器有什么功能,从次文起将教大家如何编写火车头采集规则。 今天以采集某资源网网站源码为例,其他举一反三。 目标网站分析 1.  网站 url 链接分析 进入目标采集栏目: 此处我进入网站源码栏目,点击下面分页,观察网址总规律。 通过查看网站我总结的规律是: 第二页网址: xxxx……

火车头采集之网站分析

前言 最近在使用火车头采集,在使用过程中还是遇到一些问题,于是想记录下。鉴于网上完整使用火车头采集的文章较少,于是我就想出一个从网站采集使用到数据发布的一系列文章。鉴于本人技术水平有限,难免有误导情况,如有问题欢迎留言讨论。 火车头软件安装 安装教程,我在此就不多做说明了吧,直接下一步下一步安装即可,没有特殊说明。火车头软件官网地址:http://www.l……

火车头采集设置一次可采集资源个数

前言 今天在使用火车头V9 版本采集资源的时候,发现资源每次只能采集 2 两个,首先在网上搜了下, 但是大多数说的都是火车头v7 的,最后按照他们说的 v7 思路找到了。 火车头采集设置方法 1.  双击需要设置的项目 2. 选择内容采集规则---> 其他设置--->更改最大采集数即可。   ……