当前位置: 网站首页  >> 始于足下  >> 技术文章  >> 查看详情 技术文章

火车头Web在线发布模块制作教程

静如水 2020-01-20 259 人已围观

火车头Web发布模块,就是采集器通过网站后台,发布文章,也就是说,把你手动在网站后台发布文章的整个过程包含登录网站后台,选择栏目,到后面的发布文章,这些步骤写到采集器里面,就是在线发布模块,然后规则采集到的值就通过标签名传递给在线发布模块,把数据提交到网站里去。

我们借助抓包工具Fiddler(下载地址:http://www.wwt6.com/tjgj/552.shtml,下载后,只要一直点击下一步,就安装好了),这个软件可以把你手动添加文章做的操作记录下来,我们只需要把这些操作步骤复制到采集器里面就可以了。我们用织梦CMS管理系统做教程,大家也同样用织梦CMS管理系统搭建一个网站系按照教程一步一步的做。

一、打开WEB在线发布模块编辑器

点击“Web发布配置”按钮,如下图:



然后点击“新建”按钮,我们来新建一个发布模块,如下图:



说下上图的一个主要的选项:

“网站自动登录”:网站系统登录的步骤和方式是写在那里的;

“获取栏目列表”:获取网站的栏目的方式写在这里;

“网页随机值获取”:在我们发布文章或者登录的时候,会有些值时刻变化,并不是我们填写的,而是网站系统自动生成的,我们这这里获取这些特殊的值;

“内容发布参数”:把网站发布内容的步骤和方式填写在这里;

二、网站自动登录

我们首先做网站登录这一部分,首先打开并设置好上面我们安装好的Fiddler抓包软件如下图:



按照红色框标注的选项来对抓包软件进行设置。左侧的地址就是Fiddler抓取到我们当前正在访问的地址,可能会抓到很多无用的地址,我们在抓下面登录系统的时候,先把已经抓到无用的结果给清空如下图:



右击左侧任意处,弹出选项 我们选择 移除==》所有会话 或者用快捷键 Ctrl+X快捷键,来清空记录:



看结果已经全部清空了。

在按照以上步骤 清空了抓包软件抓取到的结果后,打开网站的登录界面并输入正确的用户名密码点击登录如下图:



登录成功后,我们在看抓包软件如下图:



可以看到抓到了很多我们系统相关的地址,那么我们如何找我们需要的地址呢?看下图:



我们选中左侧的地址,就可以查看右边抓到的信息,右侧有2个地方要看,在上图标志出来了,在第一处大家看到“POST”,第二处看到我们刚才输入的用户名密码了是吧,如果符合这2点,就说明,这个地址就是我们要获取的,为什么呢?这里就不说了,懂的人自然懂不懂的说了也不懂,这里需要网站编程基础的人才会明白,反正大家按照这个方式找就对了,懂不懂原理就看个人了。

大家可以用同样的方式,查看别的地址,是不会有这样的2点的。那么现在就把我们需要的信息获取到了,然后我们下面大概的讲解下这是什么意思。讲解的比较的不专业,因为专业的人是不需要的讲解的,只是通过不专业的语言让我们不专业的人能有个大概的了解。如果你需要更多了解,就去学习下做网站写代码吧,水很深那~~~~~~~~~~

我们把抓取的信息放到文本文件查看,点击右下角“记事本中查看”如下图:



文本文件如下图:



登录的过程就是:用户帐号数据在采集器里面我们称之为POST数据(标注3)是通过Referer:后面的地址(标志2)提交给POST后面的地址(标注1),进行登录验证。
这就是整个登录过程。我们把这个过程写入采集器的发布模块里面去。

在WEB发布模块编辑器里面选择“网站自动登录”选项卡,然后点击数据里面的“黏贴抓包获取的数据”,弹出自动提取数据的空白框,然后把登录抓到的POST数据填写进去,然后下面的UrlDecode 选择和自己网站对应的编码点击下,如下图:



以上操作完了点击“提取”按钮。结果如下图:



上图就把标签名和标签值一样对应提取出来了,选择一个标签名进行修改。

对应的值我们用标签表示如上图。

然后我们把登录地址后缀,来源页面地址后缀填写好如下图:



登录地址后缀:就是抓包获取的post的后面的地址,我们去掉一部分填写这里,去多少你自己决定。一般是取域名后面的。

来源也地址后缀:是Referer后面的地址,同上面去掉同一部分填写这里。

验证码地址:这里填写验证码的地址。

下面来说下,登录成功标识码如下图:



采集器不是人,它不像你一样聪明的能判读是否登录成功了。但是一般我们登录成功后网站都会返回信息告诉我们是成功还是失败,这个返回的信息添加到登录成功标识码这里,
采集器登录的时候就会把你填写到这里的信息和返回的信息做对比,如果是一致的采集器就当登录成功,不一致采集就当不成功。

访问的信息我们依然是在Fiddler里面获取如下图:



同样是找到发布页面,右侧选择“原始”下面就是访问的信息,一般情况下在这里查找访问信息做为成功标识码,找到有些代表意义的,一般网站登录成功都会提示成功,总之是能判读是否成功登录,或者说只会在成功登录才能看到的信息,登录失败不会出现,就可以用来区分是否成功登录。成功标识码写到采集器里面如下图:



“登录失败验证码”:我们同样用抓包,但是我们故意输入错误的用户名,来看下登录识别返回的提示,按照上面找成功标识码一样找失败标识码如下图:



返回的信息中有很明确的提示信息“你的密码错误!”,就可以当我们成功标识码如下图:



成功标识码和错误标识码都可以是多个,一行一个。

下面说“内容发布参数”,操作和做“网站自动登录”是一样的。

首页我们在后台测试发布一篇文章,我们一般使用数字或者英语字母做测试,因为有的时候用汉字抓包可能是乱码,我们不好分辨,如下图:



然后清空抓包软件Fiddler里面不要的信息(抓登录Post数据的时候已经说过了),然后点击发布文章用Fiddler抓取发布文章的POST数据,如下图:



按照上面我们做登录的时候一样,找我们需要的地址,POST数据,成功标识码等等如上图,或者的的文本文件如下:



和登录是一样的格式的,红色框的发布文章的抓的数据格式和登录是不一样的,并且不同的网站抓到的结果也是不一样的,这个我们都不需要关注,直接复制放到采集器里面,采集器会帮我们自动提取好如下图:



把我们填写的值对应用标签表示。我们查看发布页面的源代码看下分类是什么情况如下图:



可以知道typeid就是代表的分类,每个分类都有个数字代替就是上图的id对应的数字,typename是分类的名称。

“发布错误标识码”和“成功标识码”和上面到登录成功标识码和失败标识码是一样的。

现在我们就要获取分类id和分类名称如下图:



在获取分类的时候我们最好选择显示分类是那种下拉框显示的,一般也就是在添加文章那里获取分类,我们在添加文章的页面找到分类那部分的源代码如下图:



找的代码的开始和结束,还有分类代码的格式,写的发布模块里面去如下图:



设置开始结束字符,分类列表名称及ID格式,分类和分类名称分别用“[分类ID]”,“ [分类名称]”来表示。

刷新列表的页面地址和内容发布参数里面的来源页面后缀是一样的如下图:



那么经过上面步骤发布模块就写好了,我们起个名字名保存如下图:



测试发布模块:



成功后给配置起一名字,我们就可以在规则里面使用了如下图:

文章评论

      【高价格高返佣】企业级云服务器 1折特惠[2019-08-18 19:38:37]

    站点信息