掌桥专利:专业的专利平台
掌桥专利
首页

web站点页面监控方法、装置、设备及存储介质

文献发布时间:2023-06-19 13:49:36


web站点页面监控方法、装置、设备及存储介质

技术领域

本发明涉及页面监控技术领域,尤其涉及一种web站点页面监控方法、装置、设备及存储介质。

背景技术

随着互联网技术的不断发展,越来越多的服务提供商为用户提供线上服务,越来越多的网页也由此应运而生。为了提供稳定的线上服务,需要进行web站点页面监控以及时处理页面错误等问题。

在现有的技术中,页面错误的处理通常依靠用户发现问题后进行反馈,工作人员再依据反馈处理问题。这种方式不仅处理周期长,还会导致用户体验度较差。而已有的web站点页面监控方法在检测页面状态时亦存在有监控不全面而造成预警不及时的问题。

发明内容

本发明的主要目的在于提供一种web站点页面监控方法、装置、设备及存储介质,旨在解决现有web站点页面监控方法监控不全面的技术问题。

本发明第一方面提供了一种web站点页面监控方法,所述web站点页面监控方法包括:

读取当前访问web站点页面的页面内容,并保存为页面快照;

获取所述页面快照的第一路径目录与正常页面快照的第二路径目录;

根据所述第一路径目录与所述第二路径目录,比对所述页面快照与所述正常页面快照,获得比对结果;

若所述比对结果为目录存在差异,则触发页面异常告警。

可选的,在本发明第一方面的第一种实现方式中,在所述读取当前访问web站点页面的页面内容,并保存为页面快照之前,还包括:

向待访问的web服务器发送访问请求,并获取所述访问请求对应的响应状态码;

判断所述响应状态码是否为预置数值;

若为所述预置数值,则确定待访问的web站点页面正常,并执行所述读取当前访问web站点页面的页面内容,并保存为页面快照的步骤,否则触发页面异常告警。

可选的,在本发明第一方面的第二种实现方式中,所述读取当前访问web站点页面的页面内容,并保存为页面快照包括:

读取当前访问web站点页面的页面内容;

根据所述页面内容的信息类型,将所述页面内容保存为对应类型的页面快照,并以所述web站点页面的页面标题及url进行命名;

将所述web站点页面对应的页面快照保存至所述第一路径目录,其中,当所述第一路径目录中存在同名页面快照时,替换同名页面快照。

可选的,在本发明第一方面的第三种实现方式中,所述根据所述页面内容的信息类型,将所述页面内容保存为对应类型的页面快照包括:

若所述页面内容的信息类型为文本类型,则将所述页面内容保存为文本快照;

若所述页面内容的信息类型为非文本类型,则生成所述页面内容的MD5值,并将所述MD5值保存为对应类型的页面快照。

可选的,在本发明第一方面的第四种实现方式中,所述页面内容包括文本、图片、音频及视频中的一种或多种;所述页面快照包括文本快照、图片快照、音频快照和视频快照中的一种或多种。

可选的,在本发明第一方面的第五种实现方式中,所述根据所述第一路径目录与所述第二路径目录,比对所述页面快照与所述正常页面快照,获得比对结果包括:

根据所述第一路径目录与所述第二路径目录,对所述页面快照与所述正常页面快照进行同名页面快照比对,获得比对结果;

其中,若所述页面快照为文本快照,则对所述页面快照和所述正常页面快照进行文本比对;若所述页面快照为非文本快照,则对所述页面快照和所述正常页面快照进行MD5值比对。

可选的,在本发明第一方面的第六种实现方式中,在所述根据所述第一路径目录与所述第二路径目录,比对所述页面快照与所述正常页面快照,获得比对结果之后,还包括:

若所述比对结果为目录相同,则确定当前访问的web站点正常;

当触发页面异常告警后触发人工复核,并在人工复核通过后,重命名所述第二路径目录,并复制所述第一路径目录以及将复制的所述第一路径目录置为所述第二路径目录。

本发明第二方面提供了一种web站点页面监控装置,所述web站点页面监控包括:

读取模块,用于读取当前访问web站点页面的页面内容,并保存为页面快照;

获取模块,用于获取所述页面快照的第一路径目录与正常页面快照的第二路径目录;

比对模块,用于根据所述第一路径目录与所述第二路径目录,比对所述页面快照与所述正常页面快照,获得比对结果;

告警模块,用于若所述比对结果为目录存在差异,则触发页面异常告警。

可选的,在本发明第二方面的第一种实现方式中,所述web站点页面监控装置还包括:

预处理模块,用于向待访问的web服务器发送访问请求,并获取所述访问请求对应的响应状态码;判断所述响应状态码是否为预置数值;若为所述预置数值,则确定待访问的web站点页面正常,并执行所述读取当前访问web站点页面的页面内容,并保存为页面快照的步骤,否则触发页面异常告警。

可选的,在本发明第二方面的第二种实现方式中,所述读取模块包括:

页面读取单元,用于读取当前访问web站点页面的页面内容;

快照存储单元,用于根据所述页面内容的信息类型,将所述页面内容保存为对应类型的页面快照,并以所述web站点页面的页面标题及url进行命名;将所述web站点页面对应的页面快照保存至所述第一路径目录,其中,当所述第一路径目录中存在同名页面快照时,替换同名页面快照。

可选的,在本发明第二方面的第三种实现方式中,所述快照存储单元具体用于:

若所述页面内容的信息类型为文本类型,则将所述页面内容保存为文本快照;若所述页面内容的信息类型为非文本类型,则生成所述页面内容的MD5值,并将所述MD5值保存为对应类型的页面快照。

可选的,在本发明第二方面的第四种实现方式中,所述页面内容包括文本、图片、音频及视频中的一种或多种;所述页面快照包括文本快照、图片快照、音频快照和视频快照中的一种或多种。

可选的,在本发明第二方面的第五种实现方式中,所述比对模块具体用于:

根据所述第一路径目录与所述第二路径目录,对所述页面快照与所述正常页面快照进行同名页面快照比对,获得比对结果;

其中,若所述页面快照为文本快照,则对所述页面快照和所述正常页面快照进行文本比对;若所述页面快照为非文本快照,则对所述页面快照和所述正常页面快照进行MD5值比对。

可选的,在本发明第二方面的第六种实现方式中,所述web站点页面监控装置还包括:

更新模块,当触发页面异常告警后触发人工复核,并在人工复核通过后,重命名所述第二路径目录,并复制所述第一路径目录以及将复制的所述第一路径目录置为所述第二路径目录。

本发明第三方面提供了一种计算机设备,所述计算机设备包括:存储器和至少一个处理器,所述存储器中存储有指令;

所述至少一个处理器调用所述存储器中的所述指令,以使得所述计算机设备执行如上述任一项所述的web站点页面监控方法。

本发明的第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机程序,所述计算机程序被处理器执行时实现如上述任一项所述的web站点页面监控方法。

本发明提供的技术方案中,通过对当前访问页面的页面内容进行处理,获取对应的页面快照,并与正常页面快照进行比对,依据比对结果判断当前页面是否显示异常。自动监控web站点页面极大地节省了人力成本与时间成本,并且用直接对比页面内容的方式可以实现更全面地监控,提高了页面监控的精确度,同时本发明还能够有效地识别DNS劫持、非法篡改web站点页面内容等问题。

附图说明

图1为本发明实施例中web站点页面监控方法的第一个实施例示意图;

图2为本发明实施例中web站点页面监控方法的第二个实施例示意图;

图3为本发明实施例中web站点页面监控方法的第三个实施例示意图;

图4为本发明实施例中web站点页面监控装置的一个实施例示意图;

图5为本发明实施例中web站点页面监控装置的另一个实施例示意图;

图6为本发明实施例中计算机设备的一个实施例示意图。

具体实施方式

本发明实施例提供了一种web站点页面监控方法、装置、设备及存储介质,本发明实施例使用快照的方式记录web站点的正确状态,采用反触发的方式进行页面监控,节省了人力成本和时间成本,极大地提高了报警精确度和检查效率,并能够有效地识别DSN劫持、非法篡改web站点页面内容等问题。

本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外,术语“包括”或“具有”及其任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

为便于理解,下面对本发明实施例的具体流程进行描述,请参阅图1,本发明实施例中web站点页面监控方法的第一个实施例包括:

101、读取当前访问web站点页面的页面内容,并保存为页面快照;

可以理解的是,本发明的执行主体可以为web站点页面监控装置,还可以是终端或者服务器,具体此处不做限定。本发明实施例以服务器为执行主体为例进行说明。

本实施例中,web站点指因特网上根据一定的规则,使用HTML等工具制作的用于展示特定内容的相关网页的集合。

本实施例中,监控的可以是一个web站点,也可以是具体的某一个页面。

本实施例中,获取页面内容的方法不限,包括但不限于:由监控服务器直接向web服务器发送http请求,获得响应数据;由用户浏览器向web服务器发送http请求,获得响应数据后转发给监控服务器。

本实施例中,所述页面内容包括文本、图片、音频及视频中的一种或多种;所述页面快照包括文本快照、图片快照、音频快照和视频快照中的一种或多种。

可选的,在一实施例中,在上述步骤101之前还包括:

向待访问的web服务器发送访问请求,并获取所述访问请求对应的响应状态码;

判断所述响应状态码是否为预置数值;

若为所述预置数值,则确定待访问的web站点页面正常,并执行所述读取当前访问web站点页面的页面内容,并保存为页面快照的步骤,否则触发页面异常告警。

102、获取所述页面快照的第一路径目录与正常页面快照的第二路径目录;

本实施例中,由于一个web站点包含有多个页面,因此一个web站点会有多个页面快照,将一个web站点的所有页面快照存储在指定的路径目录下,以便于后续的步骤实行。

本实施例中,所述正常页面快照为当前版本下的正常页面快照。

103、根据所述第一路径目录与所述第二路径目录,比对所述页面快照与所述正常页面快照,获得比对结果;

在一实施例中,步骤103具体包括:

(1)分别将所述第一路径目录与所述第二路径目录中的快照文件按文件名称的字典序进行排序,并分别统计文件数目;

(2)若所述第一路径目录文件数目与所述第二路径目录文件数目不同,将目录存在差异作为比对结果返回,否则继续执行下一步;

(3)按序逐一比对相对应的同名文件,获得比对结果并输出。

104、若所述比对结果为目录存在差异,则触发页面异常告警。

本实施例中,目录差异包括但不限于:页面快照文件存在差异;同名文件的内容存在差异。

本实施例中,页面异常告警信息由监控服务器发送给相关技术人员进行处理。

本发明实施例中,通过对当前访问页面的页面内容进行处理,获取对应的页面快照,并与正常页面快照进行比对,依据比对结果判断当前页面是否显示异常。自动监控web站点页面极大地节省了人力成本与时间成本,并且用直接对比页面内容的方式可以实现更全面地监控,提高了页面监控的精确度,同时能够有效地识别DNS劫持、非法篡改web站点页面内容等问题。

请参阅图2,本发明实施例中web站点页面监控方法的第二个实施例包括:

201、读取当前访问web站点页面的页面内容;

202、根据所述页面内容的信息类型,将所述页面内容保存为对应类型的页面快照,并以所述web站点页面的页面标题及url进行命名;

本实施例中,所述页面内容的信息类型包括文本类型与非文本类型,其中非文本类型包括但不限于图片、音频、视频。

本实施例中,所述页面标题即html文档中title标签的内容;网络上每一信息资源都有统一的且在网上唯一的地址,该地址表示为URL(Uniform Resource Locator,统一资源定位器)。

可选的,在一实施例中,上述步骤202包括:

若所述页面内容的信息类型为文本类型,则将所述页面内容保存为文本快照;

若所述页面内容的信息类型为非文本类型,则生成所述页面内容的MD5值,并将所述MD5值保存为对应类型的页面快照。

203、将所述web站点页面对应的页面快照保存至所述第一路径目录,其中,当所述第一路径目录中存在同名页面快照时,替换同名页面快照;

204、获取所述页面快照的第一路径目录与正常页面快照的第二路径目录;

205、根据所述第一路径目录与所述第二路径目录,比对所述页面快照与所述正常页面快照,获得比对结果;

206、若所述比对结果为目录存在差异,则触发页面异常告警;

本发明实施例中,将web站点页面内容的信息类型分为文本类型与非文本类型,并分别保存相应的页面内容快照,由此可通过直接比对页面内容的方式实现更精准地页面监控。

请参阅图3,本发明实施例中web站点页面监控方法的第三个实施例包括:

301、读取当前访问web站点页面的页面内容,并保存为页面快照;

302、获取所述页面快照的第一路径目录与正常页面快照的第二路径目录

303、根据所述第一路径目录与所述第二路径目录,比对所述页面快照与所述正常页面快照,获得比对结果;

本实施例中,若所述页面快照为文本快照,则对所述页面快照和所述正常页面快照进行文本比对;若所述页面快照为非文本快照,则对所述页面快照和所述正常页面快照进行MD5值比对;

304、若所述比对结果为目录存在差异,则触发页面异常告警;

305、若所述比对结果为目录相同,则确定当前访问的web站点正常;

306、当触发页面异常告警后触发人工复核,并在人工复核通过后,重命名所述第二路径目录,并复制所述第一路径目录以及将复制的所述第一路径目录置为所述第二路径目录。

本实施例中,人工复核后,若确认当前访问页面的修改是正确的,则执行所述重命名所述第二路径目录,并复制所述第一路径目录以及将复制的所述第一路径目录置为所述第二路径目录的步骤,否则仅修正错误页面。

本发明实施例中,通过比对MD5值来确定页面中非文本类型内容是否正常显示,有效地提高了web站点页面监控的精确度。人工复核通过后的目录复制步骤保存了web站点的历史版本记录,同时由于单独存储页面更新前后的页面快照,本实施例亦可用于页面内容更新后的核查。

上面对本发明实施例中web站点页面监控方法进行了描述,下面对本发明实施例中web站点页面监控装置进行描述,请参阅图4,本发明实施例中web站点页面监控装置的一个实施例包括:

读取模块401,用于读取当前访问web站点页面的页面内容,并保存为页面快照;

获取模块402,用于获取所述页面快照的第一路径目录与正常页面快照的第二路径目录;

比对模块403,用于根据所述第一路径目录与所述第二路径目录,比对所述页面快照与所述正常页面快照,获得比对结果;

告警模块404,用于若所述比对结果为目录存在差异,则触发页面异常告警。

可选的,在一实施例中,所述读取模块401具体用于:

读取当前访问web站点页面的页面内容;根据所述页面内容的信息类型,将所述页面内容保存为对应类型的页面快照,并以所述web站点页面的页面标题及url进行命名;将所述web站点页面对应的页面快照保存至所述第一路径目录,其中,当所述第一路径目录中存在同名页面快照时,替换同名页面快照。

本发明实施例中,通过对当前访问页面的页面内容进行处理,获取对应的页面快照,并与正常页面快照进行比对,依据比对结果判断当前页面是否显示异常。自动监控web站点页面极大地节省了人力成本与时间成本,并且用直接对比页面内容的方式可以实现更全面地监控,提高了页面监控的精确度,同时能够有效地识别DNS劫持、非法篡改web站点页面内容等问题。

请参阅图5,本发明实施例中web站点页面监控装置的另一个实施例包括:

读取模块401,用于读取当前访问web站点页面的页面内容,并保存为页面快照;

获取模块402,用于获取所述页面快照的第一路径目录与正常页面快照的第二路径目录;

比对模块403,用于根据所述第一路径目录与所述第二路径目录,比对所述页面快照与所述正常页面快照,获得比对结果;

告警模块404,用于若所述比对结果为目录存在差异,则触发页面异常告警。

预处理模块405,用于向待访问的web服务器发送访问请求,并获取所述访问请求对应的响应状态码,进行预处理。

更新模块406,当触发页面异常告警后触发人工复核,并在人工复核通过后,重命名所述第二路径目录,并复制所述第一路径目录以及将复制的所述第一路径目录置为所述第二路径目录。

可选的,在一实施例中,所述读取模块401包括:

页面读取单元,用于读取当前访问web站点页面的页面内容;

快照存储单元,用于根据所述页面内容的信息类型,将所述页面内容保存为对应类型的页面快照,并以所述web站点页面的页面标题及url进行命名;将所述web站点页面对应的页面快照保存至所述第一路径目录,其中,当所述第一路径目录中存在同名页面快照时,替换同名页面快照。

可选的,在一实施例中,所述快照存储单元还可以具体用于:

若所述页面内容的信息类型为文本类型,则将所述页面内容保存为文本快照;

若所述页面内容的信息类型为非文本类型,则生成所述页面内容的MD5值,并将所述MD5值保存为对应类型的页面快照。

可选的,在一实施例中,所述比对模块403还可以具体用于:

若所述页面快照为文本快照,则对所述页面快照和所述正常页面快照进行文本比对;若所述页面快照为非文本快照,则对所述页面快照和所述正常页面快照进行MD5值比对。

可选的,在一实施例中,所述预处理模块405具体用于:

向待访问的web服务器发送访问请求,并获取所述访问请求对应的响应状态码;判断所述响应状态码是否为预置数值;若为所述预置数值,则确定待访问的web站点页面正常,并执行所述读取当前访问web站点页面的页面内容,并保存为页面快照的步骤,否则触发页面异常告警。

本发明实施例中,本发明实施例中,将web站点页面内容的信息类型分为文本类型与非文本类型,并分别保存相应的页面内容快照,通过比对MD5值来确定页面中非文本类型内容是否正常显示,有效地提高了web站点页面监控的精确度。

上面图4和图5从模块化功能实体的角度对本发明实施例中的web站点页面监控装置进行详细描述,下面从硬件处理的角度对本发明实施例中的计算机设备进行详细描述。

图6是本发明实施例提供的一种计算机设备的结构示意图,该计算机设备500可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上处理器(centralprocessing units,CPU)510(例如,一个或一个以上处理器)和存储器520,一个或一个以上存储应用程序533或数据532的存储介质530(例如一个或一个以上海量存储设备)。其中,存储器520和存储介质530可以是短暂存储或持久存储。存储在存储介质530的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对计算机设备500中的一系列指令操作。更进一步地,处理器510可以设置为与存储介质530通信,在计算机设备500上执行存储介质530中的一系列指令操作。

计算机设备500还可以包括一个或一个以上电源540,一个或一个以上有线或无线网络接口550,一个或一个以上输入输出接口560,和/或,一个或一个以上操作系统531,例如Windows Serve,Mac OS X,Unix,Linux,FreeBSD等等。本领域技术人员可以理解,图6示出的计算机设备结构并不构成对计算机设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。

本发明还提供一种计算机设备,所述计算机设备包括存储器和处理器,存储器中存储有计算机可读指令,计算机可读指令被处理器执行时,使得处理器执行上述各实施例中的所述web站点页面监控方法的步骤。

本发明还提供一种计算机可读存储介质,该计算机可读存储介质可以为非易失性计算机可读存储介质,该计算机可读存储介质也可以为易失性计算机可读存储介质,所述计算机可读存储介质中存储有指令,当所述指令在计算机上运行时,使得计算机执行所述web站点页面监控方法的步骤。

所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(read-only memory,ROM)、随机存取存储器(random access memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

相关技术
  • web站点页面监控方法、装置、设备及存储介质
  • 页面监控方法、装置、设备及计算机存储介质
技术分类

06120113822230