掌桥专利:专业的专利平台
掌桥专利
首页

从远程网络区域进行内容检索的系统及方法

文献发布时间:2023-06-19 12:02:28


从远程网络区域进行内容检索的系统及方法

本发明专利申请是申请日为2015年12月7日、申请号为201580066318.2、发明名称为“从远程网络区域进行内容检索的系统及方法”的发明专利申请的分案申请。

本申请要求以下申请的优先权:2014年12月8日提交的申请号为No.62/089,113的美国临时申请;2015年1月6日提交的申请号为No.62/100,406的美国临时申请;2015年1月28日提交的申请号为No.62/108,987的美国临时申请;2015年4月7日提交的申请号为No.62/144,293的美国临时申请;2015年4月22日提交的申请号为No.62/151,174的美国临时申请;以及2015年6月11日提交的申请号为No.62/174,394的美国临时申请,所有这些申请都通过引用并入本文

技术领域

本申请涉及网络技术,更具体地,涉及经由远程接入点服务器检索区域内容。

背景技术

在互联网的客户端-服务器拓扑中,客户端到服务器的距离越远,二者之间的延迟或往返时间(RTT)就会越高,数据请求的执行和传递也就会越慢。客户端和服务器之间的中间网络设备的跳的次数被定义为跳数,该跳数受到生存时间(TTL)的互联网协议限制,也称为跳数限制,其定义了在一个数据包被丢弃而无法投递之前,跳数允许的最大数量。这种TTL限制是为了防止由于不可路由的数据包而导致的拥塞,否则这些数据包将无限期地阻塞管道。当进行长距离连接时,这种安全机制也可能导致可传递的数据包出现问题。当一个数据包在传递时,会从TTL中减去该数据包跳的整数。一旦TTL达到零,则这个数据包将被丢弃。因此,即使路径很好,如果它的跳数太多,那么它仍然会被认为是无法传递的。

内容分发网络(CDN)被发展用来从托管的服务器以及与请求客户端尽可能近的CDN服务器上带来克隆拷贝内容。当之前被远程托管的数据现在被缓存到离请求客户端足够近的服务器上后,这些CDN服务器得到了显着的性能提升。距离越短,延迟就越低,跳数也会越少,内容也将被传递的更快。如果内容在全局范围内相同(在任何地方都一样),这表示需要性能增益。

在一些情况下,地区不同而导致内容不同,但是可以通过同一个通用资源定位符(URL)来获取内容,基于地理位置机制,例如地图标记,其自动给客户端设备发送流量(traffic)。这样会带来一个问题,因为仅有提出请求的地区的内容被服务。然而,终端用户希望能够从不同的地理位置获得内容。

为了从另一个区域获取内容,一些用户手动强制流量从公共代理或代理服务器传输,由于一些原因的存在,这种做法也存在限制。它可能很慢,通常也是不安全的,因为在大多数情况下,用户并不控制流量通过的代理服务器。该方法通常需要手动配置。它是点对点,使得它们不得不在一个区域内执行/检索代码,然后在另一个区域通过另一个不同的代理服务器重新配置代理客户端来检索内容,并依此类推。这不仅耗时,而且也不能同时观看来自多个地区的内容。在客户端和代理服务器之间,以及代理服务器和目标内容服务器之间的网络路径,没有控制可以被执行。这也同样会导致低传输速度及低带宽。

软VPN的也可以用来解决这个问题,但在无法在网络中间或类似的代理服务器中控制网络,因为它这些都只是点至点,需要针对每个区域配置使用。

鉴于上述情况,可以理解是,针对面向多个区域的、具有低延迟和低跳数的、多个的、并发安全的、快速的信号流,具有强烈的需求。

发明内容

公开了一种通过远程接入点服务器来检索区域内容的系统及方法。在一个实施例中,本申请涉及一种用于从远程网络区域进行内容检索的网络系统。该网络系统可以包括第一设备。所述第一设备可以被配置为接收关于内容的请求。所述内容可以在一个或多个处于远程网络区域的内容服务器上。所述第一设备可以被进一步配置为至少执行以下中的至少一个:通过隧道转发所述请求到与所述一个或多个内容服务器接近的目标接入点服务器,并从所述目标接入点服务器接收所述内容,从所述第一设备的缓存中获取所述内容。

根据本实施例的其他方面,目标接入点服务器被配置为从所述一个或多个内容服务器中提取所述内容。

根据本实施例的其他方面,在所述第一设备和所述目标接入点服务器之间,所述网络系统还包括一个或多个中间隧道,用于连接一个或多个中间接入点服务器和一个或多个中间路由设备。

根据本实施例的其他方面,所述中间接入点服务器和所述目标接入点服务器中的至少一个被配置为执行域名系统查找,用以定位所述一个或多个内容服务器。

根据本实施例的其他方面,所述中间路由设备、所述第一设备、所述中间接入点服务器和所述目标接入点服务器中的至少一个被配置为从缓存中执行域名系统查找,用以定位一个或多个内容服务器。

根据本实施例的其他方面,所述中间路由设备、所述中间接入点服务器和所述目标接入点服务器中的至少一个被配置为缓存所述内容。

根据本实施例的其他方面,该缓存的内容在所述中间路由设备、所述第一设备、所述中间接入点服务器和所述目标接入点服务器之间被同步。

根据本实施例的其他方面,所述中间路由设备、所述第一设备、所述中间接入点服务器和所述目标接入点服务器中的至少一个被配置为执行压缩所述内容及解压缩所述内容中的至少一个。

根据本实施例的其他方面,所述中间路由设备和所述第一设备中的至少一个被配置为基于全局虚拟网络执行智能路由。

根据本实施例的其他方面,所述智能路由基于最佳带宽、最少延迟、最少跳数以及无数据包丢失中的至少一个。

根据本实施例的其他方面,所述智能路由基于实时统计和历史统计中的至少一个。

根据本实施例的其他方面,所述目标接入点服务器还被配置为同时从所述一个或多个内容服务器提取所述内容。

根据本实施例的其他方面,来自所述一个或多个内容服务器的所述内容包括一个或多个链接,所述一个或多个链接指向作为组成部分的附加内容。

根据本实施例的其他方面,所述目标内容服务器还被配置为从所述一个或多个链接中提取内容。

根据本实施例的其他方面,所述一个或多个链接的内容从包含所述一个或多个链接的页面的内容所在的远程区域被提取。

根据本实施例的其他方面,所述目标接入点服务器还被配置为同时从所述一个或多个链接中提取所述内容。

根据本实施例的其他方面,所述内容被验证过。

根据本实施例的其他方面,所述验证基于文件大小检查和散列检查中的至少一个。

在另一个实施例中,本申请涉及一种从远程网络区域进行内容检索的方法,根据该方法,关于内容的请求能够第一设备接收。其中所述内容位于远程网络区域中的一个或多个内容服务器上。该请求能够通过隧道转发所述请求到与所述一个或多个内容服务器接近的目标接入点服务器,来自所述目标接入点服务器的所述内容能够被接收。所述内容能够从所述第一设备的缓存中获取。

在另一个实施例中,本申请涉及一种非暂态计算机可读介质,存储有从远程网络区域进行内容检索的计算机可读程序。该计算机程序包括计算机可读指令,用于通过第一设备接收关于内容的请求。所述内容位于远程网络区域中的一个或多个内容服务器上。该程序包括计算机可读指令用于通过隧道转发所述请求到与所述一个或多个内容服务器接近的目标接入点服务器,并从所述目标接入点服务器接收所述内容。该程序包括计算机可读指令用于从所述第一设备的缓存中获取所述内容。

现在将参照附图中所示的特定实施例来更详细地描述本申请内容。尽管下面参考特定实施例描述了本申请,但是应当理解,本申请不限于此。能够获得教导的本领域普通技术人员,能够在本申请的范围内意识到其他实现方式、修改方式和实施例以及在其他领域的使用,并且相对于本申请可能具有显着的效用。

附图说明

为了更好地理解本申请,附图中增加了相应的附图标记,其中相同的元件以相同的附图标记表示。这些附图不应被解释为对本申请的限制,而是仅仅是说明性的。

图1示出了通过用于从主机(客户端)到主机(服务器)的数字IP地址的路由的互联网域名系统(DNS)的查找来解释通用资源定位符(URL)的框图。

图2示出了描述CDN方案(resolution)和内容传递的框图,其中内容是全局相等的。

图3示出了描述CDN方案(resolution)和区域特定内容传递的框图。

图4示出了描述CDN方案(resolution)和具有明显阻塞区域特定内容传递的框图。

图5示出了代理服务器的工作原理的框图。

图6示出了根据本申请的实施例的经由全局虚拟网络(GVN)的地理目标DNS解析和内容传递的框图。

图7示出了根据本申请的实施例示出的带有GVN的高级智能路由(ASR)流程图。

图8示出了根据本申请的实施例示出的带有GVN的地理目标机制(GDM)框图。

图9示出了根据本申请的实施例示出的端点设备与带有GVN的接入点服务器连接的软件架构的框图。

图10示出了根据本申请的实施例的接入点服务器的操作框图。

具体实施方式

在一些实施例中,本文所公开的区域内容检索使用以下组合:智能路由、隧道通过全局虚拟网络(GVN)设备的网格拓扑来到达位于目标地理位置的接入点服务器(SRV_AP)、内容提取代理与内容传递代理一起工作、链缓存、以及当内容物理上位于制定的希望区域时,允许主机(客户端)从指定所希望的区域获取内容并从那里接收内容的其他实施例。高级智能路由以及单点到多点的拓扑为来自多个远程区域的并发流带来了优势,该多个远程区域由源主机(客户端)或目标主机(服务器)或目标URL等定义。

在一些实施例中,每个请求可以经由位于其附近的端点设备(EPD)上的内容传递代理(CDA)被路由到它们选择的地理目标。从其中希望的内容定位在主机(服务器)上的区域中的SRV_AP服务器中,将来自多个目标地理区域的内容作为每个请求的独立流通过为其运行的内容提取代理(CPA)同时被提供给它们。SRV_AP服务器也可以同时从多个内容服务器提取内容。为了提高性能和增加速度,获取的文件和流的内容可以通过链接缓存作为单个文件或组合文件的集合发送。发送CDA与CPA之间的用以执行和数据流操作的回馈控制和输入交互,并从本地缓存中传递由位于EPD上的CDA提供的获取内容。

在一些实施例中,流量从GVN流到带有CPA的SRV_AP,CPA紧邻位于期望地理位置的目标内容服务器。数据流量以经由穿过SRV_AP的、封装的且模糊化的隧道的安全的高级智能路由(ASR)传输经过的方式流经链路缓存,然后到达EPD上的原始提出内容请求的CDA。

在一些实施例中,本文公开的系统中的设备可以接收和/或截取那些否则将会成为直通的内容请求。

图1-5示出了在有和没有内容传递网络(CDN)的情况下,互联网如何从主机服务器向主机客户端传递内容。CDN具有优势,但针对区域不同而内容不同,需要克服一些严重的限制。本背景信息是为了提供一个背景透视,展示为什么本文所披露的技术能够提供更好、更稳健的服务质量(QoS)。

图1示出了通过用于从主机(客户端)到主机(服务器)的数字IP地址的路由的互联网域名系统(DNS)的查找来解释通用资源定位符(URL)的框图。作为文件或流或数据块的从主机客户端(C)101到主机服务器(S)301的内容请求或推送,沿着001的方向流动。作为文件或流或数据块的响应002,从主机S传递到主机C。作为客户端-服务器(C-S)关系中的主机客户端设备101请求从远程主机S访问内容,或者通过通用资源定位器(URL)或其他网络可到达地址向远程主机S发送数据。

从主机客户端到互联网的连接被标记为P01-从客户端101到直接面对的POP 102的连接,或者该连接也可以位于局域网(LAN)中,然后局域网(LAN)经由存在点(POP)可以连接到互联网,存在点(POP)可以视为最后一公里的连接。存在点(POP)102代表通过它们自己的网络或内部链接,从互联网服务提供商(ISP)提供的一个末端到互联网的一个连接。如果URL是域名而不是数字地址,则将该URL发送到域名系统(DNS)服务器103,在此将域名转换为IPv4或IPv6或其他用于路由目的的地址。

从客户端101到服务器301的流量通过互联网120路由,代表多个POP(102和302)之间进行的传输,包括对等、回程或其他网络边界传输。

从POP 102到DNS 103的连接P02,用于从通用资源定位器(URL)中查找数字地址,以获得目标服务器的IPv4地址或其他数字地址,这样能够直接从POP102或通过互联网120来接触目标服务器。从ISP的POP 102到互联网120的连接P03可以是单宿主的(single-honed)或是多宿主的(multi-honed)。从互联网120到ISP的或互联网数据中心(IDC)的面向互联网的POP 302之间,存在连接P04。从服务器的POP 302到主机301的连接P05可以是直接的或经由多跳的。

通过域名系统从名称到数字地址的查找是当今互联网上的标准,并假设DNS服务器是一体的,其结果是最新的且可以被信任的。

图2示出了描绘CDN方案(resolution)和内容传递的框图,其中内容是全局等同的。图2包括各种网络路径(例如,P001,P002等)。当向客户端提供内容时,内容传递网络(CDN)可以在速度和灵活性以及负载平衡方面带来明显的优势。内容请求001从主机客户端(C)101流向主机服务器(S),内容传递的应答002以分组化文件或数据流或数据块的形式,从主机S返回到主机C。

主机客户端101可以是充当客户端-服务器(CS)关系中的客户端的诸如膝上型计算机、台式计算机、电话、平板电脑或其它设备的设备。它通过通用资源定位器(URL)使请求访问由远程主机服务器提供的内容。

POP 102、DNS服务器103、互联网120以图1所示相同的方式操作。

在CDN基础设施的情况下,CDN地图标记201与CDN控制服务器202或类似机制协调,用以确定客户端设备位于哪个区域,以及确定将要服务的哪个CDN服务器与之连接。

如果客户端101在区域A中,通过区域A中的服务器的POP 403,它将被路由到区域A中的CDN服务器503。区域B中的客户端101将经由区域B中的服务器的POP402连接到区域B中的CDN服务器502。区域C中的客户端101将通过区域C中的服务器的POP 401连接到区域C中的CDN服务器501。

在该示例中,对于所有服务的内容存在内容等同物,并且501、502和503的每个CDN服务器具有来自原生(origin)服务器601的精确克隆的内容副本。

当内容是全局等同的,例如,来自区域A、B和C的在CDN服务器上服务的相同内容,将等同地从原生服务器601复制,原生服务器601用于向内容服务器提供内容。

如果CDN地图标记服务器位于远离客户端设备的区域中,初始CDN地图标记201通过P001经由102至P003的查找可能非常快,或者可能会使用相对较多的查找时间。一旦完成查找,流量将通过P006流向最接近或最好的可用CDN服务器。

为了说明该图,将区域定义为与另一地理区域不同的地理区域。它不一定必须代表一个较大的领域,但也可以代表一个较大的区域,它也可以代表从一个地区到另一个地区很远的距离,或者它们可能非常近。关键是一个地区的客户端将通过特定区域的CDN服务器接收内容,而不是从另一个区域接收内容。

图3示出了描绘CDN方案(resolution)和传递区域特定内容的的框图。图3包括各种网络路径(例如,P001,P002等),图3类似于图2,它们之间的主要区别在于每一区域的内容与其他区域的内容不同。在CDN服务器501、502和503和原始服务器601之间,是内容区域服务器701、702和703,其将区域特定内容发布到每个区域中的CDN服务器,每个区域中的CDN服务器给各自区域内的客户端提供服务。

图4示出了描述CDN方案(resolution)和具有明显阻塞区域特定内容传递的框图。图4包括各种网络路径(例如,P001,P002等),当一个区域中的客户端101想要来自另一区域的服务器502或503所服务的内容时,无论它们做什么,它们将仅能从其所在区域内的服务器501获取内容。即使它们试图强制连接到它们希望接收内容的地区的内容服务器,它们也不能访问其他内容。它们将持续的被提供其所在区域内容,而没有其它的选择。本地DNS查找103解析的IP仅指向其区域内的CDN服务器501。这归结于全局IP地址仅映射到其区域中的CND(如果全局IP)或其他原因。结果是客户端在路径P007或路径p008将被阻挡。

基于当前地理位置的路径P005的正常连接不受阻塞,流量能够流动,从而主机(客户端)101通过服务器501接收该地理位置的内容。

对于与当前地理位置不同的目标区域502和503,在路径P007和/或路径P008处停止业务,并且主机(客户机)被来自远程地理目标的内容拒绝。根据CDN控制系统202的配置和策略,它们可能被强制到其当前位置501中的服务器,或者接收不到任何内容,或者仅仅接收错误消息,或者接收仅仅是不是期望的内容。

图5显示了代理服务器的如何工作的框图。内容请求或推送001从主机客户端(C)101流向主机服务器(S)301,且可以包括分组化文件或数据流或数据块。内容传递001从目标主机301流向客户机主机101,且可以包括分组化文件或数据流或数据块。

客户端101,作为客户端-服务器(CS)关系中客户端设备,通过通用资源定位器(URL)或数字IP地址等请求从远程主机、服务器访问内容。

该请求流经GW设备,该GW设备运行在主机客户机101上运行的代理客户端软件510。该代理客户端经由隧道连接到代理服务器,经由从GW510到存在点(POP)540的路径P530进行加密或解密,然后经过作为WAN550一部分的互联网到达路径P532,进而到达位于远程区域的代理服务器。流量从代理服务器560经由路径P533流出到开放的互联网120中,并且经由P534通过POP 542及P535连接到目标区域中的主机服务器103。

主机服务器将流量视为来自代理服务器的IP地址和地理位置。如果此IP与目标区域中的服务器定义的区域相同,则将提供所需的内容。为了便于本地化,代理服务器通常将连接到与代理服务器所在的相同区域中的DNS服务器570。

为了解决图1至图5所述的问题和限制。图6至图9说明了地理目标的操作方式以及其可能的应用。存在更多的可行性来应用这种机制和方法。

图6示出了根据本申请的实施例的经由全局虚拟网络(GVN)的地理目标DNS解析和内容传递的框图。在一些实施例中,端点设备内的高级智能路由可以通过直接连接到作为本地连接的互联网,或经由到全局虚拟网络(GVN)的隧道及其网络的服务器和其他设备的路由来传递流量。可以通过多种路径来实现来自目标区域中的内容服务器的内容检索。图6示出了各种可能的路径,用以说明本文公开的技术的一些功能。

在一些实施例中,主机客户端101通过P618连接到局域网(LAN)620,并且从那里到达终端设备630。EPD内的智能路由将通过多个隧道P611至P615之一,将流量路由到存在点(POP)632。这些路径可以流过如下的存在点(pop):

P611通过POP 632连接到P611-1,并通过互联网641经由路径P611-2连接到主机服务器651,主机服务器651与主机客户端101处于相同的目标区域。这个例子可以用于主机客户端的位置非常接近内容或CDN服务器的情况,此时主机客户端不通过GVN。

P612是安全隧道,其通过路径P612-1、WAN 672和路径P612-2,将POP 632连接到接入点服务器(SRV_AP)662。位于SRV_AP 662的内容提取代理(CPA),通过P612-3、互联网642和路径P612-4,可以在DNS682处执行DNS查找。当SRV_AP 662上的CPA接收到查找的数字地址结果时,它通过P612-5从主机服务器652请求内容。P613是一种安全隧道,其行为方式与P612(例如,P613-1,P613-2和WAN 673)相同,并且能够达到类似的效果,其唯一的区别是隧道连接到第一个SRV_AP 663,然后通过另一个隧道P613-3到WAN 673-1再到P613-4再到另一个SRV_AP 663-2,并从那里从主机目标服务器653检索内容,并通过互联网693,其方式SRV_AP 662的操作方式类似。

P614是一种安全通道,其工作方式与P612(例如,P614-1,P614-2,P614-3,P614-4,WAN 674,SRV_AP 664,Internet 644,目标654)的行为方式相同。不同之处在于DNS查找来自EPD 630内的缓存。从那里,高级智能路由将流量下发至SRV_AP 664,用以从主机服务器654检索内容,而不在目标区域中进行DNS查找。

P615是安全隧道,P615-1通过WAN 675到P615-2桥接到SRV_AP 665,SRV_AP 665桥接到另一个隧道P615-3,P615-3通过WAN 675-1到P615-4,在此,隧道向EPD 631完成了一个安全的桥接。流量从EPD 631通过P615-5流出到目标区域中的POP 635。通过P615-6,DNS查找能够从POP 635到DNS服务器进行。DNS查找还可以通过在EPD631的缓存中查找完成,或通过互联网645向该区域或另一位置中的另一个DNS服务器进行DNS查找来完成。来自主机服务器655的内容通过P615-8被提取到互联网645、接入点635、EPD631,以回送至EPD 630。在一些实施例中,EPD 631可以将缓存的内容发送到EPD 630。在其他实施例中,EPD 631可以从主机655中提取内容。

图7示出了根据本申请的实施例示出的带有GVN的高级智能路由(ASR)流程图。图7说明了高级智能路由(ASR)如何在全局虚拟网络中运行。图7包括各种局域网(例如,702,704)、互联网(例如,707,729)、SRV_AP(例如,710,719)、多个POP(例如,728,717)、WAN(例如,18),客户端(例如101,716,)、EPD(703,721)、DNS(例如,714,706)以及路径(P701-P731)。

从连接到终端设备(EPD)703的局域网(LAN)702中的主机客户端设备101的起始点,GVN可向EPD 703提供多个到多个潜在终端点的连接路径。这是分组可以采用的路由逻辑的高级视图,因为它利用ASR来转换GVN以获得最佳性能。从主机客户机101的角度来看,它们的流量将流过具有少量跳数的互联网协议(IP)网络,并且在GVN的第三层处可能出现最佳延迟。GVN的第一层是基础互联网,可以自动配置虚拟接口、隧道、路由和其他网络策略。GVN的第二层是算法、软件和逻辑用来管理第三层和第一层操作的地方。

第一主路由决定在包含EPD 703内的逻辑门704处,此时,流量经由路径P704流出到EPD 703所在的本地互联网707,或者便是通过P707经过安全封装和混淆的隧道到达接入点服务器(SRV_AP)710,SRV_AP710提供其所在区域的最佳连接。在流量出口SRV_AP 710之前,它通过路由逻辑门711。本地到互联网713的流量将经由路径P711到达主机客户端715或主机服务器716。如果流量不是本地的,而是被中继到另一个区域,它将通过路径P716通过隧道P718到达下一个SRV_AP 719。

在SRV_AP 719中,在许多可能的路由选项中,流量可以采用路径的三个选项被示出。可以存在逻辑门726,用以确定流量是否应当保持并且出口到本地互联网729,然后到达目标731/732,并且可能通过在730处的DNS查找,或者如果它应该经过P726的隧道到另一个区域的SRV_AP 727。通过路径P719示出了另一种可能性,该P719演示了在远程区域中从SRV_AP 719到另一EPD 721的隧道。这是通过多个桥接隧道连接的EPD 703至EPD 721。

进一步可能是便是,通过EPD的连接P721,使流量到达客户端设备725/723,所述客户端设备725/723位于EPD721所处的局域网722中。

图8示出了根据本申请的实施例示出的带有GVN的地理目标机制(GDM)框图。地理目标机制描述了利用覆盖在互联网上的GVN提供的优势的系统。它是一个安全隧道系统,当请求客户端在所在的区域被阻断后,能够通过接入点服务器智能路由到另一个区域的出口点,用以获取远程内容。图8包括各种路径(例如,P802-P818,P821-P826和P830-P834)、缓存(例如,821-823)、SRV_AP(例如,831和832)、WAN(例如,850和851)、互联网(例如,810)、DNS(例如,804,860)、POP(例如,870),客户端101以及主机对象840。

GVN将设备从LAN 802连接到远程主机服务器803或客户端,客户端或者在互联网810之上,或者在另外一个LAN中。GVN的另一个优点是,当客户端位于远程区域时,它可能允许远程设备从该远程区域的服务器中提取数据文件和流。这个优点克服了开放式互联网上路由效率低下、地理阻塞、跳数过多或其他问题的限制。高级智能路由(ASR)确保通过GVN获得最佳路径,以及链接的缓存821/822/823提取数据进入接入点服务器(SRV_AP)832,并让此数据可以尽快发送。其中,链接的缓存821/822/823与内容传递代理(CDA)803协调一致工作,内容传递代理(CDA)803向提取代理(CPA)830请求数据。

在该实施例中,当主机客户端101希望从目标区域中的主机服务器840获取内容时,可以从DNS 804进行域名系统(DNS)查找或查询其CDA内的地理目标DNS缓存,用以将统一资源定位器(URL)转换成数字地址。基于该数字IP地址,ASR将流量路由到最接近目标内容的SRV_AP 832。

EPD 808产生隧道P802连接WAN 850至P803再至第一个RV_AP 831,通过第二隧道P804至WAN851至P805,RV_AP 831连接到目标SRV_AP 832。CPA 830连接到主机服务器840以获取内容。在该内容是网页的情况下,CPA 830将下载内容并进行解析以制作链接列表,并从该链接列表中将内容作为文件和流(来自众多来源)提取。今天许多网站都提供来自许多不同服务器的图像、文件、内容、视频流和其他内容。该内容的URL链接需要编入索引,CPA将对该地区的所有URL执行DNS服务器860的DNS查找。

CPA 830将获取并缓存内容到缓存821中,缓存821与SRV_AP 832连接。缓存中的内容可以是单独的文件或一组文件或二者的组合。

缓存821到缓存822之间的内容可以动态的在SRV_AP 831上同步,SRV_AP 831是介于主机服务器840的区域和EPD803、主机客户端的区域之间的中间区域。从缓存822开始,内容可以在在EPD 803的位置动态同步到缓存823。一旦内容在EPD 803中,它可以由与EPD803连接的主机客户端101访问,EPD803与主机客户端101的连接可以通过EPD803,也可以直接连接。在其他实施例中,多个缓存之间的内容同步可以被调度。

在一些实施例中,本文中公开的地理目标机制从远程区域检索内容,就好像请求客户端在该区域中具有针对该内容的DNS查找以及在该区域中完成的所有关联流。

在一些实施例中,在靠近主机服务器的多宿主(multi-honed)数据中心中从强大的SRV_AP检索内容文件和流能够快速地将数据检索到SRV_AP中。

在一些实施例中,内容抽取代理830获取内容项,缓存它们,并将它们组合成合并体(amalgamation)或一团(glob)或文件块。这些能够被压缩并有效地传递回EPD803。

在一些实施例中,链接缓存在运行中中继数据。在一些实施例中,诸如831和832之类的SRV_AP经由国际回程通过大通道连接。在一些实施例中,多个SRV_AP被连接。通过将长途往返路径切换成彼此相连的一系列路径,可以提高数据传输吞吐量。

在一些实施例中,全局虚拟网络通过最有效的路由和隧道尽可能地路由流量。在一些实现中,有效路由可以基于实时统计。在其他实现中,有效路由可以基于历史统计。

图9示出了根据本申请的实施例示出的端点设备与带有GVN的接入点服务器连接的软件架构的框图。如图9所示,软件和硬件可以分布在网络设备内,跨越不同的电路板、处理器、网络接口卡和存储器。

端点设备(EPD)902和接入点服务器(SRV_AP)904可以彼此连接,该连接通过通信路径P903-A到存在点(POP)909-A,基于通信路径P903-B通过WAN 910到通信路径P903-C到POP909-B到通信路径P903-D。

EPD 902和SRV_AP 904的软件架构可以相似,除了与每个设备的作用不同。EPD902可以具有内容传递代理(CDA)D006,并且SRV_AP 904可以具有内容提取代理(CPA)D106。

每个设备的最低级别,内存D001/D101和处理器D002/D102和网络接口D003/D103可以在硬件级别。操作系统(O/S)D004/D104可以是LINUX系统或等效系统,如Debian或其他。操作系统D004/D104可以包括用于路由、托管(hosting)、通信和其他系统级操作的包和配置。

全局虚拟网络(GVN)操作系统的系统软件D005/D105可能存在于操作系统之上。系统软件D005/D105可以包括自定义命令、系统模块和在此操作的其他组成部分、以及GVN的其他组件。GVN的每种类型的设备可以具有系统软件的这些部分中的一些或全部,这取决于它们的作用。

在EPD 902上,内容发送代理D006可以作为远程SRV_AP 904上的请求客户端和内容提取代理D106之间的中间人。内容传递代理D006与内容提取代理D106之间的通信可以由缓存管理器D007/D107、压缩引擎D008/D108、连接管理器D009/D109处理,连接管理器D009/D109中可能包括路由D0010/D1010、连接D011/D111等模块及相关软件。它们之间的信息流可经从EPD902由路径P903-A出口,或经从SRV_AP 904由路径P903-D出口。

在SRV_AP 904上,除了与主机服务器908通信之外,内容传递代理D106可以在DNS910(经由路径P904)的目标区域中执行DNS查找。

在一些实施例中,缓存管理器D007/D107可以检查数据是否在任一方向上在缓存之间复制。缓存管理器D007/D107还可以检查复制的数据是一个完整的、精确的克隆副本。缓存管理器D007/D107还可以刷新旧内容,以确保其内存和存储器不会变得过于肿胀(bloated),并且还以最大的效率运行。压缩引擎D008/D108将根据流量压缩或解压缩数据。

在一些实施例中,连接性管理器D009/D109管理虚拟接口(VIF)、隧道、隧道聚合、网桥、以及与GVN的设备之间的连接相关的其他元件。

在一些实施例中,路由管理器D010/D110可以确保分组流经适当的VIF、隧道或出口流到开放互联网。

在一些实施例中,连接管理器D011/D111可以连续地对GVN的设备之间的隧道和各种连接进行测试、构建、销毁、链接和执行其他操作。

在一些实施例中,EPD 902经由路径P901和P902通过局域网902与客户端101通信。SRV_AP 904可以经由路由P905、P906和P907通过互联网906和POP 907与主机服务器904通信。

图10示出了根据本申请的实施例的接入点服务器的操作框图。

在一些实施例中,内容提取代理(CPA)D302驻留在SRV_AP 1000上。CPA D302可以从位于EPD 1014上的内容传递代理1012接收目标URL/URI。作为示例,客户端希望到达的目标地址位于客户端的另一个区域,该另一区域是客户端希望从中提取内容的区域。

CPA D302可以将请求地址传递给远程抓取机器人(R.F.BOT)D301。R.F.BOT D301可以执行DNS查找,然后使用该信息通过数据提取1006来放置内容。在一些实施例中,DNS信息通过数据库B304被缓存在缓存管理器D304中。在其他实施例中,DNS信息可以从诸如1010的DNS服务器获取。

R.F.BOT D301可以与CPA D302一起工作,以通过CP01解析所获取的结果,以寻找辅助内容的其他地址,该辅助内容能够被作为内容的一部分被提取。

内容可以包括图像1001、文本文件1002、各种格式的文件1003(如CSS,JS等格式)、来自第三方网站的文件1004。该内容可以驻留在内容主机服务器1040上。该内容可以驻留在多于一个的内容服务器上。多个请求可以存储在数据库B302中,以供CPA D302和R.F.BOTD301访问和将来参考。

在一些实施例中,可以并行的提取每个内容流1050/1051/1052/1053。

在一些实施例中,来自数据提取的内容1006可被传递到CPA D302并存储在数据库B302中。在其他实施例中,来自数据提取的内容可以传递给缓存管理器D303并存储在数据库B303中。缓存的内容可以作为文件块1005传递,也可以作为单独的文件传递。

根据从起始到地理目标区域的距离、文件类型和QoS,缓存中提取的文件可能会被聚集成一个文件,以便通过链接缓存进行统一传输,也可以作为并行发送、并发流的单个文件。

各种内容文件也可以一起集成到一个大文件中,因此,不是例如30个数据文件在长距离内单独控制和传输,它将是一个文件,但是该文件可作为多个流。然后在EPD侧解除封锁,再次变成30份文件。

本申请的范围不受本文所述的具体实施例的限制。实际上,除了本文所述的那些内容之外,基于前面描述和附图记载的内容,对本领域技术人员显而易见的其它实施例和针对本申请的修改,均落入本申请的保护范围内。此外,尽管在本文中已经针对至少一个特定目的在至少一个特定环境中的至少一个特定实现的上下文中描述了本申请,本领域普通技术人员将认识到其价值不限于此,并且本申请可以在任何数量的环境中有益地实现用于任何数量的目的。因此,应当本文所述的公开内容的最大宽度范围和精神来解释本文记载的权利要求。

此外,本申请公开了一下附记:

附记1.一种从远程网络区域进行内容检索的网络系统,包括:第一设备,所述第一设备被配置为:

接收关于内容的请求,所述内容位于远程网络区域中的一个或多个内容服务器上;以及

执行以下步骤中的至少一个:

通过隧道转发所述请求到与所述一个或多个内容服务器接近的目标接入点服务器,并从所述目标接入点服务器接收所述内容,以及从所述第一设备的缓存中获取所述内容。

附记2.根据附记1所述的系统,其中,所述目标接入点服务器被配置为从所述一个或多个内容服务器中提取所述内容。

附记3.根据附记2所述的网络系统,其中,在所述第一设备和所述目标接入点服务器之间,所述网络系统还包括一个或多个中间隧道,用于连接一个或多个中间访问指针服务器和一个或多个中间路由设备。

附记4.根据附记3所述的网络系统,所述中间接入点服务器和所述目标接入点服务器中的至少一个被配置为执行域名系统查找,用以定位所述一个或多个内容服务器。

附记5.根据附记3所述的网络系统,其中,所述中间路由设备、所述第一设备、所述中间接入点服务器和所述目标接入点服务器中的至少一个被配置为从缓存中执行域名系统查找,用以定位一个或多个内容服务器。

附记6.根据附记3所述的网络系统,其中,所述中间路由设备、所述中间接入点服务器和所述目标接入点服务器中的至少一个被配置为缓存所述内容。

附记7.根据附记6所述的网络系统,其中,所述高速缓存的内容在所述中间路由设备、所述第一设备、所述中间接入点服务器和所述目标接入点服务器之间被同步。

附记8.根据附记3所述的网络系统,其中,所述中间路由设备、所述第一设备、所述中间接入点服务器和所述目标接入点服务器中的至少一个被配置为执行压缩所述内容及解压缩所述内容中的至少一个。

附记9.根据附记3所述的网络系统,其中所述中间路由设备和所述第一设备中的至少一个被配置为基于全球全局虚拟网络执行智能路由。

附记10.根据附记9所述的网络系统,其中所述智能路由基于最佳带宽、最少延迟、最少跳数以及无数据包丢失中的至少一个。

附记11.根据附记9所述的网络系统,其中所述智能路由基于实时统计和历史统计中的至少一个。

附记12.根据附记2所述的系统,其中,所述目标接入点服务器还被配置为同时从所述一个或多个内容服务器提取所述内容。

附记13.根据附记2所述的网络系统,其中,来自所述一个或多个内容服务器的所述内容包括一个或多个链接,所述一个或多个链接指向作为组成部分的附加内容。

附记14.根据附记13所述的网络系统,其中,所述目标内容服务器还被配置为从所述一个或多个链接中提取内容。

附记15.根据附记14所述的网络系统,其中,所述一个或多个链接的内容从包含所述一个或多个链接的页面的内容所在的远程区域被提取。

附记16.根据附记13所述的网络系统,其中,所述目标接入点服务器还被配置为同时从所述一个或多个链接中提取所述内容。

附记17.根据附记2所述的网络系统,其中,所述内容被验证过。

附记18.根据附记17所述的网络系统,其中,所述验证基于文件大小检查和散列检查中的至少一个。

附记19.一种从远程网络区域进行内容检索的方法,包括:

由第一设备接收关于内容的请求,其中所述内容位于远程网络区域中的一个或多个内容服务器上;以及

执行以下步骤中的至少一个:

通过隧道转发所述请求到与所述一个或多个内容服务器接近的目标接入点服务器,并从所述目标接入点服务器接收所述内容,

以及

从所述第一设备的缓存中获取所述内容。

附记20.根据附记19所述的方法,还包括从所述一个或多个内容服务器提取所述内容。

附记21.根据附记19所述的方法,其中所述转发步骤还包括经由连接一个或多个中间访问指针服务器和一个或多个中间路由设备的一个或多个中间隧道来转发所述内容。

附记22.根据附记19所述的方法,还包括执行域名系统查找来定位所述一个或多个内容服务器。

附记23.根据附记22所述的方法,还包括从缓存中执行域名系统查找,用以定位所述一个或多个内容服务器。

附记24.根据附记21所述的方法,还包括将所述内容缓存到所述中间路由设备、所述中间接入点服务器和所述目标接入点服务器中的至少一个上。

附记25.根据附记24所述的方法,还包括在所述中间路由设备、所述第一设备、所述中间接入点服务器和所述目标接入点服务器之间同步。

附记26.根据附记19所述的方法,还包括执行压缩所述内容及解压缩所述内容中的至少一个。

附记27.根据附记19所述的方法,还包括基于全球全局虚拟网络执行智能路由。

附记28.根据附记27所述的方法,其中所述智能路由基于最佳带宽、最少延迟、最少跳数以及无数据包丢失中的至少一个。

附记29.根据附记27所述的方法,其中所述智能路由基于实时统计和历史统计中的至少一个。

附记30.根据附记20所述的方法,还包括同时从所述一个或多个内容服务器提取所述内容。

附记31.根据附记20所述的方法,其中,来自所述一个或多个内容服务器的所述内容包括一个或多个链接,所述一个或多个链接指向作为组成部分的附加内容。

附记32.根据附记31所述的方法,还包括从所述一个或多个链接中提取所述内容。

附记33.根据附记32所述的方法,还包括从包含所述一个或多个链接的页面的内容所在的远程区域提取所述一个或多个链接的所述内容。

附记34.根据附记32所述的方法,还包括同时从所述一个或多个链接中提取所述内容。

附记35.根据附记20所述的方法,其中,所述内容被验证过。

附记36.根据附记34所述的方法,其中,所述验证基于文件大小检查和散列检查中的至少一个。

附记37.一种非暂态计算机可读介质,存储有从远程网络区域进行内容检索的计算机可读程序,包括:

计算机可读指令,用于通过第一设备接收关于内容的请求,所述内容位于远程网络区域中的一个或多个内容服务器上;以及

用于执行以下步骤中的至少一个的计算机指令:

通过隧道转发所述请求到与所述一个或多个内容服务器接近的目标接入点服务器,并从所述目标接入点服务器接收所述内容,

以及

从所述第一设备的缓存中获取所述内容。

相关技术
  • 从远程网络区域进行内容检索的系统及方法
  • 从远程网络区域进行内容检索的系统及方法
技术分类

06120113148662