掌桥专利:专业的专利平台
掌桥专利
首页

文档处理方法、计算机终端及计算机可读存储介质

文献发布时间:2024-04-18 19:58:53


文档处理方法、计算机终端及计算机可读存储介质

技术领域

本申请涉及人工智能领域,具体而言,涉及一种文档处理方法、计算机终端及计算机可读存储介质。

背景技术

随着互联网和人工智能的流行,大模型对话服务的出现为文档信息检索功能奠定了基础。在相关技术中,在文档进行搜索时,一般所采用的方法是,对输入的文档进行文本内容提取,基于提取的文本内容进行搜索,反馈对应的搜索结果,从而实现对文档的搜索功能。大模型对话服务是对接收的问题,采用人工智能模型算法预测问题对应的答案,具备较好的对话体验。而将大模型对话服务应用于文档搜索时,在相关技术中所采用的方法是,将文档抽取出文本内容,之后从抽取出的文本内容中搜索出与问题对应的回答,但反馈回的回答是与问题对应的文档中的段落,而反馈的段落有时并不能完全与问题对应,因此,存在反馈对话结果不准确的问题。

针对上述的问题,目前尚未提出有效的解决方案。

发明内容

本申请实施例提供了一种文档处理方法、计算机终端及计算机可读存储介质,以至少解决在相关技术中基于文档进行对话时,存在反馈的对话结果不准确的技术问题。

根据本申请实施例的一个方面,提供了一种文档处理方法,包括:接收目标文档;将所述目标文档转换为结构化对象;接收询问语句;从所述结构化对象中搜索出与所述询问语句对应的文档区域;基于所述文档区域,确定所述询问语句对应的对话结果。

可选地,所述从所述结构化对象中搜索出与所述询问语句对应的文档区域,包括:确定与所述询问语句对应的多个搜索结果,其中,所述搜索结果包括候选标题或者候选段落内容;在所述结构化对象对应的结构为树结构的情况下,确定所述多个搜索结果在所述树结构中所对应的节点;基于所述多个搜索结果在所述树结构中所对应的节点,确定所述询问语句对应的文档区域。

可选地,所述基于所述多个搜索结果在所述树结构中所对应的节点,确定所述询问语句对应的文档区域,包括:获取节点数量阈值;确定包括的节点数量超过所述节点数量阈值的树结构区域;基于所述树结构区域,确定所述询问语句对应的所述文档区域。

可选地,所述基于所述树结构区域,确定所述询问语句对应的所述文档区域,包括:检测所述树结构区域是否小于预定区域阈值;在检测结果为所述树结构区域小于预定区域阈值的情况下,确定所述树结构区域在所述目标文档中所对应的区域,为所述询问语句对应的所述文档区域。

可选地,所述基于所述文档区域,确定所述询问语句对应的对话结果,包括:获取与所述文档区域对应的提示词,其中,所述提示词用于提示将所述询问语句对应的结果以对话形式输出;基于所述文档区域和所述提示词,确定所述询问语句对应的所述对话结果。

可选地,所述基于所述文档区域和所述提示词,确定所述询问语句对应的所述对话结果,包括:将所述提示词和所述文档区域输入大语言模型,其中,所述大语言模型基于所述提示词的提示对所述文档区域进行分析,得到在所述提示下对所述文档区域进行分析后得到的分析结果;接收所述大语言模型反馈的所述对话结果,其中,所述对话结果由所述大语言模型基于对话词和所述分析结果生成,所述对话词与所述提示词对应。

可选地,在基于所述文档区域,确定所述询问语句对应的对话结果之后,还包括:将所述对话结果显示在与所述询问语句对应的对话框中。

可选地,所述方法还包括:将所述对话结果与所述文档区域进行匹配,得到所述对话结果在所述文档区域中出现的原始表述;以高亮显示的方式显示所述原始表述的在所述目标文档中的位置。

根据本申请实施例的另一方面,还提供了一种文档处理方法,包括:在显示界面上显示文档输入框;响应于对所述文档输入框的操作,接收目标文档,并将所述目标文档转换为结构化对象;在所述显示界面上显示对话框;响应于对所述对话框的输入操作,接收询问语句;响应于对所述询问语句的确认操作,在所述对话框显示与所述询问语句对应的对话结果,其中,所述对话结果基于与所述询问语句对应的文档区域确定,所述文档区域从所述结构化对象中搜索得到。

根据本申请实施例的又一方面,还提供了一种文档处理方法,包括:接收目标文档;将所述目标文档转换为结构化对象;接收询问语句;从所述结构化对象中搜索出与所述询问语句对应的文档区域;采用大语言模型基于所述文档区域,确定所述询问语句对应的对话结果。

可选地,所述采用大语言模型基于所述文档区域,确定所述询问语句对应的对话结果,包括:获取提示词,其中,所述提示词用于提示所述大语言模型对所述文档区域进行分析;基于所述提示词的提示,采用所述大语言模型对所述文档区域进行分析,得到分析结果;接收所述大语言模型反馈的所述对话结果,其中,所述对话结果由所述大语言模型基于对话词和所述分析结果生成,所述对话词与所述提示词对应。

根据本申请实施例的另一方面,还提供了一种文档处理装置,包括:第一接收模块,用于接收目标文档;第一转换模块,用于将所述目标文档转换为结构化对象;第二接收模块,用于接收询问语句;第一搜索模块,用于从所述结构化对象中搜索出与所述询问语句对应的文档区域;第一确定模块,用于基于所述文档区域,确定所述询问语句对应的对话结果。

根据本申请实施例的另一方面,还提供了一种文档处理装置,包括:第一显示模块,用于在显示界面上显示文档输入框;第三接收模块,用于响应于对所述文档输入框的操作,接收目标文档,并将所述目标文档转换为结构化对象;第二显示模块,用于在所述显示界面上显示对话框;第四接收模块,用于响应于对所述对话框的输入操作,接收询问语句;第三显示模块,用于响应于对所述询问语句的确认操作,在所述对话框显示与所述询问语句对应的对话结果,其中,所述对话结果基于与所述询问语句对应的文档区域确定,所述文档区域从所述结构化对象中搜索得到。

根据本申请实施例的还一方面,还提供了一种文档处理装置,包括:第五接收模块,用于接收目标文档;第二转换模块,用于将所述目标文档转换为结构化对象;第六接收模块,用于接收询问语句;第二搜索模块,用于从所述结构化对象中搜索出与所述询问语句对应的文档区域;第二确定模块,用于采用大语言模型基于所述文档区域,确定所述询问语句对应的对话结果。

根据本申请实施例的又一方面,还提供了一种电子设备,包括:存储器,存储有可执行程序;处理器,用于运行所述程序,其中,所述程序运行时执行上述任意一项文档处理方法。

根据本申请实施例的还一方面,还提供了一种计算机可读存储介质,包括:所述计算机可读存储介质包括存储的可执行程序,其中,在所述可执行程序运行时控制所述存储介质所在设备执行上述任意一项文档处理方法。

在本申请实施例中,采用基于询问语句对结构化文档信息进行搜索的方式,通过将目标文档转化为结构化对象,基于询问语句确定结构化对象中对应的文档区域,基于文档区域,确定询问语句对应的对话结果,由于基于结构化对象确定出的与询问语句对应的是文档区域,相对于相关技术中确定出的是与询问语句对应的段落而言,文档区域可以包括多个段落,即确定出的文档区域能够更为全面地与询问语句进行对应,更为准确地回答询问语句,因此,能够达到从文档中确定出与询问语句准确对应的对话结果的目的,从而实现了基于文档进行准确问答的技术效果,进而解决了在相关技术中基于文档进行对话时,存在反馈的对话结果不准确的技术问题。

容易注意到的是,上面的通用描述和后面的详细描述仅仅是为了对本申请进行举例和解释,并不构成对本申请的限定。

附图说明

此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:

图1示出了一种用于实现文档处理方法的计算机终端的硬件结构框图;

图2示出了一种用于实现文档处理方法的计算环境的结构框图;

图3示出了一种用于实现文档处理方法的服务网格的结构框图;

图4是根据本发明实施例1的文档处理方法一的流程图;

图5是根据本发明实施例1的文档处理方法二的流程图;

图6是根据本发明实施例1的文档处理方法三的流程图;

图7是根据本发明实施例1的可选的文档知识库问答检索系统框架图;

图8是根据本发明实施例2的文档处理装置一的示意图;

图9是根据本发明实施例3的文档处理装置二的示意图;

图10是根据本发明实施例4的文档处理装置三的示意图;

图11是根据本发明实施例5的计算机终端的结构框图。

具体实施方式

为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。

需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

首先,在对本申请实施例进行描述的过程中出现的部分名词或术语适用于如下解释:

智能文档处理(Intelligent Document Process,简称为IDP):指不同文件类型,通过智能化处理技术获得文件内容的相同结构体描述,将文件信息从其文件对象中剥离出来,并具有导出到系统的能力。

文档结构化:指对文件的一种信息描述方式,通常包含该文件的文本段落内容、文本层级关系、文本样式、文本内容、文本坐标等信息。

搜索:指通过文本相关性或者文本内容语义相关性,提供的一种以文本搜索相似内容文本的功能。

问答对话交流:指通过对话框,用户输入提示词或查询语句,系统根据用户提交语句进行回复。

键值(Key-Value,简称为KV)信息:指的是文本内容中提取的键-值的关系对,诸如,“用户名:xxx”,“用户名”为键,“xxx”为值,即描述“xxx”为“用户名”。

生成式预训练转换器模型(Generative Pre-training Transformer,简称为GPT):是一种基于互联网的,可用数据来训练的文本生成的深度学习模型,为一种通用预训练模型,和演化的GPT2、GPT3、GPT-J等在本申请中可统称为大语言模型。

实施例1

根据本申请实施例,提供了一种文档处理方法,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。

本申请实施例一所提供的方法实施例可以在移动终端、计算机终端或者类似的运算装置中执行。图1示出了一种用于实现文档处理方法的计算机终端(或移动设备)的硬件结构框图。如图1所示,计算机终端10(或移动设备)可以包括一个或多个(图中采用102a、102b,……,102n来示出)处理器102(处理器102可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)、用于存储数据的存储器104、以及用于通信功能的传输模块106。除此以外,还可以包括:显示器、输入/输出接口(I/O接口)、通用串行总线(UniversalSerialBus,USB)端口(可以作为BUS总线的端口中的一个端口被包括)、网络接口、电源和/或相机。本领域普通技术人员可以理解,图1所示的结构仅为示意,其并不对上述电子装置的结构造成限定。例如,计算机终端10还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。

应当注意到的是上述一个或多个处理器102和/或其他数据处理电路在本文中通常可以被称为“数据处理电路”。该数据处理电路可以全部或部分的体现为软件、硬件、固件或其他任意组合。此外,数据处理电路可为单个独立的处理模块,或全部或部分的结合到计算机终端10(或移动设备)中的其他元件中的任意一个内。如本申请实施例中所涉及到的,该数据处理电路作为一种处理器控制(例如与接口连接的可变电阻终端路径的选择)。

存储器104可用于存储应用软件的软件程序以及模块,如本申请实施例中的文档处理方法对应的程序指令/数据存储装置,处理器102通过运行存储在存储器104内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的文档处理方法。存储器104可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器104可进一步包括相对于处理器102远程设置的存储器,这些远程存储器可以通过网络连接至计算机终端10。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

传输装置106用于经由一个网络接收或者发送数据。上述的网络具体实例可包括计算机终端10的通信供应商提供的无线网络。在一个实例中,传输装置106包括一个网络适配器(Network Interface Controller,NIC),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输装置106可以为射频(Radio Frequency,RF)模块,其用于通过无线方式与互联网进行通讯。

显示器可以例如触摸屏式的液晶显示器(LiquidCrystalDisplay,LCD),该液晶显示器可使得用户能够与计算机终端10(或移动设备)的用户界面进行交互。

图1示出的硬件结构框图,不仅可以作为上述计算机终端10(或移动设备)的示例性框图,还可以作为上述服务器的示例性框图,一种可选实施例中,图2以框图示出了使用上述图1所示的计算机终端10(或移动设备)作为计算环境201中计算节点的一种实施例。图2示出了一种计算环境的结构框图,如图2所示,计算环境201包括运行在分布式网络上的多个(图中采用210-1,210-2,…,来示出)计算节点(如服务器)。计算节点都包含本地处理和内存资源,终端用户202可以在计算环境201中远程运行应用程序或存储数据。应用程序可以作为计算环境201中的多个服务220-1,220-2,220-3和220-4进行提供,分别代表服务“A”,“D”,“E”和“H”。

终端用户202可以通过客户端上的web浏览器或其他软件应用程序提供和访问服务,在一些实施例中,可以将终端用户202的供应和/或请求提供给入口网关230。入口网关230可以包括一个相应的代理来处理针对服务(计算环境201中提供的一个或多个服务)的供应和/或请求。

服务是根据计算环境201支持的各种虚拟化技术来提供或部署的。在一些实施例中,可以根据基于虚拟机(VirtualMachine,VM)的虚拟化、基于容器的虚拟化和/或类似的方式提供服务。基于虚拟机的虚拟化可以是通过初始化虚拟机来模拟真实的计算机,在不直接接触任何实际硬件资源的情况下执行程序和应用程序。在虚拟机虚拟化机器的同时,根据基于容器的虚拟化,可以启动容器来虚拟化整个操作系统(OperatingSystem,OS),以便多个工作负载可以在单个操作系统实例上运行。

在基于容器虚拟化的一个实施例中,服务的若干容器可以被组装成一个Pod(例如,KubernetesPod)。举例来说,如图2所示,服务220-2可以配备一个或多个Pod240-1,240-2,…,240-N(统称为Pod)。Pod可以包括代理245和一个或多个容器242-1,242-2,…,242-M(统称为容器)。Pod中一个或多个容器处理与服务的一个或多个相应功能相关的请求,代理245通常控制与服务相关的网络功能,如路由、负载均衡等。其他服务也可以陪陪类似于Pod的Pod。

在操作过程中,执行来自终端用户202的用户请求可能需要调用计算环境201中的一个或多个服务,执行一个服务的一个或多个功能可能需要调用另一个服务的一个或多个功能。如图2所示,服务“A”220-1从入口网关230接收终端用户202的用户请求,服务“A”220-1可以调用服务“D”220-2,服务“D”220-2可以请求服务“E”220-3执行一个或多个功能。

上述的计算环境可以是云计算环境,资源的分配由云服务提供上管理,允许功能的开发无需考虑实现、调整或扩展服务器。该计算环境允许开发人员在不构建或维护复杂基础设施的情况下执行响应事件的代码。服务可以被分割完成一组可以自动独立伸缩的功能,而不是扩展单个硬件设备来处理潜在的负载。

另一种可选实施例中,图3以框图示出了使用上述图1所示的计算机终端10(或移动设备)作为服务网格的一种实施例。图3示出了一种服务网格的结构框图,如图3所示,该服务网格300主要用于方便多个微服务之间进行安全和可靠的通信,微服务是指将应用程序分解为多个较小的服务或者实例,并分布在不同的集群/机器上运行。

如图3所示,微服务可以包括应用服务实例A和应用服务实例B,应用服务实例A和应用服务实例B形成服务网格300的功能应用层。在一种实施方式中,应用服务实例A以容器/进程308的形式运行在机器/工作负载容器组314(Pod),应用服务实例B以容器/进程310的形式运行在机器/工作负载容器组316(Pod)。

在一种实施方式中,应用服务实例A可以是商品查询服务,应用服务实例B可以是商品下单服务。

如图3所示,应用服务实例A和网格代理(sidecar)303共存于机器工作负载容器组314,应用服务实例B和网格代理305共存于机器工作负载容器316。网格代理303和网格代理305形成服务网格300的数据平面层(dataplane)。其中,网格代理303和网格代理305分别以容器/进程304,容器/进程306的形式运行,可以接收请求312,以用于进行商品查询服务,并且网格代理303和应用服务实例A之间可以双向通信,网格代理305和应用服务实例B之间可以双向通信。此外,网格代理303和网格代理305之间还可以双向通信。

在一种实施方式中,应用服务实例A的流量都通过网格代理303被路由到合适的目的地,应用服务实例B的网络流量都通过网格代理305被路由到合适的目的地。需要说明的是,在此提及的网络流量包括但不限于超文本传输协议(Hyper Text Transfer Protocol,简称为HTTP),表述性状态传递(Representational State Transfer,简称为REST),高性能、通用的开源框架(googleRemote Procedure Call,gRPC),开源的内存中的数据结构存储系统(Redis)等形式。

在一种实施方式中,可以通过为服务网格300中的代理(Envoy)编写自定义的过滤器(Filter)来实现扩展数据平面层的功能,服务网格代理配置可以是为了使服务网格正确地代理服务流量,实现服务互通和服务治理。网格代理303和网格代理305可以被配置成执行至少如下功能中的一种:服务发现(servicediscovery),健康检查(healthchecking),路由(Routing),负载均衡(LoadBalancing),认证和授权(authenticationandauthorization),以及可观测性(observability)。

如图3所示,该服务网格300还包括控制平面层。其中,控制平面层可以是由一组在一个专用的命名空间中运行的服务,在机器/工作负载容器组(machine/Pod)302中由托管控制面组件301来托管这些服务。如图3所示,托管控制面组件301与网格代理303和网格代理305进行双向通信。托管控制面组件301被配置成执行一些控制管理的功能。例如,托管控制面组件301接收网格代理303和网格代理305传送的遥测数据,可以进一步对这些遥测数据做聚合。这些服务,托管控制面组件301还可以提供面向用户的应用程序接口(ApplicationProgrammingInterface,API),以便较容易地操纵网络行为,以及向网格代理303和网格代理305提供配置数据等。

在上述运行环境下,本申请提供了如图4所示的文档处理方法。图4是根据本申请实施例1的文档处理方法一的流程图。

步骤S402,接收目标文档;

作为一种可选的实施例,本实施例方法的执行主体可以是用于对文档处理的终端或者服务器。比如,在应用于用来执行文档处理的终端上时,应用于终端上时,能够轻便地实现简单文档场景下的文档处理;又比如,在应用于服务器上时,可以调用服务器丰富的计算资源,或者相对更为庞大也更为准确的文档模型,进而可以更为准确地对文档进行识别。

需要说明的是,上述终端的类型可以是多种的,例如,可以是具备一定计算能力移动终端,也可以是具有识别识别能力的固定计算机设备,等。上述服务器的类型也可以是多种,例如,可以是本地服务器,也可以虚拟云服务器。服务器的按照计算能力可以是单个的计算机设备,也可以是多个计算机设备集成在一起的计算机集群。

需要说明的是,此处的目标文档可以是多种格式的文档,例如:PDF格式、HTML格式、word格式、excel格式、txt格式等多种。上述目标文档可以是基于IDP技术获得的一些文件,文件信息可以从这些文件中剥离出来并导出到处理系统,具有一定格式的文档。

作为一种可选的实施例,上述步骤S402,目标文档可以有多种出处、来源,可以是个人用户上传的私人文档,也可以是来自网页或电子杂志中节选的文档等。接收的目标文档的数量和篇幅也可以包括多种,可以是具有大量篇幅的长文档,或同时接收需要进行检索的多个目标文档,从而对多个目标文档同时实现文档问答服务。

步骤S404,将目标文档转换为结构化对象;

作为一种可选的实施例,上述步骤S404,文档结构化可以将文档内容按照一定的级别和关系进行组织,例如:可以按照先后顺序、逻辑关系、重要性等进行组织。文档的结构化对象也可以包括多种,例如:标题、正文、段落、列表、表格、图表等。由于文档的内容已经按照一定的规则进行分类整理,文档的组织已经清晰统一,因此,将目标文档转换为结构化对象可以提高文档的可读性和可维护性,在转换为结构化对象后,对文档内容进行搜索时会更加一目了然,还可以为文档的处理、搜索和分析提供更方便的条件,可以帮助用户更快速地找到需要的信息。

步骤S406,接收询问语句;

作为一种可选的实施例,上述步骤S406,接收询问语句,上述询问语句可以是基于接收的目标文档所提出的问题。例如,可以是用户通过语音或者文本的方式输入的语句。在接收到询问语句后,可以将询问语句进行拆分,获取与询问语句对应的文本内容,之后将获取的文本内容进行转换得到对应的文本向量,便于后续基于该文本向量在目标文档的结构化对象中进行搜索,查找出与该询问语句对应的结构化对象。

步骤S408,从结构化对象中搜索出与询问语句对应的文档区域;

作为一种可选的实施例,上述步骤S408,从结构化对象中搜索出与询问语句对应的文档区域可以包括:确定与询问语句对应的多个搜索结果,其中,搜索结果包括候选标题或者候选段落内容,上述候选标题和候选段落内容是基于文档转化后的文本向量基于搜索获得的;基于结构化对象,建立组织信息清晰,内容主题归类明确的树结构,在结构化对象对应的结构为树结构的情况下,确定多个搜索结果在树结构中所对应的节点;基于多个搜索结果在树结构中所对应的节点,确定询问语句对应的文档区域。由于树结构的建立,使得结构化对象的架构更为清晰,通过对询问语句进行搜索获得结构化对象中对应的节点,再基于节点确定其在文档中对应的区域,可以实现对询问语句的询问结果的准确定位。采用树结构的方式表征文档的结构,由于树结构相对于整个文档而言,更为简洁。在确定出与询问语句对应的多个搜索结果后,可以直接依据多个搜索结果分别在树结构中所对应的节点,基于对应的节点能够更为直观地展示出各个询问语句所覆盖的区域,以及基于所覆盖的区域确定出目标区域,即与询问语句对应的文档区域。相对于基于原始文档而言,确定出文档区域更直观,更高效。

作为一种可选的实施例,上述基于多个搜索结果在树结构中所对应的节点,确定询问语句对应的文档区域时,可以采用多种方式。例如,可以直接依据文档区域所要求的节点数量阈值来确定。其中,该节点数量阈值可以依据统计值来确定,该统计值可以是指能够获得与问题较为准确答案的节点的数量值。可以通过获取节点数量阈值,确定包括的节点数量超过上述节点数量阈值的树结构区域,基于超过节点数量阈值的树结构区域确定询问语句对应的文档区域。由于节点的数量越多,文档区域和询问语句的匹配程度越高,在对长文档或多文档进行文档问答时,会得到较多数量的搜索结果,因此,从上述搜索结果中选取包括节点数量越多的树结构区域,进而提高最终基于树结构区域确定的文档区域与对应的询问语句的匹配度。因此根据树结构区域包括的节点数量来确定询问语句对应的文档区域,只要树结构区域包括的节点数量超过上述节点数量阈值,即可以认为确定出的树结构区域能够满足问题与答复高匹配度的要求,从而在基于询问语句进行问答时,可以获得与询问语句匹配度更高的询问结果。

作为一种可选的实施例,原则上在基于树结构确定与询问语句对应的文档区域时,树结构包括的节点数量越多,基于该树结构区域确定出的文档区域能够匹配出询问语句的答案也就越准确。但相反,节点数量越多,所覆盖的区域也就越大,从覆盖的区域中确定与询问语句对应的答案所耗费的资源也就越大,也会在一定程度上影响对话结果返回的效率。因此,在基于节点数量阈值确定出树结构外,也可以通过预定区域阈值控制树结构区域的大小,避免树结构区域过大,导致效率低的问题。因此,在基于树结构区域,确定询问语句对应的文档区域时,可以检测树结构区域是否小于预定区域阈值,若检测结果为树结构区域小于预定区域阈值,则确定上述树结构区域在目标文档中对应的区域为询问语句对应的文档区域。通过上述基于上述节点数量阈值能够有效保证树结构区域所包括的节点的数量,即保证对话结果的准确性;另一方面,通过上述预定区域阈值,能够有效保证树结构区域的整个大小,即保证基于树结构区域返回结果的效率。因此,基于上述节点数量阈值和预定区域阈值,从准确度和效率上对询问语句对应的文档区域进行了考虑,从而实现了对后续返回对话结果兼顾了准确度和效率之间的平衡。

步骤S410,基于文档区域,确定询问语句对应的对话结果。

作为一种可选的实施例,上述步骤410,基于文档区域,确定询问语句对应的对话结果时,可以采用多种方式,例如,可以采用以下处理方式:先获取与文档区域对应的提示词,其中,提示词用于提示将询问语句对应的结果以对话形式输出;基于文档区域和提示词,确定询问语句对应的对话结果。需要说明的是,上述提示词可以是一些固定的提问词,该提示词中除了包括一些正常的问答外,还可以包括一些口语化的语气,口气,态度,情感用语等。

作为一种可选的实施例,上述步骤410,可以将已确定的文档区域和提示词输入至大语言模型中,可以通过大语言模型结合提示词与文档区域进行口语化拆分输出,从而实现以文档对话处理的方式来为用户呈现更贴切、真实、准确地文档问答服务。

作为一种可选的实施例,基于已确定的文档区域获取提示词,如需要基于当前已确定的文档区域,对其中的文档内容进行概括,则提示词可以为:在下面这段文本中讲述了什么。即,提示词可以是一些指令,例如,用于根据已确定的文档区域,对其所包括的内容进行分析,得出可能与上述文档区域的内容相对应的问题或对上述文档区域的内容的描述。因此,提示词可以起到指引大语言模型结合文档区域更好地实现输出口语化、拟人化的问答对话。

作为一种可选的实施例,基于文档区域和提示词,确定询问语句对应的对话结果时,可以采用多种方式,例如,可以基于大语言模型的方式确定该询问语句对应的对话结果,即可以采用以下处理方式:将提示词和文档区域输入大语言模型,其中,大语言模型基于提示词的提示对文档区域进行分析,得到在提示下对文档区域进行分析后得到的分析结果;接收大语言模型反馈的对话结果,其中,对话结果由大语言模型基于对话词和分析结果生成,对话词与提示词对应。

通过上述处理,采用大语言模型对搜索出的文档区域进行处理,由于大语言模型是基于大量的训练数据训练得到,并且具备上下文理解,总结,概括功能,因此,能够使得得到的结果更准确。另外,将提示词和文档区域一起输入大语言模型,能够很好地基于提示词的提示,对文档区域进行分析,使得基于大语言模型得到的对话结果更具备针对性。另外,需要说明的是,在大语言模型基于提示词进行分析得到分析结果后,基于对话词和分析结果生成对话结果,由于对话词是与提示词对应的,因此,能够使得大语言模型输出的对话结果更拟人化,更具备对话特征,更智能化。

需要说明的是,上述基于文档区域和提示词,确定询问语句对应的对话结果时,可以将该文档区域和提示词输入到大语言模型中,由大语言模型对上述文档区域基于提示词对询问语句所对应的答案进行处理,例如,分析,总结,概括,之后输出与询问语句对应的答案。另外,提示词是与询问语句对应的,提示词可以是相对于大语言模型而言,有针对性的输入,即基于该提示词,既能表征询问语句的意思,又能够符合大语言模型的输入要求。

作为一种可选的实施例,为直观地展示对话结果,还可以在基于文档区域,确定询问语句对应的对话结果之后,将大语言模型输出的对话结果显示在用户输入的询问语句对应的对话框中,对话结果输出的形式也可以是多样的,例如:弹窗形式弹出对话结果,或在输出对话结果的同时将对话结果进行语音播放等,实现更真实的文档对话效果。

作为一种可选的实施例,为了更清晰地展示对话结果的搜索和输出过程,可以将对话结果与上述确定的文档区域进行内容的匹配,从而获得对话结果在文档区域中记载的原始表述,并将上述原始表述位置在目标文档中以高亮显示的方式标出,不仅方便对话结果的搜索过程的展示,还可以将输出结果和原始文档中高亮显示的地方相结合进行查看,核查输出结果的准确性、可靠性。需要说明的是,上述目标文档的显示区域可以是任何可以显示的区域,例如,可以是显示界面上用于预览的预览区域。采用上述处理方式,由于在对话框中显示了与询问语句对应的对话结果,在预览区域显示目标文档,并且对匹配出的原始表述进行了高亮,高亮地方式可以较为直接对对话框中展示的对话结果进行比对,在一定程度上实现了对输出的对话结果的检测,从而提升用户对输出的对话结果的认可度。

通过上述实施例,采用基于询问语句对结构化文档信息进行搜索的方式,通过将目标文档转化为结构化对象,基于询问语句确定结构化对象中对应的文档区域,基于文档区域,确定询问语句对应的对话结果,由于基于结构化对象确定出的与询问语句对应的是文档区域,相对于相关技术中确定出的是与询问语句对应的段落而言,文档区域可以包括多个段落,即确定出的文档区域能够更为全面地与询问语句进行对应,更为准确地回答询问语句,因此,能够达到从文档中确定出与询问语句准确对应的对话结果的目的,从而实现了基于文档进行准确问答的技术效果,进而解决了在相关技术中基于文档进行对话时,存在反馈的对话结果不准确的技术问题。

在上述运行环境下,本申请提供了如图5所示的文档处理方法。图5是根据本发明实施例1的文档处理方法二的流程图。如图5所示,该方法可以包括如下步骤:

步骤S502,在显示界面上显示文档输入框;

步骤S504,响应于对文档输入框的操作,接收目标文档,并将目标文档转换为结构化对象;

作为一种可选的实施例,将目标文档输入至文档输入框中后,接收目标文档,将目标文档转换为结构化对象,使目标文档的结构清晰,方便对目标文档内容进行搜索。

步骤S506,在显示界面上显示对话框;

步骤S508,响应于对对话框的输入操作,接收询问语句;

步骤S510,响应于对询问语句的确认操作,在对话框显示与询问语句对应的对话结果,其中,对话结果基于与询问语句对应的文档区域确定,文档区域从结构化对象中搜索得到。

在本申请实施例中,基于上述显示界面上的显示,以及交互操作,采用基于询问语句对结构化文档信息进行搜索的方式,通过将目标文档转化为结构化对象,基于询问语句确定结构化对象中对应的文档区域,基于文档区域,确定询问语句对应的对话结果,由于基于结构化对象确定出的与询问语句对应的是文档区域,相对于相关技术中确定出的是与询问语句对应的段落而言,文档区域可以包括多个段落,即确定出的文档区域能够更为全面地与询问语句进行对应,更为准确地回答询问语句,因此,能够达到基于显示界面的显示,以及交互,从文档中确定出与询问语句准确对应的对话结果的目的,从而实现了基于文档进行准确问答,并且实现了直观性的技术效果,进而解决了在相关技术中基于文档进行对话时,存在反馈的对话结果不准确的技术问题。

在上述运行环境下,本申请提供了如图6所示的文档处理方法。图6是根据本发明实施例1的文档处理方法三的流程图。如图6所示,该方法可以包括如下步骤:

步骤S602,接收目标文档;

步骤S604,将目标文档转换为结构化对象;

步骤S606,接收询问语句;

步骤S608,从结构化对象中搜索出与询问语句对应的文档区域;

步骤S610,采用大语言模型基于文档区域,确定询问语句对应的对话结果。

在本申请实施例中,采用基于询问语句对结构化文档信息进行搜索的方式,通过将目标文档转化为结构化对象,基于询问语句确定结构化对象中对应的文档区域,采用大语言模型基于文档区域,确定询问语句对应的对话结果。一方面,由于基于结构化对象确定出的与询问语句对应的是文档区域,文档区域即是与该询问语句相关的上下文内容,相对于相关技术中确定出的是与询问语句对应的段落而言,文档区域可以包括多个段落,即确定出的文档区域能够更为全面地与询问语句进行对应,更为准确地回答询问语句;另一方面,由于是采用大语言模型对文档区域进行分析,得到与询问语句对应的对话结果,大语言模型由于基于大量数据进行训练,而且大语言模型具备分析,总结,概括能力,因此,基于大语言模型得到的对话结果不仅准确,而且拟人话,更具备对话体验。因此,不仅解决了在相关技术中基于文档进行对话时,存在反馈的对话结果不准确的技术问题,而且提升交互体验。

作为一种可选的实施例,采用大语言模型基于文档区域,确定询问语句对应的对话结果时,为进一步地提升基于大语言模型得到的对话结果的准确性,可以基于一定的提示词,提示大语言模型进行有倾向性的分析,进而得到倾向于用户需求的结果。例如,可以采用以下处理方式:先获取提示词,其中,提示词用于提示大语言模型对文档区域进行分析;基于提示词的提示,采用大语言模型对文档区域进行分析,得到分析结果;接收大语言模型反馈的对话结果,其中,对话结果由大语言模型基于对话词和分析结果生成,对话词与提示词对应。

由于上述文档区域是基于询问语句搜索出的,与询问语句相关联的内容,并且在该文档区域中包括了对应询问语句相关的上下文内容,因此,涉及的内容可能还是会比较多。但一般基于询问语句进行搜索时,可能会有更一般倾向性的需求。比如,在采用大语言模型基于上述文档区域进行分析时,更一般的倾向性需求可能是,“该文档区域中主要讲了些什么”,“该文档区域的重点是什么”等等。基于这些倾向性需求,在基于该文档区域进行分析时,加上这些提示词会使得大语言模型可以考虑上述倾向性需求,这样大语言模型给出的分析结果更符合上述倾向性需求。在得到上述符合倾向性需求的分析结果后,在向用户反馈时,可以在该分析结果的基础上结合与上述提示词对应的对话词,生成对话结果,之后将对话结果反馈给用户。例如,该对话结果可能是,“该文档区域中主要讲了***”,“该文档区域的重点是***”。通过上述处理,将提示词和文档区域一起输入大语言模型,能够很好地基于提示词的提示,对文档区域进行分析,使得基于大语言模型得到的对话结果更具备针对性。而且,在大语言模型基于提示词进行分析得到分析结果后,基于对话词和分析结果生成对话结果,由于对话词是与提示词对应的,因此,能够使得大语言模型输出的对话结果更拟人化,更具备对话特征,更智能化。

基于上述实施例及可选实施例,本发明还提供了一种可选的实施方式。

在相关技术中,对文档进行检索所采用的方法一般是对文档中的内容进行抽取,基于抽取得到的文本信息建立数据库,用于储存上述文本信息,然后基于文本信息建立搜索工具。对已经存储的文档内容进行检索,并且仍需根据文本信息的内容建立相应的搜索工具,浪费了大量的时间。而基于大语言模型对话,如ChatGPT等,对文档的内容进行问答时,由于大语言模型对话服务无法输入超过模型可处理范围的文本,因此,在相关技术中,由于可处理文本范围小,仅能对短文档进行检索无法实现对长文档、多个文档进行文档检索。另外,将大模型对话服务应用于文档搜索时,在相关技术中所采用的方法是,将文档抽取出文本内容,之后从抽取出的文本内容中搜索出与问题对应的回答,但反馈回的回答是与问题对应的文档中的段落,而反馈的段落有时并不能完全与问题对应,因此,存在反馈对话结果不准确的问题。

基于上述问题,在本可选实施方式中,提供了一种基于大语言模型和结构化文档的文档知识库问答检索系统,图7是根据本发明实施例的一种可选的文档知识库问答检索系统框架图,如图7所示,该文档知识库问答检索系统包括如下内容:

在该文档知识库问答检索系统中涉及的服务包括:IDP文档结构化服务、文档结构化搜索服务、大模型对话服务,三种服务功能如下:

IDP文档结构化服务:将文档(PDF/HTML/word/excel/txt)等文档转换为结构化对象(包含文本、样式、表格、图片版面、关联关系、KV)等信息。

文档结构化搜索服务:将文档结构化对象存储构建搜索服务,包括但不限于通过SQL、开源搜索引擎(ElasticSearch)等方式进行构建搜索服务。

大模型对话服务(同上述大语言模型):指通过包括GPT、GPT衍生模型等构建的上下文问答服务。

结合上述三种服务实现文档知识库问答检索,流程如下:用户通过用户ID对用户身份进行区分,用户上传文档后依次经过IDP服务将上传的文档转换为文档结构化对象,将转换的文档结构化对象放入存储数据库和搜索数据库中进行存储,后续搜索数据库的文档结构化搜索引擎对其进行搜索,而后用户通过询问语句对文档内容进行提问,例如:“这篇文档讲述什么?”。

该系统在接收到用户输入的问题后,对该问题进行拆分,得到与问题对应的文本主体内容,之后,将文本主体内容转换为文本向量。其中,文本主体内容可以表示用户输入的问题的主要内容,将文本主题内容对应的文本向量输入到文档结构化搜索引擎中,由该文档结构化搜索引擎对输入的询问语句的答案进行搜索,从存储的文档结构化对象中进行搜索,获得搜索服务返回的TopN个结果。其中,TopN个结果是基于输入的问题,对文本结构化对象中包括与输入的问题相匹配的不同数目节点的N个结果。为了保证文档内容上下文一致性,系统会依据TopN个结果在文档结构化树对象中包括的节点数,选择第一(包括与输入问题相匹配节点数最高的结果)涉及包含的父标题、父段落内容,并摘选为文档结构化树对象中的子树。同样的,若生成树对象失败,同样为了保证文档内容连续性,会按照第一结果所在的文本内容截取固定区间文本内容(由于获得的结果为结构化信息,因此,可以从结构化信息所在原文档位置的上下文中进行文本内容选取,固定区间的长度也可以依据经验获得)。最后将返回的第一结果所在原文档位置的上下文中选取文本内容,形成作为目标的文档区域所包括的文本内容。

在系统中获得问答内容命中的文档区域性的文档文本内容后,会将问答内容(即上述文档文本内容)加上提示词。提示词可以根据已确定的文档区域的内容进行分析,得出的可能与上述文档区域的内容相对应的问题或对上述文档区域的内容的描述。因此,提示词可以起到指引大语言模型结合文档区域和问答内容更好地实现输出口语化、拟人化的问答对话的作用。其中,提示词生成后可单独作为提示词注入服务,系统同样可选择不注入提示词,例如:“在下面这段文本中讲述什么?”,而后将问答内容和提示词内容输入到大模型对话服务中,例如:“在下面这段文本中讲述什么?[原始文档内容]”。

在获得大模型对话服务的结果后,例如返回“这篇文档讲述了xxx”,会将返回结果和原始提供上下文内容做规则匹配,基于匹配结果,获取原始文档内容中命中的词汇或段落。针对原始文档中命中的词汇或段落,系统会返回大模型对话服务的返回结果并提供到用户输入的对话框中,同样的会以可视化方式将命中的词汇或段落的坐标在窗口中的文档部分进行高亮,以此方便用户清晰地检查问答对话的结果是否可靠,提供的结果是否合理。

需要说明的是,在上述可选实施方式中,可以基于IDP技术的处理链路,得到高于普通文档处理流程的细粒度文档结构化对象,例如,可以包括文档内容的文本、坐标、样式、段落、表格、KV、实体类型等;

基于结构化对象加上文档搜索服务获取用户提问的最小命中上下文,解决一次性将文档内容输入大语言模型中,出现的模型输入限制等,可进行长文档、跨文档的问答搜索;

从文档结构化、文档存储搜索、文档问答等构建完整的流程,并基于大语言模型和提示词注入方式,为包括:文档问答理解、文档搜索等服务提供性等解决方案,缩短包括文档阅读理解、文档关键信息理解等个人用户在阅读文档时出现的问题,实现用户和文档的沟通。

因此,通过上述可选实施方式,有效地达到了以下效果:

通过IDP服务结合文档结构化内容,可实现对于用户任意文档的知识库问答系统构建;

通过文档结构化对象,加上搜索查询的最小命中上下文,解决大语言模型对话服务中无法输入超过模型可处理范围文本,可实现对长文档、多文档的文档对话处理方式;

引用了包括GPT、GPT-J等衍生的大语言模型技术,实现对于问答提问、回答更加通用拟人化,并通过大语言模型技术对用户问题和命中对上下文内容进行口语化拆分输出,并限制大语言模型的非文档内容输出。

系统构建实现个人文档知识库的问答,包括但不限于扩展包括文档搜索、文档推荐的功能。

需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本申请所必须的。

通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本申请各个实施例的方法。

实施例2

根据本申请实施例,还提供了一种用于实施上述文档处理方法的文档处理装置,图8是根据本发明实施例2提供的文档处理装置一的结构框图,如图8所示,该装置包括:第一接收模块80、第一转换模块82、第二接收模块84、第一搜索模块86、第一确定模块88,下面对该装置进行说明。

第一接收模块80,用于接收目标文档;第一转换模块82,连接至上述第一接收模块80,用于将目标文档转换为结构化对象;第二接收模块84,连接至上述第一转换模块82,用于接收询问语句;第一搜索模块86,连接至上述第二接收模块84,用于从结构化对象中搜索出与询问语句对应的文档区域;第一确定模块88,连接至上述第一搜索模块86,用于基于文档区域,确定询问语句对应的对话结果。

此处需要说明的是,上述第一接收模块80、第一转换模块82、第二接收模块84、第一搜索模块86、第一确定模块88对应于实施例1中的步骤S402至步骤S410,上述模块与对应的步骤所实现的实例和应用场景相同,但不限于上述实施例一所公开的内容。需要说明的是,上述模块或单元可以是存储在存储器(例如,存储器104)中并由一个或多个处理器(例如,处理器102a、102b,……,102n)处理的硬件组件或软件组件,上述模块也可以作为装置的一部分可以运行在实施例1提供的计算机终端10中。

需要说明的是,本申请上述实施例中涉及到的优选实施方案与实施例1提供的方案以及应用场景、实施过程相同,但不仅限于实施例1所提供的方案。

实施例3

根据本申请实施例,还提供了一种用于实施上述文档处理方法的文档处理装置,图9是根据本发明实施例3提供的文档处理装置二的结构框图,如图9所示,该装置包括:第一显示模块90、第三接收模块92、第二显示模块94、第四接收模块96、第三显示模块98,下面对该装置进行说明。

第一显示模块90,用于在显示界面上显示文档输入框;第三接收模块92,连接至上述第一显示模块90,用于响应于对文档输入框的操作,接收目标文档,并将目标文档转换为结构化对象;第二显示模块94,连接至上述第三接收模块92,用于在显示界面上显示对话框;第四接收模块96,连接至上述第二显示模块94,用于响应于对对话框的输入操作,接收询问语句;第三显示模块98,连接至上述第四接收模块96,用于响应于对询问语句的确认操作,在对话框显示与询问语句对应的对话结果,其中,对话结果基于与询问语句对应的文档区域确定,文档区域从结构化对象中搜索得到。

此处需要说明的是,上述第一显示模块90、第三接收模块92、第二显示模块94、第四接收模块96、第三显示模块98对应于实施例1中的步骤S502至步骤S510,上述模块与对应的步骤所实现的实例和应用场景相同,但不限于上述实施例1所公开的内容。需要说明的是,上述模块或单元可以是存储在存储器(例如,存储器104)中并由一个或多个处理器(例如,处理器102a、102b,……,102n)处理的硬件组件或软件组件,上述模块也可以作为装置的一部分可以运行在实施例1提供的计算机终端10中。

需要说明的是,本申请上述实施例中涉及到的优选实施方案与实施例1提供的方案以及应用场景、实施过程相同,但不仅限于实施例1所提供的方案。

实施例4

根据本申请实施例,还提供了一种用于实施上述文档处理方法的文档处理装置,图10是根据本发明实施例4提供的文档处理装置三的结构框图,如图10所示,该装置包括:第五接收模块100、第二转换模块102、第六接收模块104、第二搜索模块106和第二确定模块108,下面对该装置进行说明。

第五接收模块100,用于接收目标文档;第二转换模块102,连接到上述第五接收模块100,用于将目标文档转换为结构化对象;第六接收模块104,连接到上述第二转换模块102,用于接收询问语句;第二搜索模块106,连接到上述第六接收模块104,用于从结构化对象中搜索出与询问语句对应的文档区域;第二确定模块108,连接到上述第二搜索模块106,用于采用大语言模型基于文档区域,确定询问语句对应的对话结果。

此处需要说明的是,上述第五接收模块100、第二转换模块102、第六接收模块104、第二搜索模块106和第二确定模块108对应于实施例1中的步骤S602至步骤S610,上述模块与对应的步骤所实现的实例和应用场景相同,但不限于上述实施例1所公开的内容。需要说明的是,上述模块或单元可以是存储在存储器(例如,存储器104)中并由一个或多个处理器(例如,处理器102a、102b,……,102n)处理的硬件组件或软件组件,上述模块也可以作为装置的一部分可以运行在实施例1提供的计算机终端10中。

需要说明的是,本申请上述实施例中涉及到的优选实施方案与实施例1提供的方案以及应用场景、实施过程相同,但不仅限于实施例1所提供的方案。

实施例5

本申请的实施例可以提供一种计算机终端,该计算机终端可以是计算机终端群中的任意一个计算机终端设备。可选地,在本实施例中,上述计算机终端也可以替换为移动终端等终端设备。

可选地,在本实施例中,上述计算机终端可以位于计算机网络的多个网络设备中的至少一个网络设备。

在本实施例中,上述计算机终端可以执行文档处理方法中以下步骤的程序代码:接收目标文档;将目标文档转换为结构化对象;接收询问语句;从结构化对象中搜索出与询问语句对应的文档区域;基于文档区域,确定询问语句对应的对话结果。

可选地,图11是根据本申请实施例的一种计算机终端的结构框图。如图11所示,该计算机终端可以包括:一个或多个(图中仅示出一个)处理器1102、存储器1104、存储控制器、以及外设接口,其中,外设接口与射频模块、音频模块和显示器连接。

其中,存储器可用于存储软件程序以及模块,如本申请实施例中的文档处理方法和装置对应的程序指令/模块,处理器通过运行存储在存储器内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的文档处理方法。存储器可包括高速随机存储器,还可以包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器可进一步包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至计算机终端。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

处理器可以通过传输装置调用存储器存储的信息及应用程序,以执行下述步骤:接收目标文档;将目标文档转换为结构化对象;接收询问语句;从结构化对象中搜索出与询问语句对应的文档区域;基于文档区域,确定询问语句对应的对话结果。

可选的,上述处理器还可以执行如下步骤的程序代码:从结构化对象中搜索出与询问语句对应的文档区域,包括:确定与询问语句对应的多个搜索结果,其中,搜索结果包括候选标题或者候选段落内容;在结构化对象对应的结构为树结构的情况下,确定多个搜索结果在树结构中所对应的节点;基于多个搜索结果在树结构中所对应的节点,确定询问语句对应的文档区域。

可选的,上述处理器还可以执行如下步骤的程序代码:基于多个搜索结果在树结构中所对应的节点,确定询问语句对应的文档区域,包括:获取节点数量阈值;确定包括的节点数量超过节点数量阈值的树结构区域;基于树结构区域,确定询问语句对应的文档区域。

可选的,上述处理器还可以执行如下步骤的程序代码:基于树结构区域,确定询问语句对应的文档区域,包括:检测树结构区域是否小于预定区域阈值;在检测结果为树结构区域小于预定区域阈值的情况下,确定树结构区域在目标文档中所对应的区域,为询问语句对应的文档区域。

可选的,上述处理器还可以执行如下步骤的程序代码:基于文档区域,确定询问语句对应的对话结果,包括:获取与文档区域对应的提示词,其中,提示词用于提示将询问语句对应的结果以对话形式输出;基于文档区域和提示词,确定询问语句对应的对话结果。

可选地,上述处理器还可以执行如下步骤的程序代码:基于文档区域和提示词,确定询问语句对应的对话结果,包括:将提示词和文档区域输入大语言模型,其中,大语言模型基于提示词的提示对文档区域进行分析,得到在提示下对文档区域进行分析后得到的分析结果;接收大语言模型反馈的对话结果,其中,对话结果由大语言模型基于对话词和分析结果生成,对话词与提示词对应。

可选的,上述处理器还可以执行如下步骤的程序代码:在基于文档区域,确定询问语句对应的对话结果之后,还包括:将对话结果显示在与询问语句对应的对话框中。

可选的,上述处理器还可以执行如下步骤的程序代码:上述方法还包括:将对话结果与文档区域进行匹配,得到对话结果在文档区域中出现的原始表述;以高亮显示的方式显示原始表述的在目标文档中的位置。

处理器可以通过传输装置调用存储器存储的信息及应用程序,以执行下述步骤:在显示界面上显示文档输入框;响应于对文档输入框的操作,接收目标文档,并将目标文档转换为结构化对象;在显示界面上显示对话框;响应于对对话框的输入操作,接收询问语句;响应于对询问语句的确认操作,在对话框显示与询问语句对应的对话结果,其中,对话结果基于与询问语句对应的文档区域确定,文档区域从结构化对象中搜索得到。

处理器可以通过传输装置调用存储器存储的信息及应用程序,以执行下述步骤:接收目标文档;将目标文档转换为结构化对象;接收询问语句;从结构化对象中搜索出与询问语句对应的文档区域;采用大语言模型基于文档区域,确定询问语句对应的对话结果。

可选地,上述处理器还可以执行如下步骤的程序代码:采用大语言模型基于文档区域,确定询问语句对应的对话结果,包括:获取提示词,其中,提示词用于提示大语言模型对文档区域进行分析;基于提示词的提示,采用大语言模型对文档区域进行分析,得到分析结果;接收大语言模型反馈的对话结果,其中,对话结果由大语言模型基于对话词和分析结果生成,对话词与提示词对应。

采用本申请实施例,提供了一种采用基于询问语句对结构化文档信息进行搜索的方案。基于询问语句对结构化文档信息进行搜索的方式,通过将目标文档转化为结构化对象,基于询问语句确定结构化对象中对应的文档区域,基于文档区域,确定询问语句对应的对话结果,由于基于结构化对象确定出的与询问语句对应的是文档区域,相对于相关技术中确定出的是与询问语句对应的段落而言,文档区域可以包括多个段落,即确定出的文档区域能够更为全面地与询问语句进行对应,更为准确地回答询问语句,因此,能够达到从文档中确定出与询问语句准确对应的对话结果的目的,从而实现了基于文档进行准确问答的技术效果,进而解决了在相关技术中基于文档进行对话时,存在反馈的对话结果不准确的技术问题。

本领域普通技术人员可以理解,图11所示的结构仅为示意,计算机终端也可以是智能手机(如Android手机、iOS手机等)、平板电脑、掌上电脑以及移动互联网设备(MobileInternetDevices,MID)、PAD等终端设备。图11其并不对上述电子装置的结构造成限定。例如,计算机终端还可包括比图11中所示更多或者更少的组件(如网络接口、显示装置等),或者具有与图11所示不同的配置。

本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令终端设备相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:闪存盘、只读存储器(Read-Only Memory,ROM)、随机存取器(RandomAccess Memory,RAM)、磁盘或光盘等。

实施例5

本申请的实施例还提供了一种计算机可读存储介质。可选地,在本实施例中,上述计算机可读存储介质可以用于保存上述实施例一所提供的文档处理方法所执行的程序代码。

可选地,在本实施例中,上述计算机可读存储介质可以位于计算机网络中计算机终端群中的任意一个计算机终端中,或者位于移动终端群中的任意一个移动终端中。

可选地,在本实施例中,计算机可读存储介质被设置为存储用于执行以下步骤的程序代码:接收目标文档;将目标文档转换为结构化对象;接收询问语句;从结构化对象中搜索出与询问语句对应的文档区域;基于文档区域,确定询问语句对应的对话结果。

可选地,在本实施例中,计算机可读存储介质还被设置为存储用于执行以下步骤的程序代码:从结构化对象中搜索出与询问语句对应的文档区域,包括:确定与询问语句对应的多个搜索结果,其中,搜索结果包括候选标题或者候选段落内容;在结构化对象对应的结构为树结构的情况下,确定多个搜索结果在树结构中所对应的节点;基于多个搜索结果在树结构中所对应的节点,确定询问语句对应的文档区域。

可选地,在本实施例中,计算机可读存储介质还被设置为存储用于执行以下步骤的程序代码:基于多个搜索结果在树结构中所对应的节点,确定询问语句对应的文档区域,包括:获取节点数量阈值;确定包括的节点数量超过节点数量阈值的树结构区域;基于树结构区域,确定询问语句对应的文档区域。

可选地,在本实施例中,计算机可读存储介质还被设置为存储用于执行以下步骤的程序代码:基于树结构区域,确定询问语句对应的文档区域,包括:检测树结构区域是否小于预定区域阈值;在检测结果为树结构区域小于预定区域阈值的情况下,确定树结构区域在目标文档中所对应的区域,为询问语句对应的文档区域。

可选地,在本实施例中,计算机可读存储介质还被设置为存储用于执行以下步骤的程序代码:基于文档区域,确定询问语句对应的对话结果,包括:获取与文档区域对应的提示词,其中,提示词用于提示将询问语句对应的结果以对话形式输出;基于文档区域和提示词,确定询问语句对应的对话结果。

可选地,在本实施例中,计算机可读存储介质还被设置为存储用于执行以下步骤的程序代码:在基于文档区域,确定询问语句对应的对话结果之后,还包括:将对话结果显示在与询问语句对应的对话框中。

可选地,在本实施例中,计算机可读存储介质还被设置为存储用于执行以下步骤的程序代码:将对话结果与文档区域进行匹配,得到对话结果在文档区域中出现的原始表述;以高亮显示的方式显示原始表述的在目标文档中的位置。

可选地,在本实施例中,计算机可读存储介质还被设置为存储用于执行以下步骤的程序代码:基于文档区域和提示词,确定询问语句对应的对话结果,包括:将提示词和文档区域输入大语言模型,其中,大语言模型基于提示词的提示对文档区域进行分析,得到在提示下对文档区域进行分析后得到的分析结果;接收大语言模型反馈的对话结果,其中,对话结果由大语言模型基于对话词和分析结果生成,对话词与提示词对应。

可选地,在本实施例中,计算机可读存储介质被设置为存储用于执行以下步骤的程序代码:接收目标文档;将目标文档转换为结构化对象;接收询问语句;从结构化对象中搜索出与询问语句对应的文档区域;采用大语言模型基于文档区域,确定询问语句对应的对话结果。

可选地,在本实施例中,计算机可读存储介质被设置为存储用于执行以下步骤的程序代码:采用大语言模型基于文档区域,确定询问语句对应的对话结果,包括:获取提示词,其中,提示词用于提示大语言模型对文档区域进行分析;基于提示词的提示,采用大语言模型对文档区域进行分析,得到分析结果;接收大语言模型反馈的对话结果,其中,对话结果由大语言模型基于对话词和分析结果生成,对话词与提示词对应。

上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。

在本申请的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。

在本申请所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。

作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。

集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述仅是本申请的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本申请的保护范围。

相关技术
  • 一种文档编辑方法、终端及计算机可读存储介质
  • 一种应用线程处理方法、终端及计算机可读存储介质
  • 多卡移动终端及其业务处理方法及计算机可读存储介质
  • 表格数据处理方法、终端设备及计算机可读存储介质
  • 视频数据处理方法、装置、终端及计算机可读存储介质
  • 文档处理方法及系统、计算机装置和计算机可读存储介质
  • 文档处理方法、装置、计算机可读存储介质及计算机设备
技术分类

06120116509609