掌桥专利:专业的专利平台
掌桥专利
首页

作答场景下的数据分析方法、装置、电子设备及存储介质

文献发布时间:2024-04-18 20:01:55


作答场景下的数据分析方法、装置、电子设备及存储介质

技术领域

本发明涉及自然语言处理技术领域,尤其涉及一种作答场景下的数据分析方法、装置、电子设备及存储介质。

背景技术

单人面试中,作答者针对主题问题做相关论述,完整地考察了作答者多方面的能力。在过去面试中,往往采取量表打分等方式,更多依赖专家与面试官评价。为此不能够更高效、全面、公平地评估作答者的认知、思维与表达能力,难以给出更为综合全面的面试表现评估。

发明内容

针对现有技术存在的问题,本发明提供一种作答场景下的数据分析方法、装置、电子设备及存储介质。

第一方面,本发明提供一种作答场景下的数据分析方法,包括:

获取作答文本,根据所述作答文本确定语义网络和因果影响图,所述语义网络是以所述作答文本中筛分出的词语为节点,以词语间的互信息为连接边的节点网络,所述因果影响图是以所述作答文本中筛分出的词句为节点,以词句间的因果关系为连接边的节点图;

根据所述语义网络与预设的参考语义网络确定静态特征,所述静态特征包括表征语义网络中节点的数量和节点间连接的信息;

根据所述语义网络确定动态特征,所述动态特征包括表征语义网络中节点间的有向路径的信息;

根据所述因果影响图和预设的参考因果影响图确定逻辑特征,所述逻辑特征包括表征因果影响图中节点间有向连接的信息;

根据所述静态特征、所述动态特征和所述逻辑特征确定分析指标的指标值,根据所述指标值确定分析结果,所述分析结果包括多个分析项的结果。

在一个实施例中,所述根据所述语义网络与预设的参考语义网络确定静态特征,包括:

统计所述语义网络中节点的数量;

根据所述语义网络和所述参考语义网络中词语间的互信息确定节点间的第一相似距离,所述第一相似距离为词语间的语义相似度;

对所述语义网络进行聚类,确定节点簇,并根据所述节点簇中各节点与第一中心节点的距离,计算网络的模块度;第一中心节点为节点簇的中心;

计算所述语义网络和所述参考语义网络的PMI矩阵距离;

计算所述语义网络中节点度分布的偏度;节点度为节点连接的边的数量,偏度为刻画分布特性的统计量。

在一个实施例中,所述根据所述语义网络确定动态特征,包括:

根据所述语义网络识别出多条游走路径,根据多条游走路径中最短路径,确定路径中相邻节点的距离;

根据所述移动距离确定满足连续性条件的节点间的游走步数、当前节点的停留次数,以及满足跳跃性条件的节点间的游走步数;

根据所述游走路径中节点的移动方向,确定满足回归性条件的节点数量,以及满足发散性条件的节点数量。

在一个实施例中,所述根据所述因果影响图和预设的参考因果影响图确定逻辑特征,包括:

根据所述因果影响图确定多个因果路径;

确定所述因果路径中的节点对应的词句与参考因果影响图中相匹配的词句,基于相匹配的词句在参考因果影像图中确定对应的因果路径;

根据参考因果影响图确定相对应的两个因果路径中的词句间的因果关系指向信息;

基于所述因果关系指向信息确定因果路径的错误率,以及因果路径对作答主题的有效论证率。

在一个实施例中,所述方法还包括:

获取作答文本对应的语音文件;

对所述语音文件进行分析,划分出多个语音片段;

确定各语音片段的情绪特征,根据所述情绪特征确定各语音片段的正/反向结果以及感染力结果。

在一个实施例中,所述方法还包括:

获取作答文本对应的作答场景画面;

对所述作答场景画面进行识别,得到画面中作答者的形态特征;

根据所述形态特征确定画面中作答者的礼仪规范符合度。

在一个实施例中,根据所述指标值确定分析结果,包括:

获取每个分项项对应的各个分析指标对应的权重;

根据分析指标的指标值和权重,确定所述分析项的分析结果。

第二方面,本发明提供一种作答场景下的数据分析装置,包括:

构建模块,用于获取作答文本,根据所述作答文本确定语义网络和因果影响图,所述语义网络是以所述作答文本中筛分出的词语为节点,以基于词语间的互信息确定连接边的节点网络,所述因果影响图是以所述作答文本中筛分出的词句为节点,以词句间的因果关系为连接边的节点图;

第一获取模块,用于根据所述语义网络与预设的参考语义网络确定静态特征,所述静态特征包括表征语义网络中节点的数量和节点间连接的信息;

第二获取模块,用于根据所述语义网络确定动态特征,所述动态特征包括表征语义网络中节点间的有向路径的信息;

第三获取模块,用于根据所述因果影响图和预设的参考因果影响图确定逻辑特征,所述逻辑特征包括表征因果影响图中节点间有向连接的信息;

分析模块,用于根据所述静态特征、所述动态特征和所述逻辑特征确定分析指标的指标值,根据所述指标值确定分析结果,所述分析结果包括多个分析项的结果。

第三方面,本发明提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如第一方面中任一项所述的作答场景下的数据分析方法的步骤。

第四方面,本发明提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如第一方面中任一项所述的作答场景下的数据分析方法的步骤。

本发明提供的作答场景下的数据分析方法、装置、电子设备及存储介质,通过根据作答文本确定语义网络和因果影响图,并基于作答形成的语义网络、因果影响图以及参考语义网络、因果影响图获取不同特征,基于不同特征确定对应的分析指标的指标值,根据指标值确定分析结果,实现具体、有层次地识别作答者的关键能力及其表现,完成对作答者表现的综合定量与定性评估。

附图说明

为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1是本发明提供的作答场景下的数据分析方法的流程示意图;

图2是本发明提供的作答场景下的数据分析装置的结构示意图;

图3是本发明提供的电子设备的结构示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

下面结合图1至图3描述本发明提供的作答场景下的数据分析方法、装置、电子设备及存储介质。

图1示出了本发明提供的一种作答场景下的数据分析方法的流程示意图,参见图1,该方法包括:

11、获取作答文本,根据作答文本确定语义网络和因果影响图,语义网络是以作答文本中筛分出的词语为节点,以基于词语间的互信息确定连接边的节点网络,因果影响图是以作答文本中筛分出的词句为节点,以词句间的因果关系为连接边的节点图;

12、根据语义网络与预设的参考语义网络确定静态特征,静态特征包括表征语义网络中节点的数量和节点间连接的信息;

13、根据语义网络确定动态特征,动态特征包括表征语义网络中节点间的有向路径的信息;

14、根据因果影响图和预设的参考因果影响图确定逻辑特征,逻辑特征包括表征因果影响图中节点间有向连接的信息;

15、根据静态特征、动态特征和逻辑特征确定分析指标的指标值,根据指标值确定分析结果,分析结果包括多个分析项的结果。

针对步骤11~步骤15,需要说明的是,在本发明中,现实中会对一个人的各方面进行考验及观察,以确定这个人是否满足组织作答方对人才的需求。例如企业对面试者进行问答,面试者做出回答。

在本发明中,需要对作答者的作答内容进行分析,以评价出作答者在各个能力方面的评估。作答者的作答内容可以从多方面获取,如直接编辑的作答文本、作答时的录音文件、作答时的影像文件等。

在本发明中,作答者会对作答组织方提出的某些主题观点进行自我理解的陈述。陈述的内容可以供作答组织方进行能力的考察。故陈述的内容可以作为分析的作答文本。该作答文本可以直接取直接编辑的文字内容,也可以是对录音文件进行转换提取的文字内容。

在本发明中,作答文本是对提出的主题观点进行的陈述,为此,作答文本可能围绕主题观点进行严谨的陈述,也可能抓不住主题观点进行发散的陈述,等等。不同的陈述与作答者对主题观点的理解以及临场发挥能力有关。为此,作答文本中的一些字词语句,能够体现出与主题观点及作答者能力表现相关的关系。故可以构建一个语义网络,对作答文本进行预处理、转换为分词格式,筛分出较为关键重要的词语,将每个词语对应到语义网络的节点上,并基于词语间的互信息作为连接边(在这里,该连接边对应词语间的连接信息),将语义网络中的节点连接,此时形成一个语义网络。

在本发明中,语义网络中仅包含上下文共现信息,不包含因果信息。但由于作答者当说过某个词句(即句段)时,可能是为了后面的一个或多个词句进行铺垫。即某个词句与后面的词句具有因果关系。为此,要将这个因果关系的多个词句进行分析,以构建因果影响图。该因果影响图是以作答文本中筛分出的词句为节点,以词句间的因果关系为连接边的节点图。

在本发明中,根据语义网络与预设的参考语义网络确定静态特征。该静态特征通过分析语义网络的拓扑特性得到,能够体现作答文本整体的全局语义特质。对语义网络和预设的参考语义网络的拓扑特性进行分析,可以得到如语义网络中节点的数量和节点间连接的信息。预设的参考语义网络由大量的标准作答文本(即参考答案)进行分析构建。具体为:建立具有大量各类主题的论述类文本的文本语料库,计算语义网络节点对应词的TF-IDF统计量,作为该词语在作答语境中的重要程度。选择作答文本中,重要节点(词语)出现全面的文本,作为备选参考答案的内容/观点库。通过专家评审确定的方式,可以半自动地得到参考答案。对参考答案,依照上述方式类似地预处理,并得到参考语义网络与参考因果影响图。

基于不同的获取需求,获取到的节点的数量和节点间连接的信息,能够对应到不同的分析项上的各分析指标上。例如分项项为“综合分析”,其包含的分析指标包括:思维广度,思维深度,论证集中度,主题契合度等。也就是说,基于节点的数量和节点间连接的信息能够计算得到各个分析指标的结果。

在本发明中,根据语义网络确定动态特征。该动态特征通过分析语义网络上节点对应词语的动力学过程得到,体现作答文本的局部特性和动态转移性质。对语义网络节点对应的词语进行分析,可以得到如语义网络中节点间的有向路径的信息。对节点间的有向路径进行分析,能够得到判断出以下情况:停留在当前节点(表现为同一词语的重复)、在语义网络上随机游走(语义连续地表述)、或跳跃至网络不连通的部分。通过对上述情况的路径上的各节点及节点间的数量及距离情况的合理计算,基于合理的统计模型假设,得到对应分析指标的指标值。例如分析项为应变能力,其包含的分析指标包括:思维连贯程度,思维敏捷性,思维的跳跃/连贯特征,等等。

在本发明中,根据因果影响图和预设的参考因果影响图确定逻辑特征,该逻辑特征是通过分析因果影响图和参考因果影响图得到,能够体现作答者论述中与决策与协调能力有关的特征。

对因果影响图和参考因果影响图进行综合分析,得到如因果影响图中节点间有向连接的信息。预设的参考因果影响图由大量的标准作答文本(即参考答案)进行分析构建。通过因果影响图中节点间有向连接,能够判断出因果路径的错误率,以及因果路径对作答主题的有效论证率。这些错误率和有效验证率能够反映分析指标的结果。例如分析项为组织协调,其包含的分析指标包括:决策能力、协调能力等。

在本发明中,根据静态特征、动态特征和逻辑特征确定分析指标的指标值,根据指标值确定分析结果,分析结果包括多个分析项的结果。在这里,可对静态特征、动态特征和逻辑特征进行预设算法的计算,得到分析指标的指标值。该预设算法可为函数公式,也可为判断条件的数值规则等。

对于本发明提及到的分析项和分析指标,如下表1所示。

表1为作答能力评估框架:能力名称、实际表现与衡量指标

在本发明中,根据所述指标值确定分析结果,包括:

获取每个分项项对应的各个分析指标对应的权重;

根据分析指标的指标值和权重,确定分析项的分析结果。

基于分析结果,能够对作答者做出一个较为合理的能力判断。

本发明提供的作答场景下的数据分析方法,通过根据作答文本确定语义网络和因果影响图,并基于作答形成的语义网络、因果影响图以及参考语义网络、因果影响图获取不同特征,基于不同特征确定对应的分析指标的指标值,根据指标值确定分析结果,实现具体、有层次地识别作答者的关键能力及其表现,完成对作答者表现的综合定量与定性评估。

在上述方法的进一步方法中,主要是对根据语义网络与预设的参考语义网络确定静态特征的处理过程的解释说明,具体如下:

统计语义网络中节点的数量。即通过统计方法对作答得到的语义网络中所有的节点进行统计,得到节点的数量。通过语义网络的节点数量,可以反映综合分析的思维广度:涉及节点越多,表明谈论到并多次重复的关键词多,覆盖了更广的话题,可以关联到话题覆盖率的指标。

根据语义网络和参考语义网络中词语间的互信息确定节点间的第一相似距离,第一相似距离为词语间的语义相似度。即互信息(Mutual Information)是信息论里一种有用的信息度量,它是指两个事件集合之间的相关性,在这里属于一种数值。基于互信息进行计算得到词语间的语义相似度。该相似度可以关联到主题契合度这个分析指标。

对语义网络进行聚类,确定节点簇,并计算节点簇中各节点与第一中心节点的距离;第一中心节点为节点簇的中心。即在语义网络上通过Louvain算法进行网络社群发现,可以得到节点簇(cluster),辅助判断讨论所涉及的话题,一定程度上判断作答者作答的结构性强弱。该距离可以关联到主题模块度这个分析指标,即通过该距离可以计算网络的模块度。

计算语义网络和参考语义网络的PMI矩阵距离。作答者回答的语义网络和参考语义网络的PMI矩阵距离(用作答者作答的语义网络中节点数标准化),该PMI矩阵距离可以关联到语义认知偏离程度的分析指标。

计算语义网络中各节点的节点度,该节点度为节点连接的边的数量。然后计算每个节点度分布的偏度,该偏度为刻画分布特性的统计量。偏度是统计数据分布偏斜方向和程度的度量,是统计数据分布非对称程度的数字特征。该偏度表示网络稠密程度,可以关联到联想能力这个分析指标。

在上述方法的进一步方法中,主要是根据语义网络确定动态特征的处理过程进行解释说明,具体如下:

根据语义网络识别出多条游走路径,根据多条游走路径中最短路径,确定路径中相邻节点的距离;

根据距离确定满足连续性条件的节点间的游走步数、当前节点的停留次数,以及满足跳跃性条件的节点间的游走步数;

根据游走路径中节点的移动方向,确定满足回归性条件的节点数量,以及满足发散性条件的节点数量。

对此,需要说明的是,在本发明中,利用作答者对主题观点的论述内容在语义网络上体现出的运动过程,构建游走路径。该游走路径能够分解出游走的方向和速度等特征。游走的方向可参考游走路径中节点与节点之间的指向。游走的速度可参考游走路径中相邻节点间的移动距离。基于语义网络识别出的能够表达某个主题观点的游走路径可能会包含多条,为此,要从多条游走路径中找出最短路径,该最短路径能够简单明了的表达主题思想,然后基于最短路径确定路径中相邻节点的距离。

在本发明中,根据移动距离确定满足连续性条件的节点间的游走步数、当前节点的停留次数,以及满足跳跃性条件的节点间的游走步数。在这里,需要说明的是,作答者的描述内容的连续性,是指的描述内容能够抓住主题观点,且描述内容能够顺畅的连续表达。为此,可设置一个距离范围,在该距离范围之内的距离对应的两个相邻节点可以统计为满足连续性条件的节点,当确定出多个连续性的节点,此时,可统计节点间的游走步数,如节点为6个,步数为5。

相应地,当移动距离为0,则表明作答者描述停顿,即停顿在同一词语中。该词语对应的节点为满足停留的节点。

相应地,当移动距离超出上述的距离范围,则表明作答者的描述内容属于跳跃性的内容,此时两个相邻节点或两个相邻节点中后一个节点作为满足跳跃性条件的节点,当确定出多个处于跳跃性的节点后,此时,可统计节点间的游走步数,如节点为5个,步数为4。

通过上述的处理方式,可以确定满足连续性条件的节点间的游走步数、当前节点的停留次数,以及满足跳跃性条件的节点间的游走步数。

在本发明中,拓展了node2vec算法中随机游走的搜索偏好(search bias)函数,通过参数化的方式刻画了游走路径的方向偏好。具体而言,搜索方向可以通过游走过程中多步节点的平均距离刻画:作答者的语义表述可能倾向于围绕一个中心论述(在网络上多次回到同一个节点),即根据游走路径中节点的移动方向,确定满足回归性条件的节点数量,以及满足发散性条件的节点数量。

在上述方法的进一步方法中,主要是对根据因果影响图和预设的参考因果影响图确定逻辑特征的处理过程的解释说明,具体如下:

根据因果影响图确定多个因果路径;

确定因果路径中的节点对应的词句与参考因果影响图中相匹配的词句,基于相匹配的词句在参考因果影像图中确定对应的因果路径;

根据参考因果影响图确定相对应的两个因果路径中的词句间的因果关系指向信息;

基于因果关系指向信息确定因果路径的错误率,以及因果路径对作答主题的有效论证率。

对此,需要说明的是,在本发明中,对因果影响图和参考因果影响图进行综合分析,确定多个因果路径,并确定因果路径中的节点对应的词句与参考因果影响图中相匹配的词句,基于相匹配的词句在参考因果影像图中确定对应的因果路径,从而计算相对应的两个因果路径中的词句间的因果关系指向信息,该因果关系指向信息表征两个因果路径的相似偏转角度。通过相似偏转角度与角度范围的比对,能够判断出因果路径的错误率,以及因果路径对作答主题的有效论证率。这些错误率和有效验证率能够反映分析指标的结果。例如分析项为组织协调,其包含的分析指标包括:决策能力、协调能力等。

在上述方法的进一步方法中,作答者在作答现场进行作答陈述,可能对某些主题观点的陈述情绪激昂,也可能对某些主题观点的陈述过于平稳,因此,也需要从作答者的情绪角度进行正向陈述或感染力的判断。故获取作答文本对应的语音文件,该语音文件能够包含作答者陈述的音色及音量的改变。

对语音文件进行分析,划分出多个语音片段;

确定各语音片段的情绪特征,根据情绪特征确定各语音片段的正/反向结果以及感染力结果。

采用普拉切克(Plutchik)的情绪轮盘作为基本框架,基于众包数据获得的情绪词典,建立情感的多元线性回归模型。随后基于原始作答文本对应的语音文件,识别作答者作答过程中的情感倾向与情感波动情况,分析候选人语言表达的感染力,以及作答过程中的紧张程度。还可以加入情感分析模块能够为综合评估提供更多信息。

在上述方法的进一步方法中,不同的作答场景,需要被作答者不同的对待。如面试场景下,可能会注重以下仪表。如演讲场景下,可能会彰显自己的专业度。为此,也需要对作答者的礼仪规范的符合程度进行判断,为此,需要获取作答文本对应的作答场景画面,对作答场景画面进行识别,得到画面中作答者的形态特征,根据形态特征确定画面中作答者的礼仪规范符合度。

下面对本发明提供的作答场景下的数据分析装置进行描述,下文描述的作答场景下的数据分析装置与上文描述的作答场景下的数据分析方法可相互对应参照。

图2示出了本发明提供的一种作答场景下的数据分析装置的结构示意图,参见图2,该装置包括构建模块21、第一获取模块22、第二获取模块23、第三获取模块24和分析模块25,其中:

构建模块21,用于获取作答文本,根据作答文本确定语义网络和因果影响图,语义网络是以作答文本中筛分出的词语为节点,以基于词语间的互信息确定连接边的节点网络,因果影响图是以作答文本中筛分出的词句为节点,以词句间的因果关系为连接边的节点图;

第一获取模块22,用于根据语义网络与预设的参考语义网络确定静态特征,静态特征包括表征语义网络中节点的数量和节点间连接的信息;

第二获取模块23,用于根据语义网络确定动态特征,动态特征包括表征语义网络中节点间的有向路径的信息;

第三获取模块24,用于根据因果影响图和预设的参考因果影响图确定逻辑特征,逻辑特征包括表征因果影响图中节点间有向连接的信息;

分析模块25,用于根据静态特征、动态特征和逻辑特征确定分析指标的指标值,根据指标值确定分析结果,分析结果包括多个分析项的结果。

在上述装置的进一步装置中,该第一获取模块具体用于:

统计语义网络中节点的数量;

根据语义网络和参考语义网络中词语间的互信息确定节点间的第一相似距离,第一相似距离为词语间的语义相似度;

对语义网络进行聚类,确定节点簇,并根据节点簇中各节点与第一中心节点的距离,计算网络的模块度;第一中心节点为节点簇的中心;

计算所述语义网络和所述参考语义网络的PMI矩阵距离;

计算所述语义网络中节点度分布的偏度;节点度为节点连接的边的数量,偏度为刻画分布特性的统计量。

在上述装置的进一步装置中,该第二获取模块具体用于:

根据所述语义网络识别出多条游走路径,根据多条游走路径中最短路径,确定路径中相邻节点的距离;

根据所述移动距离确定满足连续性条件的节点间的游走步数、当前节点的停留次数,以及满足跳跃性条件的节点间的游走步数;

根据所述游走路径中节点的移动方向,确定满足回归性条件的节点数量,以及满足发散性条件的节点数量。

在上述装置的进一步装置中,该第三获取模块具体用于:

根据所述因果影响图确定多个因果路径;

确定所述因果路径中的节点对应的词句与参考因果影响图中相匹配的词句,基于相匹配的词句在参考因果影像图中确定对应的因果路径;

根据参考因果影响图确定相对应的两个因果路径中的词句间的因果关系指向信息;

基于因果关系指向信息确定因果路径的错误率,以及因果路径对作答主题的有效论证率。

在上述装置的进一步装置中,该装置还包括第四获取模块,用于:

获取作答文本对应的语音文件;

对所述语音文件进行分析,划分出多个语音片段;

确定各语音片段的情绪特征,根据所述情绪特征确定各语音片段的正/反向结果以及感染力结果。

在上述装置的进一步装置中,该装置还包括第五获取模块,用于:

获取作答文本对应的作答场景画面;

对所述作答场景画面进行识别,得到画面中作答者的形态特征;

根据所述形态特征确定画面中作答者的礼仪规范符合度。

在上述装置的进一步装置中,该分析模块具体用于:

获取每个分项项对应的各个分析指标对应的权重;

根据分析指标的指标值和权重,确定所述分析项的分析结果。

由于本发明实施例所述装置与上述实施例所述方法的原理相同,对于更加详细的解释内容在此不再赘述。

本发明提供的作答场景下的数据分析装置,通过根据作答文本确定语义网络和因果影响图,并基于作答形成的语义网络、因果影响图以及参考语义网络、因果影响图获取不同特征,基于不同特征确定对应的分析指标的指标值,根据指标值确定分析结果,实现具体、有层次地识别作答者的关键能力及其表现,完成对作答者表现的综合定量与定性评估。

图3示例了一种电子设备的实体结构示意图,如图3所示,该电子设备可以包括:处理器(processor)31、通信接口(Communication Interface)32、存储器(memory)33和通信总线34,其中,处理器31,通信接口32,存储器33通过通信总线34完成相互间的通信。处理器31可以调用存储器33中的计算机程序,以执行作答场景下的数据分析方法的步骤,例如包括:获取作答文本,根据作答文本确定语义网络和因果影响图,语义网络是以作答文本中筛分出的词语为节点,以基于词语间的互信息确定连接边的节点网络,因果影响图是以作答文本中筛分出的词句为节点,以词句间的因果关系为连接边的节点图;

根据语义网络与预设的参考语义网络确定静态特征,静态特征包括表征语义网络中节点的数量和节点间连接的信息;

根据语义网络确定动态特征,动态特征包括表征语义网络中节点间的有向路径的信息;

根据因果影响图和预设的参考因果影响图确定逻辑特征,逻辑特征包括表征因果影响图中节点间有向连接的信息;

根据静态特征、动态特征和逻辑特征确定分析指标的指标值,根据指标值确定分析结果,分析结果包括多个分析项的结果。

此外,上述的存储器33中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,RandomAccessMemory)、磁碟或者光盘等各种可以存储程序代码的介质。

另一方面,本发明还提供一种计算机程序产品,所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,计算机能够执行作答场景下的数据分析方法的步骤,例如包括:获取作答文本,根据作答文本确定语义网络和因果影响图,语义网络是以作答文本中筛分出的词语为节点,以基于词语间的互信息确定连接边的节点网络,因果影响图是以作答文本中筛分出的词句为节点,以词句间的因果关系为连接边的节点图;

根据语义网络与预设的参考语义网络确定静态特征,静态特征包括表征语义网络中节点的数量和节点间连接的信息;

根据语义网络确定动态特征,动态特征包括表征语义网络中节点间的有向路径的信息;

根据因果影响图和预设的参考因果影响图确定逻辑特征,逻辑特征包括表征因果影响图中节点间有向连接的信息;

根据静态特征、动态特征和逻辑特征确定分析指标的指标值,根据指标值确定分析结果,分析结果包括多个分析项的结果。

另一方面,本发明实施例还提供一种处理器可读存储介质,所述处理器可读存储介质存储有计算机程序,所述计算机程序用于使所述处理器执行作答场景下的数据分析方法的步骤,例如包括:获取作答文本,根据作答文本确定语义网络和因果影响图,语义网络是以作答文本中筛分出的词语为节点,以基于词语间的互信息确定连接边的节点网络,因果影响图是以作答文本中筛分出的词句为节点,以词句间的因果关系为连接边的节点图;

根据语义网络与预设的参考语义网络确定静态特征,静态特征包括表征语义网络中节点的数量和节点间连接的信息;

根据语义网络确定动态特征,动态特征包括表征语义网络中节点间的有向路径的信息;

根据因果影响图和预设的参考因果影响图确定逻辑特征,逻辑特征包括表征因果影响图中节点间有向连接的信息;

根据静态特征、动态特征和逻辑特征确定分析指标的指标值,根据指标值确定分析结果,分析结果包括多个分析项的结果。

所述处理器可读存储介质可以是处理器能够存取的任何可用介质或数据存储设备,包括但不限于磁性存储器(例如软盘、硬盘、磁带、磁光盘(MO)等)、光学存储器(例如CD、DVD、BD、HVD等)、以及半导体存储器(例如ROM、EPROM、EEPROM、非易失性存储器(NANDFLASH)、固态硬盘(SSD))等。

以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。

通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。

最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

技术分类

06120116572319