掌桥专利:专业的专利平台
掌桥专利
首页

数据处理方法和装置

文献发布时间:2023-06-19 11:19:16


数据处理方法和装置

技术领域

本发明涉及数据处理领域,具体涉及一种数据处理方法和装置。

背景技术

目前,用户在进行目标文件搜索时,可以采用百度或谷歌等搜索引擎,通过目标文件的名称或者模糊查询检索词进行检索,在显示搜索结果的网页信息中逐条进行筛选;用户也可以浏览包含有目标文件的门户网站,在门户网站的文件库中查找所需要的目标文件。

现在互联网搜索业务中,搜索引擎通过从互联网上提取的各个网站的信息而建立的数据库中,检索与用户查询条件匹配的相关记录,然后按一定的排列顺序将结果返回给用户,以供用户进行查看,申请人发现在现有技术当中,在检索引擎检索之前,浏览器无法展示用户输入的检索请求对应的检索结果,而只能在搜索框中对关键词进行关联推荐,无法定制化展示,推荐结果样式也较为单一。

发明内容

本发明实施例提供一种数据处理方法和装置,旨在展示与检索请求中的关键字关联的卡片样式,对推荐内容进行个性化定制,提高多样性。

为解决上述技术问题,本发明实施例提供以下技术方案:

一种数据处理方法,所述方法包括:

获取针对浏览器文本输入区域中输入的检索请求;

对所述检索请求进行分词处理,得到所述检索请求对应的关键词;

根据所述关键词在预设卡片库中进行匹配,以确定所述预设卡片库中与所述关键词关联的多个卡片样式;

分别计算所述多个卡片样式的权重值,根据所述权重值选取目标卡片样式并将所述目标卡片样式展示至所述浏览器的推荐区域。

一种数据处理装置,包括:

获取单元,用于获取针对浏览器文本输入区域中输入的检索请求;

分词单元,用于对所述检索请求进行分词处理,得到所述检索请求对应的关键词;

匹配单元,用于根据所述关键词在预设卡片库中进行匹配,以确定所述预设卡片库中与所述关键词关联的多个卡片样式;

处理单元,用于分别计算所述多个卡片样式的权重值,根据所述权重值选取目标卡片样式并将所述目标卡片样式展示至所述浏览器的推荐区域。

一种存储介质,所述存储介质存储有多条指令,所述指令适于处理器进行加载,以执行上述数据处理方法中的步骤。

一种电子设备,包括:存储器、处理器及存储在所述存储器上,并可在所述处理器上运行的数据处理程序,所述数据处理程序被所述处理器执行时实现本发明实施例所提供的任一数据处理方法。

本申请提供的实施例可以获取针对浏览器文本输入区域中输入的检索请求,对检索请求进行分词处理,得到检索请求对应的关键词,根据关键词在预设卡片库中进行匹配,以确定预设卡片库中与关键词关联的多个卡片样式,分别计算多个卡片样式的权重值,根据权重值选取目标卡片样式并将目标卡片样式展示至浏览器的推荐区域。本申请实施例可以在浏览器输入检索请求后,提取关键词,浏览器绕过搜索引擎根据关键词展示个性化卡片样式,利用浏览器本身的匹配能力给用户展示优质内容,并且提升了推荐内容展示的多样化。

附图说明

为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1是本发明实施例提供的数据处理系统的一种场景示意图;

图2是本发明实施例提供的数据处理方法的一种流程示意图;

图3是本发明实施例提供的一种浏览器搜索界面示意图;

图4为本申请实施例提供的数据处理方法的另一流程示意图;

图5为本发明实施例提供的数据处理装置的结构示意图;

图6为本发明实施例提供的数据处理装置的另一种结构示意图;

图7是本发明实施例提供的电子设备的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本发明的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。

本发明实施例提供一种数据处理方法,该数据处理方法的执行主体可以是本发明实施例提供的数据处理装置,或者集成了该数据处理装置的服务器,其中该数据处理装置可以采用硬件或者软件的方式实现。

请参阅图1,图1为本发明实施例所提供的数据处理系统的场景示意图,包括:终端10和服务器20,比如上述终端10可以为基于安卓系统的终端或者基于IOS系统的终端,还可以为基于Windows系统或者MAC系统的PC等等。终端10与服务器20之间可以通过通信网络连接,该通信网络,包括无线网络以及有线网络,其中无线网络包括无线广域网、无线局域网、无线城域网、以及无线个人网中的一种或多种的组合。网络中包括路由器、网关等等网络实体,图中并未示意出。终端10可以通过通信网络与服务器20进行信息交互,比如可以从服务器20下载应用。

该数据处理系统可以包括数据处理装置,该数据处理装置具体可以集成在平板电脑、电视、手机、笔记本电脑、台式电脑等具备储存单元并安装有微处理器而具有运算能力的终端中,在图1中,该终端即为图1中的终端10,该终端10中可以安装有应用,比如浏览器应用。该终端10可以通过浏览器应用输入检索请求,将检索请求发送至服务器20,并接收服务器20根据检索请求返回的目标卡片样式以及对应的配置文件,终端10接收到配置文件后可以进行对目标卡片样式进行渲染并展示。

该数据处理系统还可以包括服务器20,主要用于接收终端10发送的检索请求,然后对该检索请求进行分词处理,得到关键字,然后在卡片库中进行匹配到多个卡片样式,最后选取其中的目标卡片样式并将对应的配置文件发送至终端10。该数据处理系统还可以包括存储器,用于存储卡片库,该卡片库中包括多个卡片样式,以使得服务器可以从存储器中根据卡片库对检索请求的关键字进行匹配,最终将匹配到的目标卡片样式发送至终端10。

需要说明的是,图1所示的数据处理系统的场景示意图,仅仅是一个示例,本发明实施例描述的数据处理系统以及场景是为了更加清楚的说明本发明实施例的技术方案,并不构成对于本发明实施例提供的技术方案的限定,本领域普通技术人员可知,随着数据处理系统的演变和新业务场景的出现,本发明实施例提供的技术方案对于类似的技术问题,同样适用。

以下分别进行详细说明。需说明的是,以下实施例的序号不作为对实施例优选顺序的限定。

在本实施例中,将从数据处理装置的角度进行描述,该数据处理装置具体可以集成在终端中,终端为在具备储存单元并能够运行应用程序的终端。

一种数据处理方法,包括:

获取针对浏览器文本输入区域中输入的检索请求;

对所述检索请求进行分词处理,得到所述检索请求对应的关键词;

根据所述关键词在预设卡片库中进行匹配,以确定所述预设卡片库中与所述关键词关联的多个卡片样式;

分别计算所述多个卡片样式的权重值,根据所述权重值选取目标卡片样式并将所述目标卡片样式展示至所述浏览器的推荐区域。

请参阅图2,图2是本发明实施例提供的数据处理方法的一种流程示意图。该数据处理方法包括:

在步骤101中,获取针对浏览器文本输入区域中输入的检索请求。

在一实施例中,上述检索请求可以为用户输入的文本信息。具体实施时,用户可通过终端设备中浏览器的文本输入区域输入文本信息。例如,该终端设备可展示一文本输入区域,该文本输入区域设置有文本输入控件,用户可通过该文本输入控件输入文本信息,以实现与设备之间的人机交互。比如,浏览器导航页提供的搜索入口以搜索框的形式提供给用户,用户只需要在搜索框中输入文本信息以作为检索请求。

在一实施例中,用户在输入上述文本信息时,可以通过多种输入方式,例如可以文本信息的方式输入,也可以语音信息的方式输入。相应的,设备接收到语音信息后,可以将其进行转换为文本信息,以作为检索请求。举例来说,可以利用大量的语音信息和语音信息对应的文本信息来训练声学模型(比如隐马尔可夫模型),当声学模型训练完成后,在接收用户输入的语音信息的情况下,可以利用训练好的声学模型对语音信息进行识别,得到与用户输入的语音信息相对应的文本信息,以作为检索请求。或者,上述电子设备还可以利用已有的语音识别产品,将该获取的语音信息直接转化为文本信息,此处不再赘述。

在一实施例中,在打开浏览器并显示浏览器的文本输入区域之后,用户输入文本信息之前,也即该文本输入区域为空白时,该浏览器还可以生成推荐内容并展示,比如在文本输入区域下方以列表的形式展示预设数量的推荐内容。其中,上述推荐内容可以包括用户搜索频率较高的常用词,常用词可以为预设时间内搜索频率达到一定搜索程度的搜索关键词。搜索程度可以由终端设备自行设定,比如搜索程度可设定为每天搜索频率达到3次,因此可以将每天搜索频率大于或等于3次的关键词作为常用词,预设数量比如为10,若当上述常用词的数量超过10时,可以选取搜索频率最高的10个常用词以作为推荐内容进行展示。上述推荐内容还可以包括用户最近搜索的关键词,比如获取用户最近输入的10个关键词以作为推荐内容进行展示。

在其他实施例中,上述推荐内容还可以为当日新闻热点等等,比如可以按照网络热度进行排序,然后根据排序结果选取预设数量的新闻热点作为推荐内容,以在浏览器的文本输入区域下方以列表的形式进行展示。

在步骤102中,对检索请求进行分词处理,得到检索请求对应的关键词。

在一实施例中,若用户输入的检索请求本身就是一个词语,比如香蕉、小狗、手机等等,则无需进行分词,可以直接将该检索请求作为关键词。若上述检索请求是一个长句,则需要对该语句进行分词处理,以得到对应的关键词。需要说明的是,上述关键词可以为一个也可以为多个,比如用户在浏览器的搜索框输入“XX购物网站的XX手机多少钱”这样的检索请求,则进行分词处理后得到的关键词可以为“XX网站”和“XX手机”。

在一实施例中,可以通过意图识别来对检索请求进行分词,以得到关键词,意图识别指的是通过对用户查询词的拆解与分析,了解用户意图与需求。其中意图识别的方法可以有多种,比如词表穷举法、规则解析法以及机器学习方法等等。

其中,词表穷举法是通过词表直接匹配的方式来获取查询意图的,同时,也可以加入比较简单并且查询模式较为集中的类别举例来说,比如查询词为:德国[addr]爱他美[brand]奶粉[product]三段[attr]。查询模式:[brand]+[product];[product]+[attr];[brand]+[product]+[attr]。当然查询模式是可以做成无序的。这种意图识别的方式实现较为简单,能够较准确的解决高频词。由于query一般是满足20/80定律,20%的query占据搜索80%的流量。但是,80%得长尾query是无法通过这种方式来解决的,也就是说这种方式在识别意图的召回可能只占20%。同时,需要人工参与较多,很难自动化实现。

规则解析法比较适用于查询非常符合规则的类别,通过规则解析的方式来获取查询的意图。比如:北京到上海今天的机票价格,可以转换为[地点]到[地点][日期][汽车票/机票/火车票]价格,再比如:1吨等于多少公斤,可以转换为[数字][计量单位]等于[数字][计量单位]。这种靠规则进行意图识别的方式对规则性较强的query有较好的识别精度,能够较好的提取准确信息。也即对数据检索请求进行分词处理,得到多个候选词,然后基于候选词进行意图识别。

机器学习方法则是对于用户输入的query,根据统计分类模型计算出每一个意图的概率,最终给出查询的意图。具体的,系统可以将数据检索请求分解为对应的词序列,然后将词序列输入意图识别组件,得到数据检索请求的编码以及所述数据检索请求的意图,将数据检索请求的编码输入类型确定组件,对词序列进行槽位填充,并通过类型选择组件对词序列中每个词的属性添加约束,最终得到词序列的解码即词序列中每个词的属性。其中,意图识别组件组可以包括双向长短期记忆网络模型(BiLSTM)和意图注意力意模型(Attention),类型确定组件可以包括槽位门模型(Slot-Gate),类型选择组件可以为条件随机场(CRF)。

在步骤103中,根据关键词在预设卡片库中进行匹配,以确定预设卡片库中与关键词关联的多个卡片样式。

在一实施例中,上述预设卡片库可以包括多个关键词以及分别关联的卡片样式,其中,每个关键词可以关联多个卡片样式,比如尺寸、布局以及设计不同的多种卡片样式,旨在向用户展示时具有更高的多样性,在通过分词处理得到检索请求对应的关键词之后,可以根据该关键词在预设卡片库中匹配对应的多个卡片样式。

在一实施例中,若上述分词后得到检索请求对应的关键词为多个,则可以分别对上述多个关键词在预设卡片库中进行匹配,以得到上述多个关键词分别关联的多个卡片样式。在其他实施例中,若上述分词后得到检索请求对应的关键词为多个,还可以进一步确定其中的目标关键词,比如根据该多个关键词在检索请求中的权重来选取目标关键词,然后根据该目标关键词在预设卡片库中进行匹配,以得到目标关键词关联的多个卡片样式。

在一实施例中,还可以预设一个运营词库,该运营词库当中存储多个样本词,并且在卡片库当中存储着分别与上述多个样本词关联的卡片样式,每个样本词所关联的卡片样式可以为多个。因此在得到检索请求对应的关键词之后,可以先在运营词库当中进行匹配,若匹配成功,则可以进一步根据匹配到的样本词在卡片库当中确定与样本词关联的多个卡片样式。若在运营词库当中匹配失败,则可以无需进一步在卡片库中进行匹配,并结束当前流程,这样可以减少操作并且提升匹配效率。也即在对所述检索请求进行分词处理,得到所述检索请求对应的关键词之后,所述方法还包括:

判断预设词库当中是否存在与所述关键词相同的样本词;

若存在,则执行根据所述关键词在预设卡片库中进行匹配,以确定所述预设卡片库中与所述关键词关联的多个卡片样式的步骤,其中,所述预设卡片库包括多个样本词以及分别与所述样本词关联的多个卡片样式的对应关系。

在步骤104中,分别计算多个卡片样式的权重值,根据权重值选取目标卡片样式并将目标卡片样式展示至浏览器的推荐区域。

在一实施例中,在确定多个卡片样式之后,为进一步选取用户所喜欢的目标卡片样式,可以根据用户点击其他卡片的历史信息来对多个卡片样式进行加权。举例来说,上述多个卡片样式可以为三个,分别为A卡片样式、B卡片样式以及C卡片样式,且分别为不同尺寸的三种卡片样式,A卡片样式为大尺寸卡片样式、B卡片样式为中等尺寸卡片样式、C卡片样式为小尺寸卡片样式,在用户使用浏览器的过程中,每次点击卡片都会被计入历史信息当中,因此获取一段时间段内用户点击卡片的历史信息之后,可以统计用户在这段时间内点击三种尺寸的卡片样式的次数,若用户点击大尺寸卡片样式的次数大于点击中等尺寸卡片样式的次数,用户点击中等尺寸卡片样式的次数大于点击小尺寸卡片样式的次数,则可以设置上述多个卡片样式中A卡片样式的权重高于B卡片样式,B卡片样式的权重高于C卡片样式,最后可以选取权重最高的A卡片样式作为目标卡片样式并将该目标卡片样式展示至浏览器的推荐区域。

在一实施例中,若检索请求对应的关键词为多个,则经过匹配以及加权筛选后可以得到多个关键词分别对应的目标卡片样式。此时可以对这多个目标卡片样式进行排序,比如可以根据浏览器后台统计全网用户分别对上述多个目标卡片样式的点击量进行排序,然后按照排序结果依次展示上述多个目标卡片样式。在其他实施例中,还可以选取排序最高的两个或三个目标卡片样式来进行展示,以避免浏览器界面显示混乱等问题。也即若所述检索请求对应的关键词为多个,则将所述目标卡片样式展示至所述浏览器的推荐区域的步骤,包括:

将所述多个关键词分别对应的多个目标卡片样式进行排序;

按照排序结果将所述多个目标卡片样式展示至所述浏览器的推荐区域。

在一实施例中,本实施例当中的卡片包括超链接,浏览器界面可以接收用户的点击操作并跳转至卡片对应的超链接关联的页面。需要说明的是,在展示目标卡片样式的下面,还可以继续展示关键词的其他关联推荐信息。

请参阅图3,图3是本发明实施例提供的一种浏览器搜索界面示意图。用户在XX浏览器搜索框中输入关键词进行查询,比如搜索“XX商城”浏览器对搜索词进行拦截,对关键词进行匹配,匹配之前,可以默认展示推荐信息以及信息流。对拦截的关键词将匹配结果反馈到推荐列表中,通过对关键词类型进行词库对比,迅速找到与之相匹配的多个卡片样式,然后选取目标卡片样式进行展示。在此过程中,可对某些商业合作伙伴进行定制化推荐结果。比如用户输入关键词,首先会被归结到商城类别,通过商城类别,匹配到与之对应的卡片样式,结果便会对其进行展示,还并通过cms进行人工干预,还可以根据关键词,对搜索结果卡片进行定制化干预,用不同的样式诱导用户对卡片活动进行点击。

由上可知,本申请实施例提供的数据处理方法可以获取针对浏览器文本输入区域中输入的检索请求,对检索请求进行分词处理,得到检索请求对应的关键词,根据关键词在预设卡片库中进行匹配,以确定预设卡片库中与关键词关联的多个卡片样式,分别计算多个卡片样式的权重值,根据权重值选取目标卡片样式并将目标卡片样式展示至浏览器的推荐区域。本申请实施例可以在浏览器输入检索请求后,提取关键词,浏览器绕过搜索引擎根据关键词展示个性化卡片样式,利用浏览器本身的匹配能力给用户展示优质内容,并且提升了推荐内容展示的多样化。

根据上一实施例中所描述的数据处理方法,以下将举例作进一步详细说明。

在本实施例中,将以该数据处理装置具体集成在终端中为例进行说明。

请参阅图4,图4为本发明实施例提供的数据处理方法的另一流程示意图。该方法流程可以包括:

步骤201,获取针对浏览器文本输入区域中输入的检索请求。

在一实施例中,上述检索请求可以为用户输入的文本信息。具体实施时,用户可通过终端设备中浏览器的文本输入区域输入文本信息。例如,该终端设备可展示一文本输入区域,该文本输入区域设置有文本输入控件,用户可通过该文本输入控件输入文本信息,以实现与设备之间的人机交互。比如,浏览器导航页提供的搜索入口以搜索框的形式提供给用户,用户只需要在搜索框中输入文本信息以作为检索请求。

在一实施例中,用户在输入上述文本信息时,可以通过多种输入方式,例如可以文本信息的方式输入,也可以语音信息的方式输入。相应的,设备接收到语音信息后,可以将其进行转换为文本信息,以作为检索请求。

步骤202,对检索请求进行分词处理,得到检索请求对应的关键词。

在一实施例中,若用户输入的检索请求本身就是一个词语,则无需进行分词,可以直接将该检索请求作为关键词。若上述检索请求是一个长句,则需要对该语句进行分词处理,以得到对应的关键词。需要说明的是,上述关键词可以为一个也可以为多个。

在一实施例中,在对检索请求进行分词处理之前,还可以对检索请求进行预处理,比如对检索请求进行query改写,其中,query改写包括:query纠错,query扩展,query删除,query转换。本实施例中的query改写主要包括query扩展,query删除和query转换。query扩展具体为对用户输入的语句进行扩展或填充,具体可以依据同义词或是上下文关系,比如,在用户首先输入“查询深圳的天气”,待收到相关应答信息后,再输入“广州的呢”。很明显,广州也是需要查询天气。因此,可以基于历史的信息输入,对当前的自然语言信息进信息填充,以完善当前输入请求。仍以上述“广州的呢”为例,则可以从上文信息“查询深圳的天气”中提取“查询”和“天气”,对“广州的呢”进行信息填充。然后,基于上文信息中关键词之间的关联关系,信息填充后的语句进行语序调整,得到完整的语句。例如,以“广州的呢”为例,进行信息填充和语序调整后可以为“查询广州的天气”。

上述query删除一般的应用场景是在当用户输入query过多时导致无法正常召回,可以通过丢词的方式来筛选用户的query,从而召回与query最相关的商品。比如,当用户的query为“XX水果麦片”时,由于这款商品可能被下架,或者商品种类较少,通过query删除,可以把原query改写为“水果麦片”,进而可以召回其他品牌的水果麦片。query删除是需要用到实体识别的,因为要决定query中的哪些数据被删除才能对用户原意图造成的影响最小。像“XX水果麦片”,通过意图识别得到“XX”是品牌,“水果麦片”是产品,显然用户更需要的是水果麦片,而不是“XX”其他类型的麦片。

上述query转换是当用户输入query无法召回时进行转换。比如,用户在某购物网站搜索“祖马龙”,该网站并没有这款商品。也无法通过query同义词扩展和query删除来对原query进行处理。通过session数据可以发现,用户搜索“祖马龙”后会伴随着“香水”这个query出现,利用用户行为数据是可以挖掘出“祖马龙”和“香水”这两个query是相关的。当用户搜索“祖马龙”而无法召回时,是可以把query转换为“香水”来尽可能满足用户的需求。

步骤203,在预设卡片库中判断关键字是否包括多个卡片类型,若是,则执行步骤204。

需要说明的是,上述预设卡片库中的一些关键词可以包含多个卡片类型,而不同的卡片类型所对应的多个卡片样式也是不相同的。比如,关键词“变形金刚”在预设卡片库中可以包括玩具模型种类和电影种类两种卡片类型,再比如关键词“红豆”在预设卡片库中可以包括食物种类和歌曲种类两种卡片类型,而不同类型的关键词对应的多种卡片样式显然是不相同的。因此在一实施例中,在得到检索请求对应的关键词后,可以在预设卡片库中判断关键字是否包括多个卡片类型,若是,则继续执行步骤204,若否,则直接在预设卡片库中匹配与关键词关联的多个卡片样式即可。

步骤204,根据用户信息在多个卡片类型当中确定目标卡片类型。

举例来说,若上述关键词为“变形金刚”,而该关键词在预设卡片库中可以包括玩具模型种类和电影种类两种卡片类型,在一实施例中可以根据用户的浏览历史信息来对用户期望的卡片类型进行预测,比如在用户使用浏览器的一段时间内,浏览的影视类网页的次数多于浏览玩具相关的网页,因此可以预测用户基于关键字“变形金刚”期望的是电影类卡片类型,也即根据用户信息在所述多个卡片类型当中确定目标卡片类型的步骤,包括:

获取用户使用所述浏览器的浏览历史信息;

根据所述浏览历史信息在所述多个卡片类型当中确定目标卡片类型。

步骤205,根据目标卡片类型和关键词在预设卡片库中进行匹配,以确定预设卡片库中与关键词和目标卡片类型关联的多个卡片样式。

在一实施例中,上述预设卡片库可以包括多个关键词以及分别关联的卡片样式,其中,每个关键词可以关联多个卡片样式,比如尺寸、布局以及设计不同的多种卡片样式,旨在向用户展示时具有更高的多样性,在根据用户信息在多个卡片类型当中确定目标卡片类型之后,即可根据目标卡片类型和关键词在预设卡片库中进行匹配,以确定预设卡片库中与关键词和目标卡片类型关联的多个卡片样式。

步骤206,分别获取在预设时间段内浏览器后台当中多个卡片样式的历史点击量。

在一实施例中,在确定多个卡片样式之后,为进一步选取用户所喜欢的目标卡片样式,可以参考使用该浏览器的众多用户针对不同卡片样式的点击量,比如从浏览器的后台提取在预设时间段内浏览器后台当中针对多个卡片样式分别的历史点击量,其中上述预设时间段比如为一周。

步骤207,根据历史点击量分配多个卡片样式的权重值,根据权重值选取目标卡片样式并将目标卡片样式展示至浏览器的推荐区域。

举例来说,上述多个卡片样式可以为三个,分别为A卡片样式、B卡片样式以及C卡片样式,且分别为不同尺寸的三种卡片样式,A卡片样式为大尺寸卡片样式、B卡片样式为中等尺寸卡片样式、C卡片样式为小尺寸卡片样式。通过对其他用户在预设时间段内针对多个卡片样式分别的历史点击量进行分析,若用户点击大尺寸卡片样式的次数大于点击中等尺寸卡片样式的次数,用户点击中等尺寸卡片样式的次数大于点击小尺寸卡片样式的次数,则可以设置上述多个卡片样式中A卡片样式的权重高于B卡片样式,B卡片样式的权重高于C卡片样式。最后可以选取权重最高的A卡片样式作为目标卡片样式并将该目标卡片样式展示至浏览器的推荐区域。

步骤208,接收通过搜索引擎对检索请求进行检索的指令,根据指令关闭目标卡片样式,并根据关键词进行数据召回。

在一实施例中,若用户在看到生成的目标卡片样式后并不感兴趣,继续执行搜索的步骤,比如点击浏览器页面当中的搜索按钮,则可以关闭目标卡片样式,并根据关键词进行数据召回,最后在浏览器界面展示召回结果。

由上可知,本申请实施例提供的数据处理方法可以获取针对浏览器文本输入区域中输入的检索请求,对检索请求进行分词处理,得到检索请求对应的关键词,在预设卡片库中判断关键字是否包括多个卡片类型,若是,则根据用户信息在多个卡片类型当中确定目标卡片类型,根据目标卡片类型和关键词在预设卡片库中进行匹配,以确定预设卡片库中与关键词和目标卡片类型关联的多个卡片样式,分别获取在预设时间段内浏览器后台当中多个卡片样式的历史点击量,根据历史点击量分配多个卡片样式的权重值,根据权重值选取目标卡片样式并将目标卡片样式展示至浏览器的推荐区域,接收通过搜索引擎对检索请求进行检索的指令,根据指令关闭目标卡片样式,并根据关键词进行数据召回。本申请实施例可以在浏览器输入检索请求后,提取关键词,浏览器绕过搜索引擎根据关键词展示个性化卡片样式,利用浏览器本身的匹配能力给用户展示优质内容,并且提升了推荐内容展示的多样化。

为便于更好的实施本发明实施例提供的数据处理方法,本发明实施例还提供一种基于上述数据处理方法的装置。其中名词的含义与上述数据处理方法中相同,具体实现细节可以参考方法实施例中的说明。

在本实施例中,将从数据处理装置的角度进行描述,该数据处理装置具体可以集成由多个终端组成的系统中,每一终端为在具备储存单元并安装有显示屏而具有视频播放功能的终端。

请参阅图5,图5为本发明实施例提供的数据处理装置的一种结构示意图。其中,上述数据处理装置可以包括:

获取单元301,用于获取针对浏览器文本输入区域中输入的检索请求。

在一实施例中,上述检索请求可以为用户输入的文本信息。具体实施时,用户可通过终端设备中浏览器的文本输入区域输入文本信息。例如,该终端设备可展示一文本输入区域,该文本输入区域设置有文本输入控件,用户可通过该文本输入控件输入文本信息,以实现与设备之间的人机交互。比如,浏览器导航页提供的搜索入口以搜索框的形式提供给用户,用户只需要在搜索框中输入文本信息以作为检索请求。

分词单元302,用于对所述检索请求进行分词处理,得到所述检索请求对应的关键词。

在一实施例中,可以通过意图识别来对检索请求进行分词,以得到关键词,意图识别指的是通过对用户查询词的拆解与分析,了解用户意图与需求。其中意图识别的方法可以有多种,比如词表穷举法、规则解析法以及机器学习方法等等。

匹配单元303,用于根据所述关键词在预设卡片库中进行匹配,以确定所述预设卡片库中与所述关键词关联的多个卡片样式。

在一实施例中,上述预设卡片库可以包括多个关键词以及分别关联的卡片样式,其中,每个关键词可以关联多个卡片样式。

在一实施例中,还可以预设一个运营词库,该运营词库当中存储多个样本词,并且在卡片库当中存储着分别与上述多个样本词关联的卡片样式,每个样本词所关联的卡片样式可以为多个。因此在得到检索请求对应的关键词之后,可以先在运营词库当中进行匹配,若匹配成功,则可以进一步根据匹配到的样本词在卡片库当中确定与样本词关联的多个卡片样式。

处理单元304,用于分别计算所述多个卡片样式的权重值,根据所述权重值选取目标卡片样式并将所述目标卡片样式展示至所述浏览器的推荐区域。

在一实施例中,本实施例当中的卡片包括超链接,浏览器界面可以接收用户的点击操作并跳转至卡片对应的超链接关联的页面。需要说明的是,在展示目标卡片样式的下面,还可以继续展示关键词的其他关联推荐信息。

在一实施例中,如图6所示,所述匹配单元303可以包括:

判断子单元3031,用于在所述预设卡片库中判断所述关键字是否包括多个卡片类型;

确定子单元33032,用于当所述判断子单元3031判断为是时,根据用户信息在所述多个卡片类型当中确定目标卡片类型;

匹配子单元3033,用于根据所述目标卡片类型和关键词在预设卡片库中进行匹配,以确定所述预设卡片库中与所述关键词和目标卡片类型关联的多个卡片样式。

在一实施例中,所述处理单元304可以包括:

获取子单元3041,用于分别获取在预设时间段内所述浏览器后台当中所述多个卡片样式的历史点击量;

分配子单元3042,用于根据所述历史点击量分配所述多个卡片样式的权重值。

由上述可知,本发明实施例可以获取针对浏览器文本输入区域中输入的检索请求,对检索请求进行分词处理,得到检索请求对应的关键词,根据关键词在预设卡片库中进行匹配,以确定预设卡片库中与关键词关联的多个卡片样式,分别计算多个卡片样式的权重值,根据权重值选取目标卡片样式并将目标卡片样式展示至浏览器的推荐区域。本申请实施例可以在浏览器输入检索请求后,提取关键词,浏览器绕过搜索引擎根据关键词展示个性化卡片样式,利用浏览器本身的匹配能力给用户展示优质内容,并且提升了推荐内容展示的多样化。

本发明实施例还提供一种电子设备,如图7所示,该电子设备可以包括射频(RF,Radio Frequency)电路601、包括有一个或一个以上计算机可读存储介质的存储器602、输入单元603、显示单元604、传感器605、音频电路606、无线保真(WiFi,Wireless Fidelity)模块607、包括有一个或者一个以上处理核心的处理器608、以及电源609等部件。本领域技术人员可以理解,图7中示出的电子设备结构并不构成对电子设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。其中:

RF电路601可用于收发信息或通话过程中,信号的接收和发送,特别地,将基站的下行信息接收后,交由一个或者一个以上处理器608处理;另外,将涉及上行的数据发送给基站。通常,RF电路601包括但不限于天线、至少一个放大器、调谐器、一个或多个振荡器、用户身份模块(SIM,Subscriber Identity Module)卡、收发信机、耦合器、低噪声放大器(LNA,Low Noise Amplifier)、双工器等。此外,RF电路601还可以通过无线通信与网络和其他设备通信。无线通信可以使用任一通信标准或协议,包括但不限于全球移动通讯系统(GSM,Global System of Mobile communication)、通用分组无线服务(GPRS,GeneralPacket Radio Service)、码分多址(CDMA,Code Division Multiple Access)、宽带码分多址(WCDMA,Wideband Code Division Multiple Access)、长期演进(LTE,Long TermEvolution)、电子邮件、短消息服务(SMS,Short Messaging Service)等。

存储器602可用于存储软件程序以及模块,处理器608通过运行存储在存储器602的软件程序以及模块,从而执行各种功能应用以及信息处理。存储器602可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据电子设备的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器602可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地,存储器602还可以包括存储器控制器,以提供处理器608和输入单元603对存储器602的访问。

输入单元603可用于接收输入的数字或字符信息,以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。具体地,在一个具体的实施例中,输入单元603可包括触敏表面以及其他输入设备。触敏表面,也称为触摸显示屏或者触控板,可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触敏表面上或在触敏表面附近的操作),并根据预先设定的程式驱动相应的连接装置。可选的,触敏表面可包括触摸检测装置和触摸控制器两个部分。其中,触摸检测装置检测用户的触摸方位,并检测触摸操作带来的信号,将信号传送给触摸控制器;触摸控制器从触摸检测装置上接收触摸信息,并将它转换成触点坐标,再送给处理器608,并能接收处理器608发来的命令并加以执行。此外,可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触敏表面。除了触敏表面,输入单元603还可以包括其他输入设备。具体地,其他输入设备可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种。

显示单元604可用于显示由用户输入的信息或提供给用户的信息以及电子设备的各种图形用户接口,这些图形用户接口可以由图形、文本、图标、视频和其任意组合来构成。显示单元604可包括显示面板,可选的,可以采用液晶显示器(LCD,Liquid CrystalDisplay)、有机发光二极管(OLED,Organic Light-Emitting Diode)等形式来配置显示面板。进一步的,触敏表面可覆盖显示面板,当触敏表面检测到在其上或附近的触摸操作后,传送给处理器608以确定触摸事件的类型,随后处理器608根据触摸事件的类型在显示面板上提供相应的视觉输出。虽然在图7中,触敏表面与显示面板是作为两个独立的部件来实现输入和输入功能,但是在某些实施例中,可以将触敏表面与显示面板集成而实现输入和输出功能。

电子设备还可包括至少一种传感器605,比如光传感器、运动传感器以及其他传感器。具体地,光传感器可包括环境光传感器及接近传感器,其中,环境光传感器可根据环境光线的明暗来调节显示面板的亮度,接近传感器可在电子设备移动到耳边时,关闭显示面板和/或背光。作为运动传感器的一种,重力加速度传感器可检测各个方向上(一般为三轴)加速度的大小,静止时可检测出重力的大小及方向,可用于识别手机姿态的应用(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等;至于电子设备还可配置的陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器,在此不再赘述。

音频电路606、扬声器,传声器可提供用户与电子设备之间的音频接口。音频电路606可将接收到的音频数据转换后的电信号,传输到扬声器,由扬声器转换为声音信号输出;另一方面,传声器将收集的声音信号转换为电信号,由音频电路606接收后转换为音频数据,再将音频数据输出处理器608处理后,经RF电路601以发送给比如另一电子设备,或者将音频数据输出至存储器602以便进一步处理。音频电路606还可能包括耳塞插孔,以提供外设耳机与电子设备的通信。

WiFi属于短距离无线传输技术,电子设备通过WiFi模块607可以帮助用户收发电子邮件、浏览网页和访问流式媒体等,它为用户提供了无线的宽带互联网访问。虽然图7示出了WiFi模块607,但是可以理解的是,其并不属于电子设备的必须构成,完全可以根据需要在不改变发明的本质的范围内而省略。

处理器608是电子设备的控制中心,利用各种接口和线路连接整个手机的各个部分,通过运行或执行存储在存储器602内的软件程序和/或模块,以及调用存储在存储器602内的数据,执行电子设备的各种功能和处理数据,从而对手机进行整体监控。可选的,处理器608可包括一个或多个处理核心;优选的,处理器608可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器608中。

电子设备还包括给各个部件供电的电源609(比如电池),优选的,电源可以通过电源管理系统与处理器608逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。电源609还可以包括一个或一个以上的直流或交流电源、再充电系统、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。

尽管未示出,电子设备还可以包括摄像头、蓝牙模块等,在此不再赘述。具体在本实施例中,电子设备中的处理器608会按照如下的指令,将一个或一个以上的应用程序的进程对应的可执行文件加载到存储器602中,并由处理器608来运行存储在存储器602中的应用程序,从而实现各种功能:

获取针对浏览器文本输入区域中输入的检索请求;

对所述检索请求进行分词处理,得到所述检索请求对应的关键词;

根据所述关键词在预设卡片库中进行匹配,以确定所述预设卡片库中与所述关键词关联的多个卡片样式;

分别计算所述多个卡片样式的权重值,根据所述权重值选取目标卡片样式并将所述目标卡片样式展示至所述浏览器的推荐区域。

在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见上文针对数据处理方法的详细描述,此处不再赘述。

由上可知,本发明实施例的电子设备可以获取针对浏览器文本输入区域中输入的检索请求,对检索请求进行分词处理,得到检索请求对应的关键词,根据关键词在预设卡片库中进行匹配,以确定预设卡片库中与关键词关联的多个卡片样式,分别计算多个卡片样式的权重值,根据权重值选取目标卡片样式并将目标卡片样式展示至浏览器的推荐区域。本申请实施例可以在浏览器输入检索请求后,提取关键词,浏览器绕过搜索引擎根据关键词展示个性化卡片样式,利用浏览器本身的匹配能力给用户展示优质内容,并且提升了推荐内容展示的多样化。

本领域普通技术人员可以理解,上述实施例的各种方法中的全部或部分步骤可以通过指令来完成,或通过指令控制相关的硬件来完成,该指令可以存储于一计算机可读存储介质中,并由处理器进行加载和执行。

为此,本发明实施例提供一种存储介质,其中存储有多条指令,该指令能够被处理器进行加载,以执行本发明实施例所提供的任一种数据处理方法中的步骤。例如,该指令可以执行如下步骤:

获取针对浏览器文本输入区域中输入的检索请求;

对所述检索请求进行分词处理,得到所述检索请求对应的关键词;

根据所述关键词在预设卡片库中进行匹配,以确定所述预设卡片库中与所述关键词关联的多个卡片样式;

分别计算所述多个卡片样式的权重值,根据所述权重值选取目标卡片样式并将所述目标卡片样式展示至所述浏览器的推荐区域。

以上各个操作的具体实施可参见前面的实施例,在此不再赘述。

其中,该存储介质可以包括:只读存储器(ROM,Read Only Memory)、随机存取记忆体(RAM,Random Access Memory)、磁盘或光盘等。

由于该存储介质中所存储的指令,可以执行本发明实施例所提供的任一种数据处理方法中的步骤,因此,可以实现本发明实施例所提供的任一种数据处理方法所能实现的有益效果,详见前面的实施例,在此不再赘述。

以上对本发明实施例所提供的数据处理方法和装置进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

相关技术
  • 图像数据处理方法、用于图像数据处理方法的程序、记录有用于图像数据处理方法的程序的记录介质和图像数据处理装置
  • 药箱的数据处理方法、装置、数据处理方法和装置
技术分类

06120112880792