掌桥专利:专业的专利平台
掌桥专利
首页

个性化搜索结果排名

文献发布时间:2023-06-19 11:55:48


个性化搜索结果排名

附图说明

附图图示了本构思的实现方式。通过结合附图参考以下描述,可以更容易地理解所图示的实现方式的特征。在可行的情况下,在各个附图中使用相同的附图标记来指示相同的元素。在某些情况下,在附图标记之后使用括号来区分相似的元素。使用没有相关括号的附图标记是元素的通用。附图不一定按比例绘制。在图中,附图标记最左边的数字表示附图标记第一次出现的图。在说明书和附图中的不同实例中使用相同的附图标记可以指示相似或相同的项。

图1示出了图示本构思的概述原理的流程图。

图2示出了根据本构思的一些实现方式的片段中实体的图形表示。

图3示出了图示根据本构思的一些实现方式的生成用户偏好信息的框图流程图。

图4示出了根据本构思的一些实现方式的用户偏好信息的示例的图形表示。

图5示出了根据本构思的一些实现方式的用于推断用户偏好信息的偏好推断方法的流程图。

图6示出了图示根据本构思的一些实现方式的用于提供搜索结果的个性化排名的个性化方法的流程图。

图7图示了用户界面,其显示根据本构思的一些实现方式的搜索结果的个性化排名的示例。

图8图示了其中可以采用本构思的一些实现方式的示例系统。

具体实施方式

概述

本构思涉及用于将搜索结果排名个性化来提供改进的搜索体验的平台。个性化搜索引擎使用个体用户偏好,个体用户偏好可以从用户过去的搜索和浏览活动历史中推断。所推断的偏好可以被用于对搜索结果进行排名,使得用户更有可能感兴趣的某些搜索结果被排名为高于其他搜索结果。改进的个性化搜索引擎通过首先呈现个体用户更有可能感兴趣的搜索结果来为用户提供丰富的搜索体验。

常规的搜索引擎(和常规的排名器)在对搜索结果进行排名时不一定会考虑个体用户的偏好或兴趣。因此,常规的搜索引擎可能会对所有用户返回相同顺序的搜索结果。常规的搜索引擎可能会基于受欢迎程度、点击次数、链接数等对搜索结果进行排名,但它们可能不会基于个人偏好来对排名进行个性化。例如,如果两个用户的电影偏好截然不同,一个用户更喜欢英语动作片,而另一个用户更喜欢外语爱情片,则使用常规搜索引擎搜索“电影”,两个用户可能会接收到基于搜索结果的全球流行度、相同顺序的搜索结果的电影列表。同样,如果对连锁影院有不同偏好的两个用户,一个用户更喜欢AMC Theatres

常规的搜索引擎的主要问题之一是,因为相关搜索结果不是首先出现,而是出现在许多不相关的搜索结果之后,或者隐藏在不相关的搜索结果中,所以用户体验受到很大影响。常规搜索引擎返回的搜索结果的一般化排名使得用户很难找到相关的搜索结果。例如,用户在找到相关搜索结果之前可能必须阅读许多不相关的搜索结果。在发现相关搜索结果之前,用户可能必须滚动经过不相关的搜索结果,甚至翻阅许多不相关的搜索结果页面。一些用户甚至在找到相关搜索结果之前就可能失去耐心并完全放弃搜索工作。

为了解决常规搜索引擎的这些技术缺陷,本构思提供了优先考虑更符合用户个人偏好的某些搜索结果(例如,自定义的搜索结果)来产生搜索结果的个性化排名的技术方案。例如,如果偏好Sketchers

根据当前的构思,由个性化搜索引擎返回的搜索结果的个性化排名具有若干益处和优点。通过轻松找到与其个人偏好和兴趣相关的相关搜索结果,用户更有可能获得卓越的搜索体验。用户会在搜索时经常返回的众多搜索结果中更快地找到相关的搜索结果。因为用户不需要尝试导致系统资源过载的多个搜索查询来找到相关的搜索结果,所以搜索提供方节省了资源。由于首先向用户呈现更相关的搜索结果,搜索提供方生成更高的广告收入。个性化搜索引擎在无需用户的大量努力的情况下,通过自动使用他们的偏好,进一步丰富了用户的搜索体验。

在一些实现方式中,将搜索结果排名个性化的本构思可以针对所有搜索来全局实现。备选地,在其他实现方式中,搜索结果排名的个性化可以仅针对在线内容的特定片段的某些搜索来实现和执行。片段的示例包括例如电影放映时间、零售购物、体育、航班等。片段的范围可以有很大不同,但通常每个片段可以与特定主题相关。例如,电影放映时间片段可以只包括电影的放映时间,而更广泛的放映时间片段可以包括本地事件、喜剧节目、马戏表演、音乐会等的放映时间。例如,篮球片段可以只针对一项运动,而体育片段可以涵盖所有大联盟体育项目。

图1示出了图示本构思的一些概述原理的高级流程图100。用户102可以与诸如web浏览器104的应用程序交互。web浏览器104可以驻留在任何类型的设备上,诸如膝上型电脑、智能电话、信息亭、汽车等。用户102可以通过提供输入(例如,经由键盘、指示器或触摸屏)和接收输出(例如,经由显示器)来与web浏览器104交互。用户102可以例如通过输入与搜索提供方相关联的统一资源定位符(“URL”)来控制web浏览器104访问搜索提供方的网站。作为响应,web浏览器104可以呈现用户102可以用来执行搜索的搜索提供方的搜索网页。

一旦在搜索网页处,用户102可以通过以文本字符串的形式向web浏览器104输入搜索查询106来进行搜索。web浏览器104可以进而将搜索查询106传递到搜索提供方的个性化搜索引擎108。作为响应,个性化搜索引擎108可以将与搜索查询106相对应的搜索结果集合110返回给web浏览器104。搜索结果110可以是网页并且可以被表示为可以被用于访问网页的对应URL。因此,个性化搜索引擎108可以返回包含这些URL的搜索结果网页作为搜索结果110。接下来,web浏览器104可以通过呈现和显示搜索结果网页来向用户102呈现搜索结果110。

搜索结果110可以按照由个性化排名器112确定的顺序来排名,并且web浏览器104可以按照该顺序向用户102显示搜索结果110。个性化排名器112可以是个性化搜索引擎108(如图1中所示)的组件或者可以与个性化搜索引擎108分离。在一些实现方式中,个性化排名器112可以特定于特定片段。即,每个片段可以具有其自己的片段特定个性化排名器。

根据本构思的一些实现方式,用户102的活动历史114可以从web浏览器104获得,并且从活动历史114推断的用户偏好可以作为用户偏好信息116而被存储在数据库118中。用户102的活动历史114可以包括例如(1)查询历史、(2)点击历史和(3)浏览历史。查询历史可以指代用户102提交的过去搜索查询的历史。点击历史可以指代用户102点击的过去搜索结果的历史。并且浏览历史可以指代用户102过去浏览的网页的历史。在一些实现方式中,个性化搜索引擎108可以提供查询历史和点击历史,但是个性化搜索引擎108可能不具有对浏览历史的直接访问。根据用户102的活动历史114,用户偏好信息116可以被确定。根据本构思的一些实现方式,每个片段可以具有片段特定的用户偏好信息116。此外,个性化搜索引擎108和/或个性化排名器112(如上所述)也可以特定于特定片段。

根据本构思,个性化搜索引擎108的个性化排名器112可以考虑用户偏好信息116来对搜索结果110进行排名。个性化排名器112可以基于用户102个性化的用户偏好信息116,例如将用户102将更感兴趣的某些搜索结果排名更高。因此,搜索结果110的排名可以针对用户的偏好进行个性化,使得与在搜索结果110的一般化的、非个性化排名中靠前的项相比,在搜索结果110的个性化排名中排名靠前的项与用户102更相关。

使用示例来例示改进的个性化搜索引擎108相对于常规搜索引擎的优势,如果用户102在过去提交了对美国联合航空公司(United Airlines

因此,个性化搜索引擎108可以提供为用户自己的个人偏好单独定制的个性化排名。作为另一示例,如果用户102具有几乎总是预订靠窗座位的历史,则用户偏好信息116可以反映用户102偏好靠窗座位。因此,如果用户102搜索“航班”,则具有可用靠窗座位的某些搜索结果的排名可以高于没有可用靠窗座位的其他航班。另一方面,如果喜欢靠过道座位的另一用户搜索“航班”,则该用户将被呈现不同顺序显示的搜索结果,其优先考虑具有可用过道座位的某些航班。因此,根据本构思,即使两个用户提交相同的搜索查询106,返回的搜索结果110的排名也可以通过基于用户的个人偏好推荐与个体用户更相关的某些搜索结果来针对个体用户进行个性化。

如上所述,根据本构思的个性化搜索引擎108的附加优点包括为用户102提供更容易和更简单的搜索体验,用户102不一定需要在搜索查询中明确列举她的所有偏好106。常规的搜索引擎要求用户102输入冗长的搜索查询来试图记载她的相关偏好,诸如“在具有皮革可躺式座椅的富豪剧院中,在下午播放评论高于5星中的4星的汤姆克鲁斯动作英文电影”、“低于50美元的价格在nordstrom出售的中号红色棉质无袖女式衬衫”或者“联合航空公司从西雅图到洛杉矶的直飞航班,商务舱的靠窗座位、准时起飞率高于95%”。根据本构思的改进的个性化搜索引擎108可以在每次用户102提交搜索查询106时减轻用户102记住、用语言表达和键入明确的个人偏好的巨大负担。使用个性化搜索引擎108,用户102可以简单地搜索“电影”、“衬衫”或“机票”并且被呈现基于她过去的活动历史114而自动考虑她的偏好的搜索结果110。这些益处由本构思提供,无论用户102自己是否知道其偏好,本构思根据活动历史114来自动确定用户的个人偏好,并且将搜索结果110的排名智能地修改为首先呈现与用户102更相关的某些搜索结果。

以下将参考附图来更详细地描述本构思。在一些实现方式中,本构思可以被描述为分两个阶段来实现。第一阶段可以涉及可以在用户102执行搜索之前(即,在用户102提交搜索查询106之前)执行的离线预处理(或者预搜索处理)。第二阶段可以涉及可以在搜索期间(即,在用户102提交搜索查询106之后并且直到对应的搜索结果110被返回给用户102)实时执行的在线或运行时处理(或者搜索时处理)。尽管以下将根据本构思的若干动作描述为在这两个阶段中执行,但是这些动作可以在不同的阶段或以不同的顺序来执行。

预搜索处理

根据本构思的一些实现方式,片段信息可以被收集。即,与某个片段相关的各种实体的信息可以被收集和存储,以供将来访问。例如,关于放映时间片段,与各种实体(诸如,电影、影院、演员、作家、导演、制片人等)有关的信息可以被收集和存储。作为另一示例,关于体育片段,与诸如球员、球队、教练、场地、联赛等的实体有关的信息可以被收集。因此,单独的片段信息可以与已实现本构思的每个片段相关联地存储。片段信息可以是非用户特定的数据。换言之,片段信息可以是所有用户共有的。在一个实现方式中,每个实体可以被分配唯一的实体标识(ID),诸如Satori ID。

对于每个实体,多个类型的详细信息可以被收集。例如,放映时间片段中的电影实体可以包括如下详细信息,诸如标题、语言、流派、评级、上映日期、演员、导演、制片人、电影地点、预算、收入、运行时间、纵横比、颜色、配乐等。作为另一示例,体育片段中的团队实体可以包括关于球员、教练、联赛、家乡城市、主场、创始年份、锦标赛、收入、所有者、总经理、统计数据、记录等的详细信息。

在根据本构思的一个实现方式中,片段信息可以以图形形式来存储。例如,每个实体可以通过它自己的图来表示。实体图的节点可以表示与实体有关的详细信息和信息类别(或者数据类型)。实体图的节点可以通过边来连接。与实体有关的详细信息可以使用由节点和边形成的图结构而以分层结构来组织。因此,具有多个实体的特定片段的片段信息可以包括针对那些相应实体的多个图。在根据本构思的另一实现方式中,包括与所有实体有关的详细信息的片段信息可以被存储在将实体节点链接在一起的一个连通图中。备选地,片段信息可以以表格形式而不是以图形形式存储。片段信息可以被存储在数据库中。片段信息可以被存储在用户偏好信息116被存储的相同数据库118中或者不同的数据库中。

图2示出了表示放映时间片段中的电影实体的示例的图200。在该示例中,所图示的电影实体是名为“A Star Is Born”的电影,实体以图的形式存储,并且实体由其自身的实体图200来表示。实体图200可以包括根节点202。在该示例中,根节点202可以指示电影数据类型。从根节点202分支出来的是子节点204,子节点204将电影标题表示为“A Star IsBorn”。从标题节点204分支出来的是指示各种数据类型的若干子节点,包括演员、导演、编剧、上映日期、语言和流派。这些子节点中的每一个可以包括一个或多个叶节点,该一个或多个叶节点包括关于电影实体的详细信息。

根据本构思,图中的一个或多个节点可以具有相关联的实体ID。例如,表示电影“AStar Is Born”的实体ID可以被分配给根节点202或者标题节点204。附加地,演员节点中的一个或多个可以被分配与对应演员相关联的实体ID。可选地,表示演员的节点可以被链接到针对该演员实体的另一图。

图2是出于例示目的而提供的小实体的简化示例。根据本构思,与实体相关联的图可以详细得多,并且可以在大得多的图中包含更多节点。此外,片段可以包含非常多的实体,例如,数百万个实体。此外,图2中所描绘的实体图200中的信息以及组织结构仅为示例;许多其他数据结构和组织结构也是可能的。

在一个实现方式中,片段信息可以从片段数据提供方来获得。例如,STATS LLC提供与体育相关的数据。与目标片段相比,来自提供方的数据范围更广,并且因此可以从所提供的数据中挑选与特定片段有关的相关信息。数据可以被进一步过滤。例如,数据中包括的仅前一百万个实体(例如,基于点击和/或表达式的数量)可以被过滤并且被包括在片段信息中。附加地,来自提供方的不会被用于对搜索结果进行排名的某些数据可以被过滤并且从片段信息中排除。

备选地,在另一实现方式中,片段信息可以通过爬取互联网或数据库来构建。例如,可以通过爬取IMDb(互联网电影数据库)网站以及其他电影相关网站来构建针对电影片段的片段信息。在一些实现方式中,来自提供方的数据和来自爬虫的数据可以被一起使用来相互增强或补充或者相互验证和确认。

根据本构思,片段信息可以被更新。例如,针对电影放映时间片段的片段信息可以被更新来反映新电影、新影院、即将上映的放映时间等。类似地,针对体育片段的片段信息可以被更新来反映最近的比赛、新球员、新球队、教练和经理职位、新统计数据等。可以通过从片段数据提供方处获取更新的数据或者通过爬取相关网站或数据库来更新片段信息。片段信息可以被周期性地更新(例如,每天、每周、每月、每季度、每年等)或者随着从提供方和/或爬虫获得新数据而被持续更新。

根据本构思,用户102的用户偏好信息116可以被确定并存储,以供将来访问。在一些实现方式中,用户102可以被标识来跟踪她的活动并确定她的偏好。例如,用户102可以经由用于访问计算机设备的登录凭证(例如,Windows

图3示出了图示生成用户偏好信息116的框图流程图300。如关于图1所讨论的,用户102的用户偏好信息116可以根据用户102的活动历史114来推断。活动历史114可以包括反映了可以推断她的偏好的用户102活动的任何类型的历史信息。在本构思的一些实现方式中,活动历史114可以包括一个或多个类型的活动,诸如:(1)查询历史302,(2)点击历史304,和/或(3)浏览历史306。这三个示例类型的活动历史可以由web浏览器104提供。个性化搜索引擎108还可以跟踪查询历史302和点击历史304。活动历史114可以不限于在web浏览器上执行的活动,而是可以包括可以推断出用户偏好的任何活动。例如,活动历史114可以包括社交媒体应用上的活动(查询、点击和浏览)、使用支持GPS的车辆访问的位置以及来自信用卡交易记录的购买历史,所有这些都可以指示例如用户102喜欢的主题、品牌、商家、表演、影院、运动队、餐馆等。

本构思在不必要求用户102明确陈述或输入她的偏好的情况下,自动且智能地推断用户102的偏好和兴趣。本构思可以避免使用问卷形式调查用户102的偏好的负担和麻烦。用户102能够在不必必须手动输入她的偏好的情况下,享受被呈现搜索结果的个性化排名的益处。

查询历史302可以包括用户102提交的过去搜索查询的历史。因为用户102预测提交了关于这些偏好的搜索查询,查询历史302可以指示用户102喜欢或感兴趣的主题或实体。查询历史302可以由web浏览器104来捕获和提供,或者由搜索提供方(或者其个性化搜索引擎108)来接收和跟踪。

点击历史304可以包括响应于用户102点击的搜索查询而产生的过去搜索结果的历史。因为用户102预测点击了与那些偏好相关的搜索结果,点击历史304可以指示用户102喜欢或感兴趣的主题或实体。点击历史304可以由web浏览器104来捕获和提供,或者由搜索提供方(或者其个性化搜索引擎108)来接收和跟踪。

在一些实现方式中,可以区分满意的点击和不满意的点击。例如,如果用户102点击特定搜索结果并且希望特定搜索结果相关,但是在浏览对应网页时,意识到网页不相关,则用户102可以关闭网页和/或返回搜索结果来尝试点击另一搜索结果。另一方面,如果用户102点击特定搜索结果并且对应网页相关,则用户102可以在关闭它或浏览离开它之前在相关网页上停留一段时间。在一个实现方式中,满意的点击和不满意的点击可以使用与点击相关联的停留时间来区分。用于确定满意点击的阈值停留时间可以是固定的或变化的。在根据本构思的一些实现方式中,点击历史304可以包括仅满意点击的历史而忽略或丢弃不满意点击的历史。备选地,点击历史304可以包括没有区分的满意点击和不满意点击两者的历史。在另一实现方式中,点击历史304可以包括与满意点击的历史相比,提供了用户偏好的较低置信度指示的不满意点击的历史。置信水平可以至少基于与点击相关联的停留时间来确定。

浏览历史306可以包括用户102使用web浏览器104浏览的过去网站和/或网页的历史。因为用户102预测浏览了与这些偏好相关的网页,浏览历史306可以指示用户102喜欢或感兴趣的主题或实体。浏览历史306可以由web浏览器104来捕获和提供。在一些实现方式中,类似于点击历史304,浏览历史306也可以基于例如用户102在网页上花费的停留时间来区分满意浏览和不满意浏览。

在根据本构思的一些实现方式中,用户102可以选择暂时或完全不跟踪其活动历史114。例如,用户102可以选择不通过不登录web浏览器104和/或搜索提供方的网站来标识自己的身份。通过保持匿名,用户102可以搜索、单击和浏览,而无需跟踪和保存她的活动来影响将来的搜索结果排名。在这样的场景中,用户102可以简单地选择重新登录来标识她自己并利用本构思。

此外,web浏览器104和/或搜索提供方可以提供选项(或设置)来禁用或暂停记录所提交的搜索查询、所点击的搜索结果和/或所浏览的网页的历史的特征。例如,隐私模式或隐身模式是许多web浏览器中的常见功能,其提供了与不记录用户活动类似的效果。此外,web浏览器104和/或搜索提供方可以提供清除(即,删除)已针对用户102跟踪和记录的任何先前查询历史302、点击历史304和/或浏览历史306的选项。因此,用户102可以选择什么类型的活动历史114(即,查询历史302、点击历史304和/或浏览历史306)以及应在什么时间段记录这样的历史信息。

例如,如果用户102是学生,为给学校报告,她需要执行与Holocaust有关的许多搜索,但她不希望在学校报告之后,在她搜索“电影”时被与Holocaust电影有关的搜索结果淹没,用户102可以在她针对学校报告的搜索期间临时暂停对她的活动历史114的跟踪。此外,出于隐私原因,用户102可以禁用、暂停或擦除活动历史114。如果没有用户102的活动历史114(或者活动历史114的数量不足以置信地推断用户102的用户偏好信息116),则可能无法根据当前构思来提供个性化的搜索结果排名。

根据本构思,标签生成器308可以基于用户102的活动历史114来确定一个或多个标签。标签可以与例如用户102感兴趣的实体或主题相关联。这些标签可以被存储在用户偏好信息116中,以指示用户102喜欢与所存储的标签相关联的实体或主题。

例如,标签生成器308可以包括实体提取器310,实体提取器310通过搜索片段信息来确定搜索查询中的任何标记(即,词或短语)是否是目标片段中的实体。例如,如果查询历史302指示用户102具有提交搜索查询的历史,诸如“达拉斯牛仔的比赛日程”、“便宜的达拉斯牛仔衬衫”和“有史以来最好的达拉斯牛仔球员”,则实体提取器310可以参考体育片段的片段信息并发现达拉斯牛仔队是团队实体。进而,标签生成器308可以创建达达拉斯牛仔队标签,以存储在用户102的用户偏好信息116中。用户偏好信息116中存储的达拉斯牛仔队标签可以指示用户102偏好(即,感兴趣)达拉斯牛仔队。标签生成器308可以包括和/或使用分词器、解析器、词性标注器、自然语言处理算法等来分析搜索查询并标识实体。

标签生成器308可以使用与片段信息中的达拉斯牛仔队实体相关联的实体ID来标记用户偏好信息116中的达拉斯牛仔队标签,使得相同的实体ID将存在于用户偏好信息116和片段信息中。

作为另一示例,标签生成器308可以包括主题提取器312,主题提取器312根据点击历史304点击或者根据浏览历史306浏览的网页来确定与用户102相关的一个或多个主题。标签生成器308可以提取网页的内容(例如,文本段)。在一个实现方式中,标签生成器308可以使用词性标注器来查找文本段中的主题短语。主题提取器312可以解析网页的超文本标记语言(“HTML”)。主题提取器312可以使用对诸如词频等因素进行分析的一个或多个算法,诸如自然语言处理(“NLP”)算法和/或词频-逆文档频率(“TF-IDF”)算法,从网页中标识一个或多个主题,并且计算与这些主题相关联的置信度得分。例如,在一些实现方式中,主题提取器312可以使用词性标注器来为从网页中的语句或段落提取的每个关键字或短语分配置信度得分。然后,主题提取器312可以生成关键字和短语的相关图,并且使用相关图来从网页中进一步提取附加的关键字和短语。

与主题相关联的置信度得分可以是网页与主题的相关程度的度量。置信度得分可以被归一化为从0到1的范围,1是最相关。例如,如果网页主要是关于鞋子的,并且在较少程度上与其他鞋子品牌一起讨论了Nike

例如,评论汤姆·克鲁斯主演的电影杰克·雷彻(Jack Reacher)的网页可以被分析,以提取两个主题“杰克·雷彻”和“汤姆·克鲁斯”,每个主题具有置信度得分,置信度得分指示网页与这样的主题有关的可能性程度。然后,标签生成器308(或者其中的组件)可以将从网页提取的主题与片段信息匹配来生成可以存储在用户偏好信息116中的标签。例如,标签生成器308可以在与主题“杰克·雷彻”和“汤姆·克鲁斯”的电影片段相关联的片段信息中搜索查找匹配实体,并且可以基于与那些匹配实体相关联的信息来生成标签。

在一些实现方式中,网页的内容可以与片段信息中的实体进行比较(即,执行联合操作),以确定从网页中提取的哪些主题是目标片段中的实体(诸如,电影名称、演员名称等)。例如,如果网页多次提及“杰克·雷彻”,则标签生成器308可以搜索“杰克·雷彻”的放映时间片段信息,并且响应于找到具有该名称的电影实体而确定它是电影。如果在体育片段信息中进行了同样的搜索并且没有找到“杰克·雷彻”,则可以确定杰克·雷彻的主题(可能还有网页)与体育无关。

在某些实现方式中,由个性化搜索引擎108返回的搜索结果可以包括与某些搜索结果相关联的实体ID,其中那些实体ID与片段信息中存储的实体的实体ID匹配。如果用户102点击特定搜索结果(例如,满意点击),则标签生成器308可以使用与所点击的搜索结果相关联的实体ID、在片段信息中查找实体ID来找到匹配实体,并且使用关于片段信息中存储的匹配实体的信息来生成将要存储在用户偏好信息116中的一个或多个标签。另一方面,如果所点击的搜索结果不具有相关联的实体ID,则如上所述,标签生成器308可以分析网页的内容来生成一个或多个标签。此外,两种方法的组合可以被实现。

根据本构思的一些实现方式,标签生成器308可以计算与标签相关联的置信度值。置信度值可以被归一化为从0到1的范围,1指示用户102的最高偏好或感兴趣程度。置信度值的其他范围和方法是可能的。在一个示例实现方式中,如果用户102搜索“a star isBorn”,则标签生成器308可以计算A Star Is Born标签的置信度值1。附加地,标签生成器308可以在电影片段信息中引用“A Star Is Born”实体,并且生成附加标签和相关联的置信度值。例如,标签生成器308可以创建置信度值为0.6的爱情流派标签、置信度值为0.7的英语语言标签、置信度值为0.8的Lady Gaga标签等(见图2)。这些标签示例将分别指示用户102对爱情流派电影、英语电影和Lady Gaga具有一定程度的偏好。置信度值可以使用基于规则的算法和/或机器学习模型来计算。

作为另一示例,如果用户102的活动历史114指示用户102具有提交对电影标题(诸如,“星球大战”、“阿凡达”、“矩阵”和“星际迷航”)的搜索查询的历史并且具有浏览与这些电影相关的网页的历史,并且电影片段信息中的相关联电影实体将这些电影实体归类为科幻流派,则标签生成器308可以创建将要存储在用户102的用户偏好信息116中的科幻流派标签。科幻标签将指示用户102对科幻电影感兴趣,这是从涉及若干科幻电影的查询历史302和浏览历史306推断的。

在上述示例中,与科幻流派相关的搜索和浏览活动的多次出现可以在用户偏好信息116中生成科幻流派标签的多个实例。因此,这样的标签集群(根据标签的数量以及与之相关联的置信度值)可以指示用户对科幻流派的强烈偏好。在一个备选实现方式中,随着用户102提交附加的搜索查询并且浏览与科幻流派相关的更多网页,标签生成器308可以例如基于与多个搜索查询和多个网页相关联的置信度值的加权和,通过提高与用户偏好信息116中的一个科幻流派标签相关联的置信度值来逐步提升用户对科幻流派的偏好。即,用户102执行与科幻电影、科幻演员、科幻零售购物等相关的活动(查询、点击和浏览)的次数越多(例如,观看大量科幻电影预告片),针对科幻流派标签的更高的置信度值可以被存储在用户偏好信息116中,指示用户102具有对科幻流派的强烈偏好。

作为另一示例,如果如活动历史114所指示的,用户102在过去6个月内点击了与电影相关的20个搜索结果,则标签生成器308可以基于电影片段信息确定这20部电影中有12部电影是印地语,并且20部电影中有7部电影是法语。因此,标签生成器308可以将置信度值为0.8的印地语标签和置信度值为0.6的法语标签存储在用户偏好信息116中。

根据本构思的一些实现方式,用户偏好信息116可以存储不喜欢(即,偏好和兴趣的相反)。例如,用户102可以使用排除运算符“NOT”(对于一些搜索提供方,这可以由减号或连字符来指示)来提交搜索查询。排除型搜索查询词可以被用于推断用户的不喜欢。附加地,用户102还可以基于与不满意点击和/或不满意网页相关联的短停留时间而表现出不喜欢。可以基于只浏览了很短时间的网页来推断用户的不喜欢。活动历史114可以记录指示用户不喜欢的这样的活动,并且标签生成器308可以生成不喜欢标签(或者负偏好标签)。例如,与标签相关联的置信度值的范围可以从-1到1,其中负置信度值指示不喜欢,而-1指示最不喜欢。此外,即使在用户偏好信息116包含具有正置信度值的标签的情况下,指示对该标签不喜欢的后续用户活动也可以导致标签生成器将用户对标签的偏好降级(即,将与标签相关联的置信度值降低到负值范围中)。

根据本构思的一些实现方式,数据过滤器314可以从用户偏好信息116中标识和排除某些主题。例如,某些有争议的主题(诸如,成人、政治和医学主题)可以被过滤并且从用户偏好信息116中排除。出于隐私原因,用户102可能不希望她的与成人内容、政治问题和/或医疗问题有关的偏好被跟踪和存储。此外,用户102可能不希望呈现给她的搜索结果110的排名对于某些主题(包括政治)有偏见。这样的主题可以从用户偏好信息116中排除,并且甚至从活动历史114中排除。在一个实现方式中,可以通过从片段信息中排除主题来针对所有用户全局地排除这样的主题。

数据过滤器314可以包括一个或多个分类器。例如,数据过滤器314可以包括成人分类器316。成人分类器316可以对实体提取器310所标识的与成人主题有关的实体、主题提取器312所标识的与成人主题有关的主题和标签生成器308所生成的与成人主题有关的标签中的一个或多个进行分类。类似的分类器可以在数据过滤器314中实现,以用于对政治主题、医疗主题或数据过滤器314可以被配置为过滤的任何其他主题进行分类。

在一些实现方式中,数据过滤器314可以包括域分类器318。域分类器318可以包括与某些主题相关的域的列表或数据库。例如,域分类器318可以包括成人内容域、政治域和/或医疗域的列表。域分类器318可以使用这些列表来将来自点击历史304和/或浏览历史306的网页分类为与应由数据过滤器314过滤的主题有关。

如果标签涉及由分类器过滤的主题,则数据过滤器314可以排除标签被存储在用户偏好信息116中。在一个实现方式中,用户102可以被给予选项(经由设置配置)来选择要过滤的一个或多个主题(例如,成人、政治、医疗等)。

图4示出了表示用户偏好信息116的示例的图。用户偏好信息116可以以列表结构、表格结构、图形结构或任何其他数据结构被存储。图4中的示例被示出为以图形结构被存储。用户偏好信息116可以包含与用户102相关联的用户ID 402。在该示例中,用户102是Jane Doe并且她的用户ID 402是具有值0123456789的匿名ID(ANID)。用户偏好信息116可以包括与用户ID 402相关联的一个或多个标签404,并且每个标签404可以与实体ID相关联并且具有置信度值。在该示例中,标签404(1)针对动作流派,由实体ID 012指示,并且具有0.3的置信度值;标签404(2)针对爱情流派,由实体ID 345指示,并且具有0.6的置信度值;标签404(3)针对AMC

虽然图4中所示的示例包括名称(即,用户102的名称和标签404或匹配实体的名称),但是这些名称可以从用户偏好信息116中被排除,因为用户ID 402和实体ID可以是足够的标识。此外,虽然为了例示的目的,图4中的用户偏好信息116的简化示例仅包括四个标签404,但是根据本构思,用户偏好信息116可以包含大量标签404。同样,尽管图4中的示例仅包括直接连接到用户ID 402的一个级别或层级的标签404,但是根据本构思,标签404可以被组织成具有分层结构的多个级别或层级。

图4中描绘的示例用户偏好信息116可以与放映时间片段相关联。尽管未示出,但是与例如鞋零售购物片段相关联的用户偏好信息116可以包括指示用户关于与鞋有关的主题和实体的偏好的标签,诸如某些鞋的品牌、鞋的商家卖家、鞋的尺码、鞋的类型、价格点、名人运动员的签发等。在一些实现方式中,用户偏好信息116可以与一个特定片段相关联,并且因此包括仅与一个片段相关的标签。在其他实现方式中,用户偏好信息116可以包含与多个片段相关的标签。

根据本构思的一些实现方式,用户偏好信息116可以被更新。用户偏好和兴趣会随着时间而改变。例如,用户102可能在冬天更喜欢购买靴子(一种类型的鞋)而在夏天更喜欢购买凉鞋(一种不同类型的鞋)。用户102在某一时刻可能只喜欢恐怖电影,但是在有了孩子之后,现在也喜欢家庭电影。用户102可能在某个时间点偏爱美国联合航空公司,但在糟糕的体验之后,开始完全抵制它们。因此,随着用户提交附加搜索查询、点击附加搜索结果和/或浏览附加网页,活动历史114可以被更新为包括用户102的最近活动。

在一些实现方式中,活动历史114可以包括针对用户102记录的所有过去的活动,而不管这些活动何时发生。备选地,滚动窗口方法可以被用于从活动历史114中移除用户102的旧活动,使得活动历史114可以是有时间限制的。例如,活动历史114可以仅包括用户102从例如过去一个月、过去6个月、过去12个月、过去5年等的活动。不同的片段可以使用不同的时间段窗口来限制活动历史114。

以上参考图3和图4描述的由标签生成器308生成标签404和/或计算或更新置信度值的过程可以在活动历史114被用户102使用新活动更新时实时执行。备选地,过程可以被安排为相对于自上次运行以来已记录在活动历史114中的新添加的活动,周期性地执行(例如,每天、每周、每月、每季度、每年等)。此外,无论活动历史114是否包含更新,如果片段信息已被更新,标签生成器308可以参考经更新的片段信息来尽可能地更新用户偏好信息116。

图5示出了图示用于推断用户偏好信息的偏好推断方法500的流程图。在一些实现方式中,偏好推断方法500中的动作可以在预搜索处理阶段期间执行。

在动作502中,与片段相关联的片段信息可以被接收。片段信息可以从片段数据提供方和/或片段数据爬虫被接收。片段信息可以包括关于与片段有关的实体的信息。

在动作504中,与用户相关联的活动历史可以被接收。在一些实现方式中,活动历史可以包括查询历史、点击历史或浏览历史中的一个或多个。活动历史可以从网络浏览器和/或个性化搜索引擎被接收。

在动作506中,一个或多个主题或实体可以从用户的活动历史中被提取。例如,来自点击历史的搜索查询的文本或者与点击历史和/或浏览历史相关联的网页的内容可以被解析和分析来标识活动历史所相关的一个或多个主题或实体。

在动作508中,与动作506中提取的一个或多个主题或实体匹配或相关的一个或多个实体可以在片段信息中被找到。例如,如果在动作506中从关于电影和演员网页的中提取实体“杰克·达奇”和“汤姆·克鲁斯”,则该片段信息可以在动作508中被搜索来找到在片段信息中存储的针对杰克·雷彻和汤姆·克鲁斯的实体。如果活动历史与片段相关,搜索可能会导致命中,但如果活动历史与片段无关,则搜索可能没有命中,并且该方法中的后续动作可能不会对活动历史执行。

在动作510中,一个或多个标签可以被生成,并且对应的置信度值可以被计算。在动作508中的片段信息中找到的关于实体的信息可以被用于生成标签并且计算置信度值。

在动作512中,标签和置信度值可以被存储在与用户相关联的用户偏好信息中。因此,根据本构思,用户偏好信息可以准确地反映从用户的活动历史中推断出的用户偏好和兴趣。随着更多用户的活动历史被跟踪和分析,用户偏好信息的准确性和全面性可以提高。

搜索时处理

图6示出了图示用于提供搜索结果的个性化排名的个性化方法600的流程图。个性化方法600中的动作可以在搜索时处理阶段执行,而与生成片段信息和用户偏好信息相关的处理在上文已被描述为在预搜索处理阶段执行。然而,在预搜索处理阶段期间执行的上述任何动作可以在搜索时处理阶段期间执行。

在动作602中,搜索查询可以从用户接收。例如,用户可以向web浏览器输入搜索查询,并且搜索提供方可以从web浏览器接收搜索查询。在步骤604中,与搜索查询相对应的搜索结果可以被获得。例如,搜索提供方可以基于搜索查询,使用个性化搜索引擎进行搜索来获得搜索结果。

在动作606中,搜索查询可以被分类到目标片段中。例如,如果搜索查询是“来自西雅图的航班”或“感恩节周末的廉价航班”,则目标片段可以被标识为航班片段。作为另一示例,如果搜索查询是“女鞋折扣”或“黑色星期五鞋类销售”,则搜索查询可以被分类为针对鞋类零售购物片段。

在一些实现方式中,目标片段可以基于搜索查询来标识。例如,当搜索查询被接收时,触发特定片段的1000万个查询的白名单可以被存储和引用。如果在白名单中找到搜索查询,则搜索查询可以被分类到与白名单相关联的片段中。如果在白名单中未找到搜索查询,则可以执行附加的分析。例如,基于语法的规则(诸如,“航班来自”+[地理位置])可以被用于将搜索查询分类为目标片段。

在其他实现方式中,在动作604中从个性化搜索引擎获得的搜索结果可以被分析来确定目标片段。例如,所有搜索结果或仅顶部搜索结果(例如,根据通用、非个性化排名的前十个搜索结果)可以被评估来确定例如它们与电影放映时间片段或体育片段等相关。在一个实现方式中,搜索查询和搜索结果两者可以被分析来确定目标片段。在搜索结果未被用来标识目标片段的情况下,动作606可以在动作604之前执行。此外,如果在片段的白名单中未找到的搜索查询已基于对搜索查询和/或搜索结果的分析而被分类到片段中,则搜索查询可以被添加到白名单,以避免对相同搜索查询的未来提交进行分析。

在动作608中,可以确定搜索查询不针对已实现了提供个性化排名的本构思的任何片段。在这样的场景中,在动作610中,搜索结果可以以不针对用户个性化的通用排名而被返回给用户。例如,通用排名可以是个性化搜索引擎提供的未考虑用户偏好的默认排名。

备选地,在动作612中,已实现本构思并且搜索查询所针对的目标片段可以被标识。作为响应,与所标识的片段相关联的片段信息可以被检索。在动作614中,片段信息中的实体可以被检查。即,可以针对照片段信息中存储的实体来检查搜索结果。在从个性化搜索引擎获得的搜索结果包括对应实体ID的情况下,动作614可以是在片段信息中查找实体ID的简单过程。在实体ID不被包括在搜索结果中的情况下,以上参考图3描述的从网页中提取主题的技术此处可以被用来标识与搜索结果相关的主题,然后在片段信息中搜索与所标识的主题相对应的实体。

此外,与所标识的片段相关联的用户偏好信息可以被检索。在动作616中,用户偏好信息中的标签被检查。响应于在动作614中片段信息中与搜索结果有关的某些实体(如果存在)被标识,与那些实体相关联的实体ID可以与连同标签一起存储在用户偏好信息中的实体ID进行匹配。

如果在用户偏好信息中没有找到匹配标签,则用户对特定实体没有偏好。因此,与实体相关联的搜索结果可以不根据用户偏好进行修改。但是,如果找到匹配标签,则对应的置信度值指示用户对与特定搜索结果有关的对应实体的偏好强度。因此,根据本构思,鉴于用户对特定搜索结果的兴趣,特定搜索结果可以被排名更高。

在一个备选实现方式中,动作614和616可以被不同地实现并且获得确定哪个搜索结果在用户偏好信息中具有关联置信度值的相同结果。在目标片段在动作612中被标识之后,对应的片段信息和对应的用户偏好信息可以被检索。然后,联合操作可以利用片段信息和用户偏好信息来执行,以标识用户对其具有偏好的主题或实体(如果存在)。针对与那些主题或实体相关联的标签存储的置信度值可以从用户偏好信息中获得。然后,搜索结果被分析来确定哪些搜索结果与用户偏好的主题或实体有关。

在动作618中,与标签相关联的置信度值可以连同特定搜索结果的标识被一起传递到个性化排名器。个性化排名器可以是与目标片段相关联的片段特定排名器。因此,个性化排名器可以接收与某些搜索结果相关联的标签的置信度值,作为这些搜索结果的信号或特征(诸如网页的流行度、过去的点击次数等诸多特征)。个性化排名器可以考虑与那些搜索结果相关联的置信度值来生成搜索结果的个性化排名。例如,在电影片段中,与例如流派、语言等相关联的信号可以由个性化排名器使用来对与电影实体相对应的搜索结果进行排名。因此,与某些标签相关联的置信度值可以是传递到个性化排名器以供在对搜索结果进行排名时考虑的信号。具体而言,与非个性化默认排名相比,与用户喜欢(或感兴趣)的主题或实体相关的某些搜索结果可以被排名更高。用户偏好信号的强度(由置信度值指示)可以确定某个搜索结果的排名被调整的程度。此外,在用户不喜欢被跟踪的实现方式中,与用户不喜欢的主题或实体相关的某些搜索结果可以被排名较低。在一些实现方式中,个性化排名器可以使用机器学习模型,通过考虑来自用户偏好信息的置信度值来生成搜索结果的个性化排名。

在动作620中,已根据考虑到用户的偏好而计算的个性化排名排序的搜索结果可以被返回给用户。

图7图示了显示搜索结果110的个性化排名的示例的用户界面700。在该示例中,用户界面700是web浏览器104的用户界面700。web浏览器104可以包括若干用户界面(“UI”)元素,诸如,返回导航按钮702、前进导航按钮704、刷新按钮706、主页按钮708、URL地址栏710、最小化按钮712、最大化按钮714、关闭按钮716、向上滚动按钮718、向下滚动按钮720和滚动条722。web浏览器104还可以包括用于输入搜索查询106和用于显示搜索查询106的文本框724。在该示例中,在文本框724中显示的搜索查询106是“movies(电影)”。web浏览器104还可以包括搜索按钮726,用户102可以激活搜索按钮726来使用在文本框724中输入的搜索查询106开始搜索。

根据本构思,web浏览器104可以显示响应于搜索查询106而返回的搜索结果110。搜索结果110可以根据它们的排名进行排序。在一些实现方式中,web浏览器104可以显示实体窗格728(或者实体框),其可以类似于通常被称为丰富答案框的内容。实体窗格728可以被用于显示与目标片段中的特定类型实体(例如,本示例中的电影实体)相对应的实体搜索结果730的特定集合。如果有太多实体搜索结果730无法在屏幕上显示,则用户102可以通过激活下一页按钮732(1)来访问实体搜索结果730的附加页面。使用该按钮732(1)还可以显示上一页按钮(未示出)。

根据本构思,如箭头734所示,用户102偏好的一个或多个实体搜索结果730(1)和730(3)可能已被给予优先级排名。箭头734不是在web浏览器104中向用户102显示;相反,出于例示的目的,它们被绘制在图7中,以指示搜索结果730的排名已根据用户的偏好进行自定义。在图7所示的示例中,响应于指示用户102更喜欢家庭流派的电影的用户偏好信息116,与电影The Grinch和Robin Hood分别对应的实体搜索结果730(1)和730(3)可能已被排名更高。在一些实现方式中,其排名已根据用户偏好信息116进行调整的某些实体搜索结果730(1)和730(3)可以被标记(例如,突出显示或加边框)来指示个性化排名已被应用于那些搜索结果730(1)和730(3)。

排名调整的程度(由箭头734指示)可能与若干因素相关,包括例如(1)如以上讨论的由主题提取器312计算的置信度得分,置信度得分指示搜索结果730属于家庭流派的可能性,以及(2)以上讨论为由标签生成器308计算并且被存储在用户偏好信息116中的置信度值,置信度值指示用户102喜欢家庭流派的程度。

例如,如图7所示,与根据非个性化排名进行排名的位置相比,与The Grinch相对应的实体搜索结果730(1)向上移动了三个位置。并且,与Robin Hood相对应的实体搜索结果730(3)向上移动了足够多的位置,以将其带入实体窗格728中的实体搜索结果730的第一页面,而它会要求用户102一次或多次使用下一页按钮732(1),以在非个性化排名中找到该实体搜索结果730(3)。

此外,web浏览器104可以显示通用(即,非实体)搜索结果736。这些搜索结果736通常被称为“蓝色链接”。与实体搜索结果730类似,可能存在太多通用搜索结果736而无法将它们全部显示在屏幕上。因此,用户102可以使用向上滚动按钮718、向下滚动按钮720、滚动条722、下一页按钮732(2)和页面链接738中的一个或多个来显示附加的通用搜索结果736。

在该示例中,箭头734(3)指示与在非个性化排名中进行排名相比,由于用户102具有对AMC Theatres

在不喜欢被记录在活动历史114中并且负置信度值被存储在用户偏好信息116中的一些实现方式中,与用户102不喜欢的主题或实体相关的某些搜索结果110可以被调整为具有较低的排名,使得它们在靠后处出现(例如,在列表的更下方或靠后的页面中)。这样的负调整可以以与上述正调整类似的方式进行。

在一些实现方式中,个性化搜索引擎108可以向多个用户返回相同的搜索结果集合730和736,但是基于他们自己的个人偏好而仅修改那些搜索结果730和736的排名(即,排序)。在其他实现方式中,返回给不同用户的搜索结果集合730和736可以不同。

与常规搜索引擎返回的非个性化排名相比,个性化搜索引擎108返回的搜索结果730和736的个性化排名具有基于用户102的个人偏好,将用户102更感兴趣的某些搜索结果730(1)、730(3)和736(3)放置在web浏览器104的开始、前端或顶部处的益处。因为用户偏好信息116基于用户过去的活动历史114来准确地推断,用户102将认为个性化排名更相关和准确。此外,用户102更有可能快速找到相关搜索结果730(1)、730(3)和736(3),并且享受更愉快和高效的搜索体验。使用本构思的改进的个性化搜索引擎108,用户102不太可能遇到与在对搜索结果730和736进行排名时不考虑个体用户偏好的常规搜索引擎(及其通用排名器)相关联的常见问题。这些问题包括很难找到相关的搜索结果730(1)、730(3)和736(3),这些搜索结果通常被隐藏在不相关的搜索结果中,以及浪费时间滚动到搜索结果730和736列表的底部,或者在找到相关搜索结果730(1)、730(3)和736(3)之前,翻阅许多不相关的搜索结果页面。这些问题通常使得用户感到沮丧并且使得搜索成为非常不愉快的体验。此外,一些用户甚至可能不努力或没有耐心滚动或翻阅不相关的搜索结果。如果他们没有在最顶部看到相关的搜索结果,他们可能就会尝试不同的搜索查询,这进一步浪费了时间和计算资源。

示例系统

图8图示了其中可以采用本构思的一些实现方式的示例系统800。出于解释的目的,系统800可以包括一个或多个客户端设备802以及一个或多个服务器设备804。所描述和描绘的设备数量和设备类型旨在是例示性的而非限制性的。设备802或804的示例可以包括传统的计算设备,诸如个人电脑、台式电脑、服务器、笔记本电脑、手机、智能手机、个人数字助理、平板电脑、移动电脑、可穿戴设备、相机、电器、信息亭、智能设备、物联网设备、车辆等,和/或无数不断发展或尚未开发的计算设备类型中的任一个。在所示示例中,客户端设备802可以包括膝上型计算机。

设备802和804可以经由一个或多个输入控件(诸如,键盘、鼠标、触摸屏或语音命令)来控制。客户端设备802和服务器设备804可以经由一个或多个网络806彼此通信。网络806可以包括内联网和/或因特网,并且可以是有线的或无线的。

在一些实现方式中,客户端设备802或服务器设备804中的每一个可以作为独立设备执行上述本构思的过程(包括偏好推断方法和个性化方法600)。备选地,在其他实现方式中,上述本构思的任何或所有动作的执行可以按照客户端-服务器模型在客户端设备802和服务器设备804之间进行划分。

在一个实现方式中,客户端设备802可以包括软件应用程序,诸如上述的web浏览器104。用户102可以与客户端设备802上的web浏览器104交互来执行搜索、浏览网页并且接收根据本构思的搜索结果的个性化排名。

服务器设备804可以由搜索提供方来操作。服务器设备804可以包括例如片段特定的个性化模块808,片段特定的个性化模块808可以是实现上述本构思的全部或部分的软件、硬件或两者的组合。例如,片段特定的个性化模块808可以包括个性化搜索引擎108、个性化排名器112、标签生成器308和数据过滤器314中的一个或多个。片段特定的个性化模块808可以执行偏好推断方法500和/或个性化方法600中描述的一个或多个动作。服务器设备804可以包括一个或多个数据库118来存储片段信息828和/或用户偏好信息116。客户端设备802和服务器设备804之一或两者可以记录和/或存储用户102的活动历史114。

本文中使用的术语“设备”、“计算机”或“计算设备”可以指具有一定量的处理能力和/或存储能力的任何类型的设备。处理能力可以由一个或多个硬件处理器来提供,硬件处理器可以执行计算机可读指令的形式的数据来提供功能。数据,诸如计算机可读指令和/或用户相关数据,可以被存储在存储装置上,可以被存储诸如可以在设备内部或外部的存储装置上。存储装置可以包括易失性或非易失性存储器、硬盘驱动装置、闪存设备和/或光学存储设备(例如,CD、DVD等)、远程存储装置(例如,基于云的存储)等中的任一个或多个。如本文所使用的,术语“计算机可读介质”可以包括瞬时传播信号。相反,术语“计算机可读存储介质”不包括瞬时传播信号。计算机可读存储介质包括“计算机可读存储设备”。计算机可读存储设备的示例包括诸如RAM的易失性存储介质以及诸如硬盘驱动装置、光盘和闪存等的非易失性存储介质。

图8示出了可以由客户端设备802和/或服务器设备804中的任一个或全部采用的两个示例设备配置810(1)和810(2)。客户端设备802和服务器设备804可以采用配置810(1)或810(2)中的任一个或者备选配置。每个配置810的一个实例在图8中图示。设备配置810(1)可以表示以操作系统(OS)为中心的配置。设备配置810(2)可以表示片上系统(SOC)配置。设备配置810(1)可以被组织成一个或多个应用程序812、操作系统814和硬件816。设备配置810(2)可以被组织成共享资源818、专用资源820和它们之间的接口822。

在任一配置810中,设备802或804可以包括存储装置/存储器824和处理器826。存储装置824可以包括用户偏好信息116和/或片段信息828,用户偏好信息116和/或片段信息828可以被存储在存储装置824中的一个或多个数据库118中。设备802或804还包括图8中未图示的其他组件,诸如电池(或其他电源)、网络通信组件和/或输入-输出组件。如上所述,设备802或804还可以包括片段特定的个性化模块808。

在设备配置810(2)的情况下,设备802或804提供的某些功能可以被集成在单个SOC或多个耦合的SOC上。一个或多个处理器826可以被配置为与共享资源818(诸如存储装置/存储器824等)和/或一个或多个专用资源820(诸如被配置为执行某些特定功能的硬件块)协调。本文中使用的术语“处理器”还可以指代硬件处理器,诸如中央处理单元(CPU)、图形处理单元(GPU)、控制器、微控制器、处理器内核、现场可编程门阵列(FPGA)或其他类型的处理设备。

结论

本文中描述的构思可以被扩展并应用于用户偏好信息116可以被用于向用户102提供更加个性化的数据或体验的任何领域。例如,搜索提供方向用户102提供的搜索查询建议可以利用用户偏好信息116来推荐更针对特定用户的偏好和兴趣的某些搜索查询建议。作为另一示例,用户偏好信息116可以被用于向用户102提供用户102很可能感兴趣的主动通知或馈送。例如,如果用户偏好信息116指示用户102具有对汤姆克鲁斯主演的电影的非常强烈的偏好,则即使用户102从未请求关注这样的新电影,也可以向用户102发送关于汤姆克鲁斯主演的新的、即将上映的电影的通知(例如,馈送、警报或广告)。此外,用户偏好信息116可以被分析来向用户102建议更可能感兴趣的电影、播客、电视节目等的首选。

以上描述了各种设备示例。以下描述了附加示例。一个示例包括系统,系统包括一个或多个数据库,数据库存储与片段相关联的片段信息,片段信息包括与片段有关的实体的信息以及与用户相关联的用户偏好信息,用户偏好信息包括对应于片段信息中的实体的标签,标签具有作为用户关于相应实体的偏好的度量的置信度值。系统还包括一个或多个硬件处理器以及存储计算机可读指令的至少一个计算机可读存储介质,计算机可读指令在由一个或多个硬件处理器执行时,使一个或多个硬件处理器:接收用户的活动历史;至少基于活动历史和片段信息来生成用户偏好信息;从用户接收搜索查询;生成响应于搜索查询的搜索结果;至少基于搜索查询或搜索结果,确定搜索查询针对片段;通过确定特定搜索结果与片段信息中的特定实体相关来推断针对特定搜索结果的用户偏好,其中用户偏好信息中存在针对该特定实体的对应标签;通过至少基于与对应标签相关联的特定置信度值,提升特定搜索结果的排名,对搜索结果进行排名,以生成反映特定搜索结果的经提升的排名的搜索结果的个性化排名;以及将搜索结果的个性化排名提供给用户。

另一示例可以包括上述和/或以下示例中的任一个,其中片段与以下一项相关:放映时间、零售购物、体育或航班。

另一示例可以包括上述和/或以下示例中的任一个,其中关于实体的信息被存储在一个或多个实体图中。

另一示例可以包括上述和/或以下示例中的任一个,其中片段信息中的实体具有实体标识符并且用户偏好信息中的对应标签具有匹配的实体标识符。

另一示例可以包括上述和/或以下示例中的任一个,其中活动历史包括查询历史、点击历史或浏览历史中的至少一个。

另一示例可以包括上述和/或以下示例中的任一个,其中点击历史包括满意点击并且排除不满意点击,并且满意点击至少基于停留时间来与不满意点击进行区分。

另一示例可以包括上述和/或以下示例中的任一个,其中活动历史落入指定时间段内。

另一示例可以包括上述和/或以下示例中的任一个,其中用户偏好信息被存储在用户图中。

另一示例可以包括上述和/或以下示例中的任一个,其中特定搜索结果的排名被提升的程度至少基于特定置信度值。

另一示例包括方法,方法包括:接收包括关于与片段有关的实体的信息的片段信息;接收用户的活动历史;至少基于活动历史和片段信息来生成标签和相关联的置信度值,标签对应于片段信息中的实体;在用户偏好信息中存储标签和相关联的置信度值;从用户接收搜索查询;至少基于搜索查询而获得搜索结果;至少基于搜索查询或搜索结果,确定搜索查询针对片段;通过确定特定搜索结果与片段信息中的特定实体相关来推断针对特定搜索结果的用户偏好,其中用户偏好信息中存在针对该特定实体的对应标签;至少基于与对应标签相关联的特定置信度值来提升特定搜索结果的排名,以生成搜索结果的个性化排名;以及向用户提供搜索结果的个性化排名。

另一示例可以包括上述和/或以下示例中的任一个,其中生成标签和相关联的置信度值包括确定活动历史与片段信息中的实体相关。

另一示例可以包括上述和/或以下示例中的任一个,其中接收活动历史包括接收查询历史、点击历史或浏览历史中的至少一个。

另一示例可以包括上述和/或以下示例中的任一个,其中生成标签和相关联的置信度值包括分析与点击历史或浏览历史相关联的网页来确定网页与片段信息中的一个或多个实体相关,其中标签对应于一个或多个实体。

另一示例可以包括上述和/或以下示例中的任一个,其中生成置信度值包括使用机器学习模型来计算置信度值,作为用户针对相关联的标签的偏好的度量,该相关联的标签对应于片段信息中的实体。

另一示例可以包括上述和/或以下示例中的任一个,其中上述方法还包括接收用户的经更新的活动历史并且至少基于经更新的活动历史来更新用户偏好信息。

另一示例可以包括上述和/或以下示例中的任一个,其中确定特定搜索结果与特定实体相关包括解析和分析与特定搜索结果相关联的网页的内容。

另一示例可以包括上述和/或以下示例中的任一个,其中提升特定搜索结果的排名包括使用机器学习模型来提高特定搜索结果的排名,其中提高的量基于至少特定置信度值。

另一示例包括包含指令的计算机可读存储介质,指令在由一个或多个硬件处理器执行时,使一个或多个硬件处理器执行过程,过程包括:存储与片段相关联的片段信息,片段信息包括与片段有关的实体的信息,实体具有实体标识符;接收用户的活动历史;至少基于活动历史和片段信息来生成与用户相关联的用户偏好信息,用户偏好信息包括具有与片段信息中的实体标识符匹配的实体标识符的标签,标签与置信度值相关联,置信度值衡量用户喜欢片段信息中的对应实体的程度;从用户接收搜索查询;获得响应于搜索查询的搜索结果;基于搜索查询或搜索结果,将搜索查询分类为针对片段;分析与特定搜索结果相关联的网页,以标识片段信息中与特定搜索结果相关的特定实体;至少基于与特定实体相关联的特定实体标识符,在用户偏好中找到对应于特定实体的特定标签;至少基于与特定标签相关联的特定置信度值,增加特定搜索结果的排名;至少基于特定搜索结果的提高的排名,生成搜索结果的个性化排名;以及将搜索结果的个性化排名发送给用户。

另一示例可以包括上述和/或以下示例中的任一个,其中指令进一步使一个或多个硬件处理器将一个或多个标签分类为有争议的主题,并且将一个或多个标签从用户偏好信息中排除。

另一示例可以包括上述和/或以下示例中的任一个,其中分析网页包括从网页中提取一个或多个主题并且标识片段信息中与一个或多个主题相关的一个或多个实体。

虽然已以结构特征和/或方法行为特定的语言描述了主题,但在所附权利要求中限定的主题不一定限于上述特定特征或动作。相反,上述特定特征和动作被呈现为实现权利要求的示例形式,并且本领域技术人员将认识到的其他特征和动作旨在落入权利要求的范围内。

相关技术
  • 个性化搜索结果排名
  • 对搜索结果文档进行排名
技术分类

06120113106556