掌桥专利:专业的专利平台
掌桥专利
首页

用于玩家安排比赛的机器学习的信任度评分

文献发布时间:2023-06-19 10:58:46


用于玩家安排比赛的机器学习的信任度评分

相关申请的交叉引用

本申请是要求于2018年9月7日提交的题为“用于玩家安排比赛的机器学习的信任度评分(MACHINE-LEARNED TRUST SCORING FOR PLAYER MATCHMAKING)”的美国专利申请序列号16/125,224的优先权的PCT申请,所述美国专利申请特此通过引用以其全文并入。

背景技术

广域网通信的恒定或几乎恒定的可用性,加上客户端机器能力的增强,已导致在线多玩家视频游戏的普及。在这些多玩家视频游戏中,视频游戏服务可以使用安排比赛系统将玩家分组在一起比赛,以便分组的玩家可以在多玩家模式下一起玩视频游戏。第一人称射击游戏类型是玩家经常在多玩家模式下玩耍的一种流行视频游戏类型。在此示例类型中,两个或更多玩家团队可以在多个回合中对抗,目的是赢得足够的回合以赢得比赛。同一个团队中的玩家可以共同努力实现目标,同时与对方团队的玩家对抗。

尽管绝大多数视频游戏玩家都不从事作弊行为,但通常存在一小群体玩家作弊以获取比其他玩家的优势。经常,作弊玩家使用第三方软件,该软件给他们提供一些信息或与其他玩家相比提供机械优势。例如,第三方软件可以被配置为提取关于其他玩家的位置的位置数据,并且可以将这些位置呈现给作弊玩家。这种信息优势允许作弊玩家伏击其他玩家,或者以其他方式利用第三方软件显示的位置信息。作弊的一种更明显的方式是使用第三方软件,该软件能够检测其他玩家的位置并自动使作弊者的化身运动(例如,通过编程方式将鼠标光标移动到目标玩家并以自动方式发射武器)。换句话说,一些玩家通过使用计算机化算法通过使第三方软件代表他们玩视频游戏而作弊,这些算法从机械角度增强了作弊玩家的表现。

通常,不良的玩家行为(例如作弊)破坏想要合法玩游戏的玩家的游戏体验。因此,如果打算进行不良行为的玩家与表现出良好行为的其他玩家相匹配,则对于行为良好的玩家而言,多玩家视频游戏体验将受到破坏。当今使用的试图识别可能导致未来不良行为的玩家的系统的预测有些不准确。这些系统在很大程度上是静态的,因为它们基于静态定义的规则和输入,这意味着必须手动调整它们才能更改系统的输出。相对于这些和其他考虑因素,提出了本文所作的公开。

附图说明

参考附图描述具体实施方式。在图中,附图标记的最左边的一个或多个数字标识附图标记首次出现的图。在不同附图中使用同一附图标记指示类似或相同的组件或特征。

图1是图解了示例环境的图,该示例环境包括远程计算系统,该远程计算系统被配置为训练和使用机器学习模型来确定与玩家的可能行为有关的信任度得分,并基于该机器学习的信任度得分将玩家匹配在一起。

图2示出了图解图1的远程计算系统的示例组件的框图,以及图解如何将机器学习的信任度评分用于玩家安排比赛的图。

图3是用于训练机器学习模型以预测玩家根据特定行为表现或不根据特定行为表现的概率的示例过程的流程图。

图4是用于利用受训练的机器学习模型确定用户账户的信任度得分的示例过程的流程图,该信任度得分与玩家根据特定行为表现或不根据特定行为表现的概率有关。

图5是用于基于与可能的玩家行为有关的机器学习的信任度得分将用户账户分配给多玩家视频游戏的不同比赛的示例过程的流程图。

具体实施方式

在本文中描述了用于使用机器学习方法来生成信任度得分,然后使用机器学习的信任度得分来在多玩家视频游戏设置中将玩家匹配在一起的技术、设备和系统等。公开的技术可以至少部分地由远程计算系统来实现,该远程计算系统将视频游戏(及其内容)分发到用户社区的客户端机器作为视频游戏服务的一部分。这些客户端机器可以单独地安装客户端应用程序,该客户端应用程序被配置为执行从远程计算系统接收(例如,下载、流式传输等)的视频游戏。该视频游戏平台使社区的注册用户可以作为“玩家”玩视频游戏。例如,用户可以加载客户端应用程序,使用注册的用户帐户登录,选择所需的视频游戏,和通过客户端应用程序在他/她的客户端机器上执行视频游戏。

每当上述用户访问和使用该视频游戏平台时,就可以由远程计算系统收集数据,并且可以由远程计算系统与注册的用户帐户相关联地维护该数据。随着时间的流逝,人们会意识到,与已注册用户帐户绑定的大量历史数据可能对远程计算系统可用。然后,远程计算系统可以使用一部分历史数据作为训练数据来训练一个或多个机器学习模型。例如,与采样的用户帐户集相关联的历史数据的一部分可以由一组特征来表示,并被标记以指示过去在玩视频游戏时以特定方式表现的玩家。在此数据上训练的机器学习模型能够通过输出针对视频游戏服务注册的用户帐户的机器学习的得分(例如,信任度得分)来预测玩家行为。这些机器学习的得分可用于玩家安排比赛,以便可以将可能根据特定行为表现或不根据特定行为表现的玩家在多玩家视频游戏设置中分组在一起。

在示例过程中,计算系统可以确定向视频游戏服务注册的多个用户账户的得分(例如,信任度得分)。可以通过访问与各个用户帐户相关联的数据、将数据作为输入提供给受训练的机器学习模型、并作为受训练的机器学习模型的输出生成与各个用户相关联的得分,确定各个得分。得分与在多玩家模式下玩一个或多个视频游戏时与各个用户账户根据特定行为表现或不根据特定行为表现的概率有关。此后,计算系统可以从多个客户端机器接收信息,该信息指示登录到执行视频游戏的客户端应用程序中的登录用户帐户,并且计算系统可以定义要将玩家分组到其中以在多玩家模式下玩视频游戏的多个比赛。这些多个比赛可以至少包括第一比赛和第二比赛。计算系统可以至少部分地基于为登录用户帐户确定的得分,将登录用户帐户的第一子集分配给第一比赛,并将登录用户帐户的第二子集分配给第二比赛,并且可以使与登录用户帐户的第一子集相关联的客户端机器的第一子集在第一比赛中执行视频游戏,同时使与登录用户账户的第二子集相关联的客户端机器的第二子集在第二比赛中执行视频游戏。

本文描述的技术和系统可以为希望以原本应该玩的方式在多玩家游戏模式下玩视频游戏的用户提供改善的游戏体验。这是因为本文所述的技术和系统能够将可能表现不良(例如,作弊)的玩家匹配在一起,并将那些玩家与其他可能合法玩视频游戏的受信任玩家隔离开。例如,受训练的机器学习模型可以通过向用户帐户分配表示每个玩家作弊(或不作弊)倾向的对应信任度得分来学习预测哪些玩家可能作弊以及哪些玩家不可能作弊。以这种方式,具有低(例如,低于阈值)信任度得分的玩家可以被匹配在一起,并且可以与用户账户被赋予高(例如,超过阈值)信任度得分的其他玩家隔离,使受信任的玩家在比赛中玩而没有任何可能作弊的玩家。尽管将阈值得分的使用描述为提供匹配分配的一种示例方式,但是可以想到其他技术,例如聚类算法或使用信任度得分来优先匹配具有“相似”信任度得分的用户帐户(玩家)在一起的其他统计方法(例如,基于相似性度量,例如距离度量、方差度量等)。

本文描述的技术和系统还改进了现有的比赛安排技术,该现有技术使用静态规则来确定用户的信任度级别。但是,机器学习模型可以学习识别玩家行为的复杂关系,从而更好地预测玩家行为,这对于基于静态规则的方法是不可能的。因此,与现有的信任系统相比,本文描述的技术和系统允许生成更准确地预测玩家行为的信任度得分,从而导致较低的误报率和较少的被归因于不准确信任度得分的玩家实例。与现有系统相比,本文描述的技术和系统还更适应于改变玩家行为的动态,因为机器学习模型可以使用新数据进行再训练,以随着玩家行为改变随时间适应机器学习模型对玩家行为的理解。本文描述的技术和系统可以进一步以本文描述的各种方式允许一个或多个设备在处理资源、存储器资源、网络资源等方面节省资源。

应当理解,尽管本文描述的许多示例将“作弊”称为目标行为,通过该行为可以对玩家进行评分和分组以进行比赛安排,但是本文描述的技术和系统可以配置为使用机器学习的评分方法识别任何类型的行为(好或坏),并出于安排比赛目的预测玩家参与该行为的可能性。因此,所述技术和系统可以扩展到在不良行为(例如作弊)的背景中的“信任”评分的概念之外,并且可以更广泛地将得分归因于指示玩家之间和睦相处或亲和力的用户帐户。

图1是图解了示例环境100的图,该示例环境包括远程计算系统,该远程计算系统被配置为训练和使用机器学习模型来确定与玩家的可能行为有关的信任度得分,并基于该机器学习的信任度得分将玩家匹配在一起。用户102社区可以与一个或多个客户端机器104相关联。图1中所示的客户端机器104(1)-(N)表示可由用户102在其上执行诸如视频游戏的程序的计算设备。因此,图1中所示的用户102有时称为“玩家”102,并且这些名称在本文中可以互换使用,以指客户端机器104的人类操作员。客户端机器104可以被实现为被配置为执行视频游戏并在相关联的显示器上渲染图形的任何合适类型的计算设备,包括但不限于个人计算机(PC)、台式计算机、膝上型计算机、移动电话(例如智能电话)、平板电脑、便携式数字助理(PDA)、可穿戴式计算机(例如虚拟现实(VR)耳机、增强现实(AR)耳机、智能眼镜等)、车载(例如小车载)计算机、电视(智能电视)、机顶盒(STB)、游戏机和/或任何类似的计算设备。此外,客户端机器104可以在它们各自的平台(例如,硬件和软件)方面不同。例如,图1所示的多个客户端机器104可以表示在处理能力(例如,中央处理单元(CPU)模型、图形处理单元(GPU)模型等)、图形驱动器版本等方面具有不同能力的不同类型的客户端机器104。

客户端机器104可以通过计算机网络108与远程计算系统106(有时在本文中简称为“计算系统106”或“远程系统106”)通信。计算机网络108可以代表和/或包括但不限于Internet、其他类型的数据和/或语音网络、有线基础设施(例如同轴电缆、光缆等)、无线基础设施(例如射频(RF)、蜂窝、卫星等)和/或其他连接技术。在某些情况下,计算系统106可以是可通过计算机网络108维护和访问的网络可访问计算平台的一部分。可以使用诸如“按需计算”、“软件即服务(SaaS)”、“平台计算”、“网络可访问平台”、“云服务”、“数据中心”等等术语指代诸如这种的网络可访问计算平台。

在一些实施例中,计算系统106用作视频游戏平台,或有权访问视频游戏平台,该视频游戏平台实施视频游戏服务以向客户端机器104分发(例如,下载、流式传输等)视频游戏110(及其内容)。在示例中,客户端机器104可各自在其上安装客户端应用程序。安装的客户端应用程序可以是视频游戏客户端(例如,玩视频游戏110的游戏软件)。具有已安装的客户端应用程序的客户端机器104可以配置为通过计算机网络108从计算系统106下载、流式传输或以其他方式接收程序(例如,视频游戏110及其内容)。可以将任何类型的内容分发模型用于此目的,例如直接购买模型(其中程序(例如,视频游戏110)可单独购买以在客户端机器104上下载和执行)、基于订阅的模型、内容-分发模型(其中程序在一段时间内被租借或租赁,流式传输或以其他方式提供给客户端机器104)。因此,单个客户端机器104可以包括一个或多个安装的视频游戏110,其可以通过加载客户端应用程序来执行。

如图1中的附图标记112所示,客户端机器104可以用于向视频游戏服务注册,然后登录到视频游戏服务。用户102可以为此目的创建用户帐户,并指定/设置绑定到注册用户帐户的凭证(例如,密码、PIN、生物特征ID等)。当多个用户102与视频游戏平台交互时(例如,通过使用注册的用户帐户访问其用户/玩家配置文件,在其各自的客户端机器104上玩视频游戏110等),客户端机器104发送数据114到远程计算系统106。对于给定的客户端机器104,发送到远程计算系统106的数据114可以包括但不限于用户输入数据、视频游戏数据(例如上载到远程系统的游戏性能统计数据)、社交网络消息和相关活动、在客户端机器104上玩的视频游戏110的标识符(ID)等。该数据114可以被实时地(或基本实时地)流式传输,以限定的间隔发送到远程系统106,和/或响应于事件(例如,退出视频游戏)而被上载。

图1示出了计算系统106可以将其从客户端机器104收集的数据114存储在数据存储设备116中,该数据存储设备可以表示由远程计算系统106维护并且可以被其访问的数据存储库。可以以任何合适的方式在数据存储设备116内组织数据114,以将用户帐户与数据114的与那些用户帐户有关的相关部分相关联。随着时间的流逝,如果给定一个经常与视频游戏平台进行交互的庞大的用户社区102,有时在给定会话期间会持续很长时间,则可以在数据存储设备116中收集并维护大量数据114。

在图1的步骤1中,计算系统106可以使用从数据存储设备116采样的历史数据114来训练机器学习模型。例如,计算系统106可以访问与在视频游戏服务中注册的采样的用户账户集相关联的历史数据114的一部分,并使用采样的数据114来训练机器学习模型。在一些实施例中,数据114的用作训练数据的部分由一组特征表示,并且该采样集的每个用户账户都用标签标记,该标签指示该用户账户是否与过去玩至少一个视频游戏时根据特定行为特定行为表现过的玩家相关联。例如,如果过去视频游戏服务已经禁令过具有特定用户帐户的玩家作弊,则该“禁令”可用作该特定用户帐户的多个类别标签之一。以这种方式,可以采用监督式学习方法来训练机器学习模型,以预测将来可能作弊的玩家。

在步骤2,计算系统106可以使用受训练的机器学习模型对多个注册的用户帐户评分。例如,计算系统106可以从数据存储设备116访问与多个注册的用户账户相关联的数据114,将数据114作为输入提供给受训练的机器学习模型,并且作为受训练的机器学习模型的输出,生成与多个用户帐户相关联的得分。这些得分(有时在本文中称为“信任度得分”或“信任因子”)与在多玩家模式下玩一个或多个视频游戏时与多个用户账户相关联的玩家根据特定行为表现或不根据特定行为表现的概率有关。在诸如作弊之类的“不良”行为的情况下,信任度得分可以与玩家不作弊的概率有关。在这种情况下,高信任度得分表示受信任的用户帐户,而低信任度得分表示不受信任的用户帐户,其可用作可能表现出不良行为(例如作弊)的玩家的指示。在一些实施例中,得分是在[0,1]范围内归一化的变量。该信任度得分可以具有与在玩视频游戏110时玩家根据特定行为表现(或视情况而不根据特定行为表现)的概率的单调关系。得分与和特定行为相关联的实际概率之间的关系虽然是单调的,但可以是或可以不是线性关系。当然,可以以任何合适的方式来实现评分,以预测与用户账户绑定的玩家是否将以特定方式表现或不表现。图1示出了已经根据本文描述的技术评分的多个用户账户120。例如,对于任意合适数量的注册用户帐户120,第一得分118(1)(得分=X)归属于第一用户帐户120(1),第二得分118(2)(得分=Y)归属于第二用户帐户120(2)等等,依此类推。

在针对多个注册用户帐户120确定机器学习得分118的情况下,计算系统106可以被配置为至少部分地基于机器学习得分118在多玩家视频游戏设置中将玩家匹配在一起。例如,图1示出了计算系统106可以从已经开始执行视频游戏110的多个客户端机器104接收信息122。该信息122可以向计算系统106指示一组已登录的用户帐户120当前正在经由已安装的客户端应用程序在每个客户端机器104上执行视频游戏110。换句话说,当玩家102使用他们的用户帐户120登录并开始执行特定的视频游戏110,从而请求以多玩家模式玩时,他们各自的客户端机器104可以向计算系统106提供指示尽可能多的信息122。

在步骤3,响应于从客户端机器104接收到该信息122,计算设备106可以通过定义将玩家102分组到其中以在多玩家模式下玩视频游戏110的多个比赛,并且通过向客户端机器104提供比赛分配124,以便至少部分地基于针对已登录的用户帐户120确定的机器学习得分118将已登录用户帐户120的子集分配到多个比赛中的不同比赛,将玩家102匹配在一起。以这种方式,如果受训练的机器学习模型将低(例如,低于阈值)得分118分配给已登录用户帐户120的第一子集,而将高(例如,高于阈值)得分118分配给已登录用户帐户120的第二子集,则可将已登录用户帐户120的第一子集分配给多个比赛中的第一比赛,并将已登录用户帐户120的第二子集分配给多个比赛中的第二不同的比赛。以这种方式,具有相似得分118的玩家102的子集可以被分组在一起,并且可以与具有与玩家102得分118的子集不同的得分118的其他玩家保持隔离。

在步骤4,在执行视频游戏110的每台机器104上的客户端应用程序可以在所讨论的登录用户帐户120的已分配比赛中执行视频游戏110。例如,客户端机器104的第一子集可以与分配给第一比赛的已登录用户帐户120的第一子集相关联,并且客户端机器104的该第一子集可以在第一比赛中执行视频游戏110,而客户端机器104的第二子集(与分配给第二比赛的已登录用户帐户120的第二子集相关联)可以在第二比赛中执行视频游戏110。在至少部分基于机器学习得分118将玩家分组比赛的情况下,由于系统可以将被预测为表现不良(例如作弊)的玩家一起分组在同一比赛中,并且这样做可以使行为不良的玩家与希望合法玩视频游戏110的其他玩家保持隔离,因此玩家102的至少一些组的游戏体验可以被改善。

图2示出了图解图1的远程计算系统106的示例组件的框图,以及图解如何将机器学习的信任度评分用于玩家安排比赛的图。在所示的实施方式中,计算系统106包括一个或多个处理器202(例如,中央处理单元(CPU))、存储器204(或非暂时性计算机可读介质204)以及通信接口206等组件。存储器204(或非暂时性计算机可读介质204)可以包含用任何方法或技术实施的用于存储如计算机可读指令、数据结构、程序模块或其它数据等信息的易失性和非易失性存储器、可移除和不可移除介质。此类存储器包含但不限于RAM、ROM、EEPROM、闪速存储器或其它存储技术、CD-ROM、数字通用盘(DVD)或其它光盘存储、磁盒、磁带、磁盘存储或其它磁存储装置、RAID存储系统或者可以用于存储期望信息并且可以由计算装置访问的任何其它介质。计算机可读介质204可以被实施为计算机可读存储介质(“CRSM”),其可以是可由处理器202访问以执行存储在存储器204上的指令的任何可用物理介质。在一个基本实施方案中,CRSM可以包含随机存取存储器(“RAM”)和闪存。在其它实施方案中,CRSM可以包含但不限于只读存储器(“ROM”)、电可擦可编程只读存储器(“EEPROM”)或可以用于存储期望信息并且可以由一个或多个处理器202访问的任何其它有形介质。视频游戏服务208可以表示存储在存储器204中的指令,该指令在由处理器202执行时使计算系统106执行本文所述的技术和操作。

例如,视频游戏服务208可以包括训练组件210、评分组件212和比赛安排组件214,以及其他可能的组件。训练组件210可以被配置为使用数据存储设备116中与采样的用户账户120集相关联的数据114的一部分作为训练数据来训练机器学习模型,以获得受训练的机器学习模型216。评分组件212可使用受训练的机器学习模型216来确定多个注册用户账户120的得分118(例如,信任度得分118)。比赛安排组件214至少部分地基于机器学习的得分118来提供比赛分配124,使得玩家被分组到多个比赛218中的不同比赛中(例如,第一比赛218(1)、第二比赛218(2)等),以在多玩家游戏模式下玩视频游戏110。图2示出了可以如何将与已登录用户帐户120的第一子集相关联的第一组玩家102(例如,十个玩家102)分配给第一比赛218(1)和将与已登录用户帐户120的第二子集相关联的第二组玩家102(例如,另外十个玩家102)分配给第二比赛218(2)。当然,可以定义任意数量的比赛218,这可以取决于请求以多玩家模式执行视频游戏110的已登录用户帐户120的数量、计算系统106可以处理的网络流量的容量限制和/或其他因素。在一些实施例中,在比赛安排过程中考虑其他因素(例如技能水平、地理区域等),这可能导致玩家进一步分化和/或细分到更少或更多数量的比赛218中。

如提及的,由评分组件212确定的得分118(例如受训练的机器学习模型216的输出)是机器学习的得分118。机器学习通常涉及处理一组实例(称为“训练数据”),以便训练机器学习模型。一旦被训练,机器学习模型216是可接收新数据作为输入并估计或预测结果作为输出的已学习机制。例如,受训练的机器学习模型216可以包括分类器,该分类器的任务是将未知输入(例如,未知图像)分类为多个类别标签之一(例如,将图像标记为猫或狗)。在某些情况下,受训练的机器学习模型216配置为实施多标签分类任务(例如,将图像标签为“猫”、“狗”、“鸭”、“企鹅”等)。另外地或可替代地,可以训练受训练的机器学习模型216以基于作为输入接收的未知数据来推断分类任务的概率或一组概率。在本公开的上下文中,未知输入可以是与在视频游戏服务中注册的个人用户账户120相关联的数据114,并且受训练的机器学习模型216可以被分配输出得分118(例如,信任度得分118)的任务,其指示或以其他方式与个人用户帐户120处于多个类别之一中的概率有关。例如,得分118可以和与个人用户账户120相关联的玩家102在多玩家模式下玩视频游戏110时根据特定行为表现(或视情况而定,不根据特定行为表现)的概率相关。在一些实施例中,得分118是在[0,1]范围内归一化的变量。该信任度得分118可以与玩家102在玩视频游戏110时根据特定行为表现(或视情况而定不根据特定行为表现)的概率具有单调关系。得分118与和特定行为相关联的实际概率之间的关系虽然是单调的,但可以是或可以不是线性关系。在一些实施例中,受训练的机器学习模型216可以输出一组概率(例如,两个概率)或与之相关的得分,其中一个概率(或得分)与玩家102根据特定行为表现的概率有关,另一个概率(或得分)与玩家102不根据特定行为表现的概率有关。由受训练的机器学习模型216输出的得分118可以与这些概率中的任一个有关,以便指导比赛安排过程。在说明性实例中,特定行为可以是作弊。在该实例中,由受训练的机器学习模型216输出的得分118与和个体用户账户120相关联的玩家102在多玩家模式下玩视频游戏110的过程中将要、或将不、继续作弊的可能性有关。因此,在一些实施例中,得分118可以指示与个体用户账户120相关联的玩家102的可信度水平,并且这就是为什么本文描述的得分118有时被称为“信任度得分”118的原因。

受训练的机器学习模型216可以表示单个模型或基础级机器学习模型的集合,并且可以被实现为任何类型的机器学习模型216。例如,与本文所述的技术和系统一起使用的合适的机器学习模型216包括但不限于神经网络、树型模型、支持向量机(SVM)、核方法、随机森林、样条曲线(例如,多元自适应回归样条曲线)、隐马尔可夫模型(HMM)、卡尔曼滤波器(或增强型卡尔曼滤波器)、贝叶斯网络(或贝叶斯信念网络)、期望最大化、遗传算法、线性回归算法、非线性回归算法、基于逻辑回归的分类模型,或其集成。“集成(ensemble)”可以包括机器学习模型216的集合,其输出(预测)被组合,例如通过使用加权平均或投票。集成的单个机器学习模型可以在其专业知识上有所不同,并且该集成可以作为单个机器学习模型的委员会来运行,该委员会总体上比该集成的任何单个机器学习模型“更智能”。

用于训练机器学习模型216的训练数据可以包括各种类型的数据114。通常,用于机器学习的训练数据可以包括两个组件:特征和标签。然而,在一些实施例中,用于训练机器学习模型216的训练数据可以是未标记的。因此,机器学习模型216可以使用任何适当的学习技术来训练,例如监督式学习、非监督式学习、半监督式学习、强化学习等等。训练数据中包括的特征可以由一组特征来表示,例如以关于训练数据的属性的可量化信息的n维特征向量的形式。以下是示例特征的列表,该示例特征可以包括在用于训练本文所述的机器学习模型216的训练数据中。然而,应理解,以下特征列表不是穷举性的,并且训练中使用的特征可包括本文未描述的额外特征,并且在某些情况下包括本文中列出的一些但不是全部特征。训练数据中包括的示例特征可以包括但不限于,玩家通常花费在玩视频游戏110上的时间量,玩家花费在玩特定视频游戏110上的时间量,玩家登录并且玩视频游戏110的一天中时间,玩家的比赛历史记录数据,例如总得分(按比赛、按回合等)、爆头率、击杀次数、死亡次数、助攻次数、玩家排名等,玩家作弊的报告次数和/或频率,玩家作弊无罪的次数和/或频率,玩家作弊定罪的次数和/或频率,机器学习模型输出的在视频游戏中检测到作弊玩家的置信度值(得分),与单个玩家相关联的用户帐户120数量(其可以从绑定到多个用户帐户120的通用地址、电话号码、支付工具等中推导出),用户帐户120在视频游戏服务中已注册多长时间,绑定到玩家的先前禁止的用户帐户120数量,玩家在视频游戏平台上进行的货币交易的数量和/或频率,每笔交易的金额,与玩家的用户帐户120相关联的具有货币价值的数字物件的数量,用户帐户120换手(例如,在不同所有者/玩家之间进行的转移)的次数,用户帐户120在玩家之间转移的频率,玩家登录视频游戏服务的地理位置,不同支付工具的数量,与用户帐户120相关联的电话号码、邮寄地址等和/或更改这些项目的频率,和/或在计算表示玩家参与特定行为的倾向的信任度得分118中可能相关的任何其他合适的特征。作为训练过程的一部分,训练组件210可以设置用于机器学习的权重。这些权重可以应用于从数据存储设备116中的历史数据114导出的训练数据中包含的一组特征。在一些实施例中,在训练过程中设置的权重可以应用于机器学习模型内部的参数(例如,神经网络的隐藏层中的神经元的权重)。机器学习模型的这些内部参数可能会或可能不会与一组特征的各个输入特征一一对应。权重可以指示任何给定的特征或参数对受训练的机器学习模型216输出的得分118的影响。

特别是关于作弊(这是可以用作匹配玩家的基础的行为类型的说明性实例),可能存在与计划在视频游戏110中作弊的玩家的用户帐户120相关联的行为不同于与非作弊者的用户帐户120相关联的行为。因此,机器学习模型216可以学习从训练数据中识别那些行为模式,从而可以以高置信度识别可能作弊的玩家并对其进行适当的评分。应当理解,生态系统中可能存在离群值,可以基于有关离群值的一些已知信息来配置系统以进行保护。例如,职业玩家可能表现出与普通玩家不同的行为,并且这些职业玩家可能有被评分不正确的风险。作为另一个实例,视频游戏服务的服务提供商的雇员可以出于调查目的或质量控制目的而使用用户帐户登录,并且可以以与普通玩家的行为不同的方式表现。这些类型的玩家/用户102可以被视为离群值,并在机器学习背景之外主动分配得分118,该得分将高信任度归属于那些玩家/用户102。以此方式,可以为知名的专业玩家、服务提供商的雇员等分配权威得分118,该得分不能由评分组件212修改,以避免使那些玩家/用户102与行为不良的玩家匹配。

训练数据也可以被标记为用于监督式学习方法。再次,使用作弊作为可用于将玩家匹配在一起的行为的示例类型,该实例中的标签可指示是否禁止用户帐户120经由视频游戏服务玩视频游戏110。数据存储设备116中的数据114可以包括与已经被禁止作弊的玩家相关联的一些数据114,以及与未被禁止作弊的玩家相关联的一些数据114。这种禁令的一个例子是华盛顿州Bellevue的Valve Corporation利用的Valve Anti-Cheat(VAC)禁令。例如,计算系统106和/或计算系统106的授权用户可能能够检测何时已使用未经授权的第三方软件作弊。在这些情况下,在经过严格的验证过程以确保确定是正确的之后,可以通过将作弊用户帐户120在数据存储设备116中标记为被禁止来禁止作弊用户帐户120。因此,就是否被禁止而言,用户帐户120的状态可以用作正面和负面的训练实例。

应当理解,可以以其他方式指示过去的玩家行为,例如过去的作弊行为。例如,可以为用户102或者甚至单独的机器学习模型提供一种机制,以检测并举报怀疑作弊的玩家。这些被举报的玩家可被置于其同行的陪审团面前,陪审团审查被举报的玩家的游戏回放并做出判决(例如,作弊或未作弊)。如果足够多的其他玩家决定被举报的玩家的行为构成作弊,则可以达到高置信度阈值,并且被举报的玩家被判作弊,并对其用户帐户120施加禁令。

图2示出了除了作弊之外的其他行为的实例,其可以用作玩家比赛安排的基础。例如,受训练的机器学习模型216可以配置为输出与玩家根据游戏放弃行为(例如,通过在比赛中间放弃(或退出)视频游戏)表现或未根据游戏放弃行为表现的概率相关的信任度得分118。放弃游戏是一种往往会破坏不放弃玩家的游戏体验的行为,就像作弊一样。作为另一个实例,受训练的机器学习模型216可以配置为输出与玩家根据滋事行为表现或不根据滋事行为表现的概率有关的信任度得分118。“滋事者”是在多玩家视频游戏中故意激怒并骚扰视频游戏110中的其他玩家的玩家,这可能会破坏不滋事玩家的游戏体验。作为另一个实例,受训练的机器学习模型216可以配置为输出与玩家根据粗俗语言行为表现或不根据粗俗语言行为表现的概率有关的信任度得分118。通常,多玩家视频游戏允许玩家参与视频游戏110中其他玩家可见的聊天会话或其他社交网络通信,并且当玩家使用粗俗语言(例如诅咒的话、冒犯性语言等)时,这可能破坏不使用粗俗语言的玩家的游戏体验。作为又一个实例,受训练的机器学习模型216可以配置为输出与玩家根据“高技能”行为表现或不根据“高技能”行为表现的概率有关的信任度得分118。以这种方式,评分可以用于从一组玩家中识别高技能的玩家或新手玩家。这对于防止有经验的游戏者创建新用户帐户而假装是新手技能水平的玩家以便他们可以与业余玩家一起玩的情况很有用。因此,在第一比赛218(1)中一起比赛的玩家可以是(根据机器学习得分118确定的)可能根据特定“不良”行为表现的那些玩家,而在其他比赛诸如第二比赛218(2)中一起比赛的玩家可以是不可能根据特定“不良”行为表现的那些玩家。

可能的情况是,多个玩家(用户账户120)输出的信任度得分118的分布在很大程度上是双峰的。例如,得分118的统计分布的一个峰值可以与可能根据特定不良行为表现的玩家相关联,而得分118的统计分布的另一峰值可以与不可能根据特定不良行为表现的玩家相关联。换句话说,不良行为和良好行为的玩家群体可以在统计分布中以明显的间隔分开。从这个意义上讲,如果向视频游戏服务注册了新用户帐户,并为其分配了介于统计分布中两个峰值之间的信任度得分,则随着玩家与视频游戏平台互动,该用户帐户将很快以一种或另一种方式被驱动。由于该趋势,可以对比赛安排组件214使用的比赛安排参数进行调整以类似地对待信任度得分118不在统计分布的最低峰值内的玩家,并且比赛安排组件214可以主要与分离/隔离信任度得分118在统计分布的最低峰内的不良行为玩家有关。尽管本文将阈值得分的使用描述为提供匹配分配的一种示例方式,但是可以想到其他技术,例如聚类算法或使用信任度得分来优先匹配具有“相似”信任度得分的用户帐户(玩家)在一起的其他统计方法(例如,基于相似性度量,例如距离度量、方差度量等)。

此外,比赛安排组件214可以不将玩家比赛安排用于最近已经向视频游戏服务注册的新用户帐户120。而是,可以实施以下规则:在视频游戏110的多玩家模式中,在评分和与其他玩家比赛之前,玩家要在个人游戏模式中积累一定水平的体验/表现。应当理解,对于不同的玩家而言,从首次启动视频游戏110的时间到能够进行玩家比赛安排的玩家的路径可能非常不同。有些玩家可能需要长时间才能通过比赛安排有资格进入多玩家模式,而其他用户则很快通过资格认证过程。有了此资格认证过程,为了比赛安排目的而要评分的用户帐户将已经玩过视频游戏,并提供足够的数据114以准确评分118用户帐户120。

再次,如上提及,尽管本文所述的许多实例将诸如作弊、放弃游戏、滋事、粗俗语言等的“不良”行为作为目标行为,为了比赛安排目的,可以依据这些行为对玩家进行评分和分组,但本文描述的技术和系统可以被配置为使用机器学习的计分方法来识别任何类型的行为,并且为了玩家比赛安排的目的而预测玩家参与该行为的可能性。

本文所述的过程被展示为逻辑流程图中的框的集合,其表示可以在硬件、软件或其组合中实施的操作的序列。在软件的上下文中,框表示计算机可执行指令,所述计算机可执行指令当由一个或多个处理器执行时执行所叙述的操作。通常,计算机可执行指令包含执行特定功能或实施特定抽象数据类型的例程、程序、对象、组件、数据结构等。所描述的操作顺序不旨在被解释为是限制性的,并且任何数量的所描述的框可以以任何顺序和/或并行组合以实施过程。

图3是用于训练机器学习模型以预测玩家根据特定行为表现或不根据特定行为表现的概率的示例过程300的流程图。为了讨论目的,参考前面的图描述了过程300。

在302处,计算系统106可以向用户102提供对视频游戏服务的访问。例如,计算系统106可以允许用户访问和浏览视频游戏110的目录,修改用户配置文件,进行交易,参与社交媒体活动以及其他类似动作。计算系统106可以将视频游戏110(及其内容)分发给客户端机器104,作为视频游戏服务的一部分。在说明性实例中,有权访问视频游戏服务的用户102可以通过客户端应用程序在其客户端机器104上加载已安装的客户端应用程序、使用注册的用户帐户登录、选择所需的视频游戏110并执行视频游戏110。

在304处,计算系统106可以收集和存储与向视频游戏服务注册的用户账户120相关联的数据114。每当用户102以其注册用户帐户120访问视频游戏服务并使用该视频游戏平台,例如在其上玩视频游戏110时,就可以在框304收集该数据114。随着时间的流逝,人们会意识到,与已注册用户帐户绑定的大量数据114可能对计算系统106可用。

在306处,计算系统106可以经由训练组件210访问与向视频游戏服务注册的采样的用户账户120集相关的(历史)数据114。由于玩家在由视频游戏服务提供的视频游戏平台上玩一个或多个视频游戏110,因此可能已经生成(历史)数据114中的至少一些。例如,在306访问的(历史)数据114可以代表玩过一个或多个视频游戏110(例如,在多玩家模式中通过参与比赛)的玩家的比赛历史数据。在一些实施例中,(历史)数据114可以指示采样的用户账户120集是否已经在玩家之间转移,或者相对于用户账户120而言是其他类型的用户活动。

在308处,计算系统106可以经由训练组件210用标签标记采样的用户帐户120集中的每个用户帐户120,该标签指示用户帐户是否与在过去玩至少一个视频游戏110时根据特定行为表现的玩家相关联。本文描述了标签的实例,例如,过去是否已经禁止用户帐户120作弊,这可以在对玩家作弊或未作弊(视情况而定)的倾向进行评分的情况下用作标签。但是,标签可以对应于其他类型的行为,例如指示用户帐户是否与过去放弃游戏、过去在游戏中滋事、过去在游戏中使用粗俗语言等的玩家相关联的标签。

在310处,计算系统106可以经由训练组件210使用(历史)数据114作为训练数据来训练机器学习模型,以获得受训练的机器学习模型216。如子框312所示,在框310处的机器学习模型的训练可以包括设置用于机器学习的权重。这些权重可以应用于从历史数据114导出的一组特征。本文描述了示例特征,例如以上参考图2描述的那些。在一些实施例中,在框312处设置的权重可以应用于机器学习模型内部的参数(例如,神经网络的隐藏层中的神经元的权重)。机器学习模型的这些内部参数可能会或可能不会与一组特征的各个输入特征一一对应。如从框310到框304的箭头所示,可以使用更新的(历史)数据114来训练机器学习模型216,以获得适合于最近玩家行为的新训练的机器学习模型216。这允许机器学习模型216随时间适应于改变的玩家行为。

图4是用于利用受训练的机器学习模型216来确定用户账户120的信任度得分118的示例过程400的流程图,该信任度得分118与玩家根据特定行为表现或不根据特定行为表现的概率有关(或是其指示)。为了讨论目的,参考前面的图描述了过程400。此外,如图3和4中的页面外标记“A”所示,过程400可以从过程300的框310继续。

在402处,计算系统106经由评分组件212可以访问与向视频游戏服务注册的多个用户账户120相关联的数据114。该数据114可以包括一组特征中的任何信息(例如,可量化信息),如本文所述,这些特征已经被用来训练机器学习模型216。该数据114构成要输入到受训练的机器学习模型216的未知输入。

在404处,计算系统106可以通过评分组件212将在框402处访问的数据114作为输入提供给受训练的机器学习模型216。

在406处,计算系统106可以经由评分组件212生成作为受训练的机器学习模型216的输出的与多个用户账户120相关联的信任度得分118。在个体的基础上,得分118与多个用户账户120中的个体用户账户120相关联,并且得分118与在多玩家模式下玩一个或多个视频游戏110时与各个用户账户120相关联的玩家102根据特定行为表现或不根据特定行为表现的概率有关。在这种情况下,特定行为可以是数据114中显示的任何合适的行为,从而可以训练机器学习模型以预测具有参与该行为的倾向的玩家。实例包括但不限于作弊行为、游戏放弃行为、滋事行为或粗俗语言行为。在一些实施例中,得分118是在[0,1]范围内归一化的变量。该信任度得分118可以具有单调关系,其具有玩家在玩视频游戏110时根据特定行为表现出(或视情况而不表现出)行为的概率。得分118与和特定行为相关联的实际概率之间的关系虽然是单调的,但可以是或可以不是线性关系。

因此,过程400表示机器学习的计分方法,其中为用户账户120确定得分118(例如,信任度得分118),所述得分指示玩家使用该用户账户120在将来参与特定行为的概率。与尝试预测玩家行为的现有方法相比,在该评分过程中使用机器学习模型可以识别玩家行为的复杂关系,从而更好地预测玩家行为。这将导致使用更自适应和更通用的系统更准确地预测玩家行为,该系统无需人工干预即可适应不断变化的玩家行为动态。

图5是用于基于与可能的玩家行为有关的机器学习的信任度得分118将用户账户120分配给多玩家视频游戏的不同比赛的示例过程500的流程图。为了讨论目的,参考前面的图描述了过程500。此外,如图4和5中的页面外标记“B”所示,过程500可以从过程400的框406继续。

在502,计算系统106可以从多个客户端机器104接收信息122,该信息122指示登录到在每个客户端机器104上执行视频游戏110的客户端应用程序中的登录用户账户120。例如,多个玩家102可能已经开始执行特定的视频游戏110(例如,第一人称射击游戏),想要在多玩家模式下玩视频游戏110。在框502处接收到122的信息112可以至少指示那些玩家的已登录用户帐户120。

在504处,计算系统106可以通过比赛安排组件214来定义要将玩家102分组到其中以在多玩家模式下玩视频游戏110的多个比赛。可以定义任意数量的比赛,这具体取决于各种因素,包括需求、容量和参与比赛安排过程的其他因素。在实例中,在框504处的多个定义的比赛可以至少包括第一比赛218(1)和第二比赛218(2)。

在506处,至少部分基于为登录用户帐户120确定的得分118,计算系统106可以通过比赛安排组件214将登录用户帐户120的第一子集分配给第一比赛218(1),并且将登录用户帐户120的第二子集分配给第二比赛218(2)。如上所述,可以定义任意数量的比赛,以便可以在框506将进一步细分的和附加的比赛分配给用户帐户。

如子框508所示,用户账户120至不同比赛的分配可以基于阈值得分。例如,比赛安排组件214可以确定与登录用户账户120的第一子集相关联的得分118小于阈值得分,并且基于那些得分小于阈值得分,可以将登录用户账户120的第一子集分配给第一比赛。类似地,比赛安排组件214可以确定与登录用户账户120的第二子集相关联的得分118等于或大于阈值得分,并且基于那些得分等于或大于阈值得分,可以将登录用户账户120的第二子集分配给的第二比赛。然而,这仅仅是提供比赛分配124的一种示例方式,并且可以想到其他技术。例如,除了阈值得分的使用之外,附加地,或者作为替代,可以使用聚类算法或其他统计方法。在一个实例中,信任度得分118可以用于优先地将具有“相似”信任度得分的用户账户(玩家)在一起比赛。给定信任度得分118的分布在多个用户账户120上的自然趋势是大双峰的,则基于相似性度量(例如,距离度量、方差度量等)将信任度得分118分组在一起可以提供与使用阈值得分的结果类似的结果。但是,在比赛安排池较小的情况下(例如,在小地理区域中的玩家想要玩不太流行的游戏模式),使用相似性度量将用户帐户分组匹配以进行比赛安排可能是有用的,因为它提供了一种更细粒度的方法,该方法允许逐步调整信任度得分与其他比赛安排因素(例如技能水平)相比的相对重要性。在一些实施例中,可以使用多个阈值将用户账户120“桶分化(bucketize)”到多个不同的比赛中。

如子框510所示,在框506处的比赛安排分配中可以除了信任度得分118以外还考虑其他因素。例如,在框506处确定的比赛安排分配124可以进一步基于与登录用户帐户相关联的玩家的技能水平、登录用户帐户已经等待放置到多个比赛之一中的时间量、与登录用户帐户关联的地理区域和/或其他因素。

在512处,计算系统106可以使(例如,通过提供控制指令)在发送信息122的每个客户端机器104上执行视频游戏110的客户端应用程序至少部分基于与客户端机器104关联的已登录用户帐户120发起定义的比赛之一(例如,第一比赛218(1)或第二比赛218(2)之一)。例如,在定义了第一比赛218(1)和第二比赛218(2)的情况下,计算系统106可以使与已登录用户账户120的第一子集相关联的多个客户端机器104的第一子集在第一比赛218(1)中执行视频游戏110,并且可以使与已登录用户账户120的第二子集相关联的多个客户端机器104的第二子集在第二比赛218(2)中执行视频游戏110。

因为机器学习的信任度得分118被用作比赛安排过程中的一个因素,所以可以向希望以原本应该玩的方式在多玩家模式下玩视频游戏的用户提供改善的游戏体验。这是因为本文所述的技术和系统可用于将可能表现不良(例如,作弊)的玩家匹配在一起,并将那些玩家与其他可能合法玩视频游戏的受信任玩家隔离开。

尽管以特定于结构特征的语言描述了主题,但应理解的是所附权利要求中限定的主题不必限于所描述的具体特征。相反,具体特征被公开为实施权利要求的说明性形式。

相关技术
  • 用于玩家安排比赛的机器学习的信任度评分
  • 用于数字完整载片的自动化评分的基于组织对象的机器学习系统
技术分类

06120112753603