掌桥专利:专业的专利平台
掌桥专利
首页

一种掼蛋游戏的牌型数据获取方法及相关装置

文献发布时间:2023-06-19 12:18:04


一种掼蛋游戏的牌型数据获取方法及相关装置

技术领域

本申请涉及数据处理技术领域,特别涉及一种掼蛋游戏的牌型数据获取方法、牌型数据获取装置、服务器以及计算机可读存储介质。

背景技术

随着信息技术不断,在游戏技术领域中,由于存在参与游戏人员不足的问题,需要通过对游戏中的数据进行自动化处理,以便实现虚拟游戏过程,提高实际游戏参与人员的参与感,减少实际参与人员由于缺少游戏人员的游戏时间。

相关技术中,为了提高掼蛋游戏的实际游戏人员参与感,一般采用基于专家规则的逻辑系统。该逻辑系统可以计算出适合己方的牌型组合和牌面值。但是,对于对手牌面值大小,队友牌面值大小,什么情况过牌,该挣头游,该帮助队友挣头游等等组合问题无法做出决策。从而影响掼蛋数据中出牌动作数据的合理性和拟人化程度,降低对掼蛋数据的处理效果。

因此,如何提高掼蛋数据的处理效果是本领域技术人员关注的重点问题。

发明内容

本申请的目的是提供一种掼蛋游戏的牌型数据获取方法、牌型数据获取装置、服务器以及计算机可读存储介质,解决目前掼蛋数据的自动处理的拟真度较低和处理效果较低的问题。

为解决上述技术问题,本申请提供一种掼蛋游戏的牌型数据获取方法,包括:

根据获取到的文本日志和游戏状态字典进行整合处理,得到训练数据;其中,所述游戏状态字典为掼蛋游戏初始化时获取到的字典数据;

根据所述训练数据对一维卷积残差神经网络进行训练,得到决策模型;其中,所述一维卷积残差神经网络,包括:一维卷积网络层、数据融合模块、批量归一化层、激活函数层;

采用所述决策模型对接收到的状态信息进行处理,得到牌型数据;

发送所述牌型数据。

可选的,采用所述决策模型对接收到的状态信息进行处理,得到牌型数据,包括:

从掼蛋游戏服务器获取所述状态信息;

采用所述决策模型对所述状态信息进行处理,得到初始牌型数据;

判断所述初始牌型数据是否包含同花顺组合的牌型;其中,所述同花顺组合为对所述游戏状态字典进行组合排列得到的同花顺组合;

若是,则根据所述初始牌型数据从所述同花顺组合的牌型之外的牌型进行牌型组合,得到所述牌型数据;

若否,则将所述初始牌型数据作为所述牌型数据。

可选的,根据获取到的文本日志和游戏状态字典进行整合处理,得到训练数据;

从掼蛋游戏服务器获取所述文本日志;

根据掼蛋游戏规则模型将所述文本日志数据转换为游戏状态;

将所述游戏状态和所述游戏状态字典以CSV文件格式进行保存合并,得到所述训练数据。

可选的,采用所述决策模型对接收到的状态信息进行处理,得到牌型数据,包括:

采用所述决策模型对接收到的状态信息进行处理,得到每个初始牌型数据的获胜概率;

将所述获胜概率最大的初始牌型数据作为所述牌型数据。

可选的,发送所述牌型数据,包括:

通过http接口发送所述牌型数据。

可选的,根据所述训练数据对一维卷积残差神经网络进行训练,得到决策模型,包括:

采用Adam优化器和所述训练数据对所述一维卷积残差神经网络进行训练,得到所述决策模型。

本申请还提供一种掼蛋游戏的牌型数据获取装置,包括:

训练数据获取模块,用于根据获取到的文本日志和游戏状态字典进行整合处理,得到训练数据;其中,所述游戏状态字典为掼蛋游戏初始化时获取到的字典数据;

模型训练模块,用于根据所述训练数据对一维卷积残差神经网络进行训练,得到决策模型;其中,所述一维卷积残差神经网络,包括:一维卷积网络层、数据融合模块、批量归一化层、激活函数层;

决策模型使用模块,用于采用所述决策模型对接收到的状态信息进行处理,得到牌型数据;

牌型数据发送模块,用于发送所述牌型数据。

可选的,所述训练数据获取模块,包括:

文本日志获取单元,用于从掼蛋游戏服务器获取所述文本日志;

游戏状态获取单元,用于根据掼蛋游戏规则模型将所述文本日志数据转换为游戏状态;

合并单元,用于将所述游戏状态和所述游戏状态字典以CSV文件格式进行保存合并,得到所述训练数据。

本申请还提供一种服务器,包括:

存储器,用于存储计算机程序;

处理器,用于执行所述计算机程序时实现如以上实施例所述的掼蛋游戏的牌型数据获取方法的步骤。

本申请还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如以上实施例所述的掼蛋游戏的牌型数据获取方法的步骤。

本申请所提供的一种掼蛋游戏的牌型数据获取方法,包括:根据获取到的文本日志和游戏状态字典进行整合处理,得到训练数据;其中,所述游戏状态字典为掼蛋游戏初始化时获取到的字典数据;根据所述训练数据对一维卷积残差神经网络进行训练,得到决策模型;其中,所述一维卷积残差神经网络,包括:一维卷积网络层、数据融合模块、批量归一化层、激活函数层;采用所述决策模型对接收到的状态信息进行处理,得到牌型数据;发送所述牌型数据。

通过从文本日志和游戏状态字典中提取得到的训练数据,进行神经网络训练后得到的决策模型,最后再根据该决策模型和接收到的状态信息进行出牌决策,得到牌型数据,而不是以规则模型进行自动出牌,以便在掼蛋游戏服务器中实现更加拟人化的机器人下棋操作,提高游戏数据处理的效果。

本申请还提供一种掼蛋游戏的牌型数据获取装置、服务器以及计算机可读存储介质,具有以上有益效果,在此不做赘述。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。

图1为本申请实施例所提供的一种掼蛋游戏的牌型数据获取方法的流程图;

图2为本申请实施例所提供的一种掼蛋游戏的牌型数据获取装置的结构示意图。

具体实施方式

本申请的核心是提供一种掼蛋游戏的牌型数据获取方法、牌型数据获取装置、服务器以及计算机可读存储介质,解决目前掼蛋数据的自动处理的拟真度较低和处理效果较低的问题。

为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。

相关技术中,为了提高掼蛋游戏的实际游戏人员参与感,一般采用基于专家规则的逻辑系统。该逻辑系统可以计算出适合己方的牌型组合和牌面值。但是,对于对手牌面值大小,队友牌面值大小,什么情况过牌,该挣头游,该帮助队友挣头游等等组合问题无法做出决策。从而影响掼蛋数据中出牌动作数据的合理性和拟人化程度,降低对掼蛋数据的处理效果。

因此,本申请提供一种掼蛋游戏的牌型数据获取方法,通过从文本日志和游戏状态字典中提取得到的训练数据,进行神经网络训练后得到的决策模型,最后再根据该决策模型和接收到的状态信息进行出牌决策,得到牌型数据,而不是以规则模型进行自动出牌,以便在掼蛋游戏服务器中实现更加拟人化的机器人下棋操作,提高游戏数据处理的效果。

以下通过一个实施例,对本申请提供的一种掼蛋游戏的牌型·数据获取方法进行说明。

请参考图1,图1为本申请实施例所提供的一种掼蛋游戏的牌型数据获取方法的流程图。

本实施例中,该方法可以包括:

S101,根据获取到的文本日志和游戏状态字典进行整合处理,得到训练数据;其中,游戏状态字典为掼蛋游戏初始化时获取到的字典数据;

可见,本步骤旨在根据获取到的文本日志和游戏状态字典进行整合处理,得到训练数据。并且,其中的游戏状态字典为掼蛋游戏初始化时获取到的字典数据。

其中,文本日志是指在游戏过程中掼蛋游戏服务器不断记录的游戏的文本日志。一般来说,该文本日志主要是用于游戏参与者或旁观者进行阅读,以便了解当前游戏局面状态的日志数据。本实施例中,直接采用该文本日志以便分析出当前的游戏状态,而不用掼蛋游戏服务器再发送用于数据处理的专用数据。降低了掼蛋游戏服务器的负载,并且,本实施例可以适配各种不同的掼蛋游戏服务器,而不用该服务器对本实施例中的过程输出特别的数据,只需要正常处理游戏过程即可。降低了使用门槛,提高了使用效率。

进一步的,本步骤可以包括:

步骤1,从掼蛋游戏服务器获取文本日志;

步骤2,根据掼蛋游戏规则模型将文本日志数据转换为游戏状态;

步骤3,将游戏状态和游戏状态字典以CSV文件格式进行保存合并,得到训练数据。

可见,本可选方案中主要是对如何获取到训练数据进行说明。本实施例中,该可选方案可以包括从掼蛋游戏服务器获取文本日志;然后,根据掼蛋游戏规则模型将文本日志数据转换为游戏状态;最后,将游戏状态和游戏状态字典以CSV文件格式进行保存合并,得到训练数据。其中,CSV(Comma-Separated Values,逗号分隔值)文件格式的文件以纯文本形式存储表格数据(数字和文本)。纯文本意味着该文件是一个字符序列,不含必须像二进制数字那样被解读的数据。CSV文件由任意数目的记录组成,记录间以某种换行符分隔;每条记录由字段组成,字段间的分隔符是其它字符或字符串,最常见的是逗号或制表符。

S102,根据训练数据对一维卷积残差神经网络进行训练,得到决策模型;其中,一维卷积残差神经网络,包括:一维卷积网络层、数据融合模块、批量归一化层、激活函数层;

在S101的基础上,本步骤旨在根据训练数据对一维卷积残差神经网络进行训练,得到决策模型;其中,一维卷积残差神经网络,包括:一维卷积网络层、数据融合模块、批量归一化层、激活函数层。也就是,采用训练数据进行相应的网络训练,以便确定进行决策的模型,即决策模型。

进一步的,本步骤可以包括:

采用Adam优化器和训练数据对一维卷积残差神经网络进行训练,得到决策模型。

可见,本可选方案中主要是对如何进行决策模型的训练进行说明。本可选方案中主要是采用Adam优化器和训练数据对一维卷积残差神经网络进行训练,得到决策模型。其中,Adam优化器(自适应矩估计优化器)是计算每个参数的自适应学习率的一种方法。

S103,采用决策模型对接收到的状态信息进行处理,得到牌型数据;

在S102的基础上,本步骤旨在采用决策模型对接收到的状态信息进行处理,得到牌型数据。也就是,采用上一步骤训练的决策模型进行应用,以便进行当前牌局的决策,得到牌型数据。其中,应用的方式可以采用现有技术提供的任意一种应用方式,在此不做赘述。

其中,获取牌型数据的过程,可以是对每一个可能的初始牌型数据进行获胜概率计算。然后可以是选择获胜概率最大的初始牌型数据作为该牌型数据,也可以是选择获胜概率中等的初始牌型数据作为该牌型数据,还可以是选择获胜概率最小的初始牌型数据作为该牌型数据。

进一步的,本步骤可以包括:

步骤1,从掼蛋游戏服务器获取状态信息;

步骤2,采用决策模型对状态信息进行处理,得到初始牌型数据;

步骤3,判断初始牌型数据是否包含同花顺组合的牌型;其中,同花顺组合为对游戏状态字典进行组合排列得到的同花顺组合;

步骤4,若是,则根据初始牌型数据从同花顺组合的牌型之外的牌型进行牌型组合,得到牌型数据;

步骤5,若否,则将初始牌型数据作为牌型数据。

可见,本可选方案中主要是对如何获取到牌型数据进行说明。本可选方案中从掼蛋游戏服务器获取状态信息。其中,状态信息就是掼蛋服务器发送的文本日志。然后,采用决策模型对状态信息进行处理,得到初始牌型数据;最后,判断初始牌型数据是否包含同花顺组合的牌型;其中,同花顺组合为对游戏状态字典进行组合排列得到的同花顺组合;若是,则根据初始牌型数据从同花顺组合的牌型之外的牌型进行牌型组合,得到牌型数据;若否,则将初始牌型数据作为牌型数据。可见,通过本可选方案中的判断过程,可以避免在出牌过程中打出同花顺相关的牌型,提高赢牌概率。

进一步的,本步骤可以包括:

采用决策模型对接收到的状态信息进行处理,得到每个初始牌型数据的获胜概率;

将获胜概率最大的初始牌型数据作为牌型数据。

可见,本可选方案主要是对如何获取到的牌型数据进行说明。本可选方案中,采用决策模型对接收到的状态信息进行处理,得到每个初始牌型数据的获胜概率;将获胜概率最大的初始牌型数据作为牌型数据。也就是,通过决策模型计算出每一种可能的初始牌型数据的获胜概率,然后将概率最大的牌型数据作为该牌型数据。

S104,发送牌型数据。

在S103的基础上,本步骤旨在发送该牌型数据,以便根据该牌型数据执行相应的出牌操作。

进一步的,本步骤可以包括:

通过http接口发送牌型数据。

综上,本实施例通过从文本日志和游戏状态字典中提取得到的训练数据,进行神经网络训练后得到的决策模型,最后再根据该决策模型和接收到的状态信息进行出牌决策,得到牌型数据,而不是以规则模型进行自动出牌,以便在掼蛋游戏服务器中实现更加拟人化的机器人下棋操作,提高游戏数据处理的效果。

以下通过一个具体的实施例,对本申请提供的一种掼蛋游戏的牌型数据获取方法做进一步说明。

本实施例的流程可以包括:数据处理、深度学习模型搭建、模型训练和模型应用。

其中,数据处理主要是从文本游戏日志数据到可以用于模型训练的数值矩阵的转换;深度学习模型搭建主要是深度学习模型框架结构的搭建;模型训练主要是深度学习模型的训练和验证测试;模型应用主要是将深度学习模型包装到http服务接口中,对外提供智能出牌功能。

数据处理的过程,服务器搭建一套游戏环境,在游戏过程中不断将文本日志转换为当前游戏状态,并将当前的游戏状态数据矩阵保存为CSV文件。在游戏初始阶段会为每一个玩家初始化一个游戏状态字典(包括:用户历史出牌记录,用户当前手牌、所有玩家手牌数量,其他玩家出牌矩阵、其他玩家合计剩余牌);在游戏过程中,当轮到当前玩家出牌时,将状态字典内的游戏状态合并为状态矩阵,同时提取玩家的出牌动作类型,保存到CSV文件,作为一条训练数据。同时更新游戏状态字典中当前玩家相关的字段,以及其他玩家游戏字典中当前玩家相关的字段;在游戏过程中,会逐条循环处理玩家的出牌行为日志,直到游戏结束。

深度学习模型搭建主要是搭建出用于训练出牌的模型框架。在掼蛋游戏过程中人类玩家通常将扑克牌按照牌面大小排成一行,按照一维数组来组织深度学习的输入特征,并且搭建基于一维卷积的深度学习模型框架与掼蛋游戏天然玩法特点一致。本实施例基于掼蛋游戏的特点搭建了一维卷积残差神经网络架构的深度学习模型。本实施例的残差网络中残差块的结构包括:Conv1D、3Conv1D、5Conv1D、7Conv1D分别是卷积核为1、3、5、7的一维卷积网络层;Concatenate是沿通道方向的数据融合模块。本实施例在每个残差块中,用到4种不同尺度的卷积核,提取了不同尺度的数据特征,然后将不同尺度特征融合,更好的提取了数据特征。其中,深度学习模型的架构包括:Input是输入层、Resnet Block是残差块、Flatten是特征展开层、Dense是全连接神经网络层、softmax是归一化层。

模型训练采用Adam的优化器,优化的迭代次数为30次。学习步长初始值为0.001,在第15次迭代时学习步长调整为0.0001,在第23次迭代时学习步长调整为0.00001。

模型应用搭建起http(HyperText Transfer Protocol,超文本传输协议)服务接口,服务接口负责从游戏服务器接收游戏的各种状态信息(玩家初始牌,玩家所出牌,出局玩家,游戏结束),将游戏的状态信息转换为数值特征矩阵,深度学习模型读入游戏的数值特征矩阵输出当前玩家当前轮应该打出的牌型,然后从当前玩家的手牌中组合出可以组合成的同花顺牌型和对应扑克牌的字典,如果模型推荐的牌型是同花顺则直接从字典中拿出对应的扑克牌,如果模型推荐的牌型是非同花顺牌型,则从剩余牌中组合出要出的牌型,如果剩余牌不足以组成对应牌型,则从同花顺中拿对应的牌。最后,http接口向游戏服务器返回要出的牌型和对应的牌。

可见,本实施例通过从文本日志和游戏状态字典中提取得到的训练数据,进行神经网络训练后得到的决策模型,最后再根据该决策模型和接收到的状态信息进行出牌决策,得到牌型数据,而不是以规则模型进行自动出牌,以便在掼蛋游戏服务器中实现更加拟人化的机器人下棋操作,提高游戏数据处理的效果。

下面对本申请实施例提供的牌型数据获取装置进行介绍,下文描述的牌型数据获取装置与上文描述的牌型数据获取方法可相互对应参照。

请参考图2,图2为本申请实施例所提供的一种掼蛋游戏的牌型数据获取装置的结构示意图。

本实施例中,该装置可以包括:

训练数据获取模块100,用于根据获取到的文本日志和游戏状态字典进行整合处理,得到训练数据;其中,游戏状态字典为掼蛋游戏初始化时获取到的字典数据;

模型训练模块200,用于根据训练数据对一维卷积残差神经网络进行训练,得到决策模型;其中,一维卷积残差神经网络,包括:一维卷积网络层、数据融合模块、批量归一化层、激活函数层;

决策模型使用模块300,用于采用决策模型对接收到的状态信息进行处理,得到牌型数据;

牌型数据发送模块400,用于发送牌型数据。

可选的,该训练数据获取模块100,可以包括:

文本日志获取单元,用于从掼蛋游戏服务器获取文本日志;

游戏状态获取单元,用于根据掼蛋游戏规则模型将文本日志数据转换为游戏状态;

合并单元,用于将游戏状态和游戏状态字典以CSV文件格式进行保存合并,得到训练数据。

本申请实施例还提供一种服务器,包括:

存储器,用于存储计算机程序;

处理器,用于执行所述计算机程序时实现如以上实施例所述的掼蛋游戏的牌型数据获取方法的步骤。

本申请实施例还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如以上实施例所述的掼蛋游戏的牌型数据获取方法的步骤。

说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。

专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。

结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。

以上对本申请所提供的一种掼蛋游戏的牌型数据获取方法、牌型数据获取装置、服务器以及计算机可读存储介质进行了详细介绍。本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想。应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以对本申请进行若干改进和修饰,这些改进和修饰也落入本申请权利要求的保护范围内。

相关技术
  • 一种掼蛋游戏的牌型数据获取方法及相关装置
  • 一种掼蛋游戏的牌型数据处理方法及相关装置
技术分类

06120113248543