掌桥专利:专业的专利平台
掌桥专利
首页

一种游戏数据的监控系统以及游戏数据的监控方法

文献发布时间:2023-06-19 12:25:57


一种游戏数据的监控系统以及游戏数据的监控方法

技术领域

本申请涉及计算机技术领域,尤其是涉及到一种游戏数据的监控系统以 及游戏数据的监控方法。

背景技术

随着互联网的发展、移动终端的普及,网络聊天方式已经是生活中普遍、 客观存在的一部分,在各大游戏、购物以及交友软件中均会设置聊天模块, 用户可通过聊天模块实现信息的在线交互。然而网上聊天方式的弊端在于, 无法对聊天信息进行有效审核,进而导致存在通过网上聊天传播色情、低俗 以及违禁信息的不法行为,这对青少年乃至成年都造成了不良影响。为营造 良好的网络聊天环境,对聊天信息的合法性审核显得尤为重要。

现有技术中,对聊天信息的违禁性审核方式通常采用人工审核的方式, 然而这种方式会导致审核效率低、准确性差,不能实现对聊天信息的智能化 识别,进而无法为用户营造良好的网络聊天环境。

发明内容

有鉴于此,本申请提供了一种游戏数据的监控系统以及游戏数据的监控 方法,可实现对游戏内多维度数据的违禁审核,全面净化游戏环境,并通过 分时、分布式设计保证数据处理效率,可支持千万级在线用户的游戏数据监 控,有助于提高游戏数据监控效率。

根据本申请的一个方面,提供了一种游戏数据的监控系统,所述系统采 用分时、分布式设计,所述系统包括:

数据获取模块,通过客户端接口与游戏客户端连接,用于从所述游戏客 户端获取待监控的游戏数据,其中,所述数据获取模块具体包括私密聊天监 控入口、组队聊天监控入口、世界聊天监控入口以及可展示信息监控入口;

数据审核模块,与所述游戏数据获取模块连接,用于识别所述游戏数据 是否存在违禁用语;

违禁惩罚模块,与所述游戏数据审核模块连接,以及通过客户端接口与 所述游戏客户端连接,用于在所述游戏数据包含违禁用语时向所述游戏客户 端发送惩罚信息。

可选地,所述系统还包括:

违禁用语配置模块,所述违禁用语配置模块与所述数据审核模块连接, 用于存储预设违禁字符;

所述数据审核模块具体用于调用所述违禁用语配置模块中的所述预设违 禁字符,依据所述预设违禁字符识别所述游戏数据是否存在违禁用语。

可选地,所述系统还包括:

音频识别模块,与所述数据获取模块以及所述数据审核模块连接,用于 在所述游戏数据为音频形式时,对所述游戏数据进行音频识别,将所述游戏 数据从音频形式转换为文本形式。

可选地,所述系统还包括:

数据预处理模块,与所述数据获取模块以及所述音频识别模块连接,用 于对文本形式的游戏数据进行标准化处理,其中,所述标准化处理包括文本 分词、过滤预设字符、繁体转换简体,所述预设字符至少包括特殊字符和/或 HTML。

可选地,所述数据审核模块,包括:

违禁用语识别子模块,与所述数据预处理模块连接,用于按照预设单次 字符识别数量,对标准化处理后的游戏数据进行分段,以及分别对每一段游 戏数据包含的字符进行全排列得到待监控字符组合,并按预设识别规则对所 述待监控字符组合进行违禁用语识别。

可选地,所述数据审核模块,还包括:

字符匹配子模块,与所述违禁用语识别子模块连接,用于在所述违禁用 语识别子模块未识别出违禁用语时,对所述游戏数据中包含的任一字符进行 字符匹配确定所述任一字符对应的匹配字符;

所述违禁用语识别子模块,还用于按照预设单次字符识别数量选择所述 匹配字符并进行全排列,并按预设识别规则对全排列的匹配字符进行违禁用 语识别。

可选地,所述字符匹配子模块,具体用于在所述违禁用语识别子模块未 识别出违禁用语时,计算所述游戏数据中任一字符与预设违禁字符的音码相 似度和形码相似度,并按对应的权重对所述音码相似度和所述形码相似度加 权求和,依据加权求和结果确定所述任一字符对应的匹配字符。

可选地,所述系统还包括:

识别规则训练模块,用于通过有效性分析对违禁用语样本进行筛选,并 基于筛选后的违禁用语样本训练违禁用语识别模型;

所述违禁用语识别子模块通过调用所述识别规则训练模块训练好的所述 违禁用语识别模型进行违禁用语识别。

可选地,所述系统还包括:

惩罚规则配置模块,用于配置在不同游戏数据类型中各违禁用语对应的 违禁评分规则、违禁评分对应的违禁等级、违禁等级的惩罚规则以及违禁用 语对应的替代字符,其中,游戏数据类型包括私密聊天、组队聊天、世界聊 天以及可展示信息;

所述违禁惩罚模块与所述惩罚规则配置模块连接,所述违禁惩罚模块还 用于在所述游戏数据包含违禁用语时,读取所述惩罚规则配置模块中的所述 违禁评分规则、所述违禁评分对应的违禁等级、所述违禁等级的惩罚规则以 及所述违禁用语对应的替代字符,确定所述游戏数据的违禁评分、违禁等级 以及惩罚信息,对所述游戏数据中的违禁用语进行替换,并将替换后的游戏 数据以及所述惩罚信息发送至所述游戏客户端,以对相应游戏账号进行惩罚 处理并输出替换后的游戏数据。

可选地,所述系统还包括:

违禁数据记录模块,与所述违禁惩罚模块连接,以及通过服务器接口与 游戏服务器连接,用于记录并向所述游戏服务器发送所述惩罚信息和所述违 禁等级;

所述违禁惩罚模块还用于读取所述违禁数据记录模块中的违禁记录,并 结合所述违禁记录确定相应游戏账号的违禁等级。

根据本申请的另一个方面,提供了一种游戏数据的监控方法,所述游戏 数据的监控方法应用于上述的游戏数据的监控系统中,所述方法包括:

数据获取模块通过客户端接口从游戏客户端获取待监控的游戏数据,其 中,所述数据获取模块具体包括私密聊天监控入口、组队聊天监控入口、世 界聊天监控入口以及可展示信息监控入口;

数据审核模块识别所述游戏数据是否存在违禁用语;

违禁惩罚模块在所述游戏数据存在违禁用语时向所述游戏客户端发送惩 罚信息。

借由上述技术方案,本申请提供的一种游戏数据的监控系统以及游戏数 据的监控方法,通过数据获取模块获取待监控的游戏数据,游戏数据可以包 括私密聊天数据、组队聊天数据、世界聊天数据以及游戏内可展示信息,而 后数据审核模块对上述游戏数据进行审核,识别游戏数据是否存在违禁用语, 进而在数据审核模块识别出游戏数据存在违禁用语的情况下,违禁惩罚模块 向游戏客户端发送相应的惩罚信息。本申请实施例可实现对游戏内多维度数 据的违禁审核,全面净化游戏环境,并通过分时、分布式设计保证数据处理 效率,可支持千万级在线用户的游戏数据监控,有助于提高游戏数据监控效 率。

上述说明仅是本申请技术方案的概述,为了能够更清楚了解本申请的技 术手段,而可依照说明书的内容予以实施,并且为了让本申请的上述和其它 目的、特征和优点能够更明显易懂,以下特举本申请的具体实施方式。

附图说明

此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部 分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的 不当限定。在附图中:

图1示出了本申请实施例提供的一种游戏数据的监控系统的结构示意图;

图2示出了本申请实施例提供的另一种游戏数据的监控系统的结构示意 图。

具体实施方式

下文中将参考附图并结合实施例来详细说明本申请。需要说明的是,在 不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。

在本实施例中提供了一种游戏数据的监控系统,如图1所示,该系统包 括:

数据获取模块10,通过客户端接口与游戏客户端连接,用于从所述游戏 客户端获取待监控的游戏数据,其中,所述数据获取模块10具体包括私密聊 天监控入口11、组队聊天监控入口12、世界聊天监控入口13以及可展示信 息监控入口14;

数据审核模块20,与所述游戏数据获取模块10连接,用于识别所述游戏 数据是否存在违禁用语;

违禁惩罚模块30,与所述游戏数据审核模块20连接,以及通过客户端接 口与所述游戏客户端连接,用于在所述游戏数据包含违禁用语时向所述游戏 客户端发送惩罚信息。

本申请实施例提供的游戏数据的监控系统,该系统为游戏中聊天等行为 定制设计,负责审查、监控、规范聊天等内容,过滤非法关键字,并自动控 制游戏内的违规宣传行为。该系统采用分布式设计,主要使用http短链接的 模式,使得服务器支持动态扩展,在nginx负载的帮助下,游戏中产生的大量 请求,都能均匀的分摊到服务器的各个节点上,并支持随时动态调整、节点 升级、扩容。数据持久化采用redis集群,利用redis本身的分片集群机制,提 供了很好的动态扩展性,随着压力的增加,动态增加集群分片数即可均匀的 分摊压力,支持每秒千万级的数据处理。另外,为了提高聊天监控系统的响 应速度,采用了分时系统,分时系统和多道批处理系统相比,具有非常明显 的不同特征,首先是分时系统具有多路性和独立性,其次具有及时性和交互 性,使用分时系统能够明显的提高响应速度和处理数据的速度。监控系统可 以集成于游戏服务器中,也可以独立于游戏服务器单独设置在其他物理设备 中,该监控系统具体可以包括数据获取模块10、数据审核模块20以及违禁惩 罚模块30,数据获取模块10通过外部客户端接口与游戏客户端连接,获取玩 家在游戏中的聊天内容、可展示信息等游戏数据,其中数据获取模块10具体 可以包含私密聊天监控入口11、组队聊天监控入口12、世界聊天监控入口13 以及可展示信息监控入口14,分别用于获取游戏中玩家之间一对一的私密聊 天内容、组队聊天内容、世界聊天内容、个性签名等可展示信息,以便对这 些游戏数据的合规性进行审核。数据审核模块20与数据获取模块10连接, 用于对数据获取模块10获取的游戏数据进行审核,识别游戏数据是否存在违 禁用语,违禁惩罚模块30用于在数据审核模块20识别到游戏数据包含违禁 用语时生成惩罚信息,并通过与游戏客户端之间的客户端接口向游戏客户端 发送该惩罚信息,以提示玩家游戏内发言存在违禁用语,以及对玩家进行相 应的惩罚。在具体应用场景中,违禁用语具体可以包含一些不适合公开发布 的违禁内容,这些内容的发布均会在不同程度上影响社交平台内其他用户的 使用体验,甚至对社会产生一定的危害性。通过上述监控系统可以实现对玩 家游戏发言中包含的违禁用语进行识别,并对违禁发言进行惩罚。

另外,需要说明的是,本申请实施例中数据获取模块还可以通过服务器 接口与游戏服务器连接,从游戏服务器中获取待监控的游戏数据,例如聊天 数据会很快被其他玩家发现,因此需要实时审核,为保证数据获取速度,可 以通过客户端接口直接从游戏客户端中获取,而可展示信息可能不会很快被 其他玩家发现,为减轻数据获取模块的数据获取压力、减轻网络的数据传输 压力,可以通过服务器接口从游戏服务器中获取。

通过应用本实施例的技术方案,通过数据获取模块10获取待监控的游戏 数据,游戏数据可以包括私密聊天数据、组队聊天数据、世界聊天数据以及 游戏内可展示信息,而后数据审核模块20对上述游戏数据进行审核,识别游 戏数据是否存在违禁用语,进而在数据审核模块20识别出游戏数据存在违禁 用语的情况下,违禁惩罚模块30向游戏客户端发送相应的惩罚信息。本申请 实施例可实现对游戏内多维度数据的违禁审核,全面净化游戏环境,并通过 分时、分布式设计保证数据处理效率,可支持千万级在线用户的游戏数据监控,有助于提高游戏数据监控效率。

在本申请任一实施例中,如图2所示,可选地,所述系统还包括:违禁 用语配置模块40,所述违禁用语配置模块与所述数据审核模块20连接,用于 存储预设违禁字符;所述数据审核模块20具体用于调用所述违禁用语配置模 块40中的所述预设违禁字符,依据所述预设违禁字符识别所述游戏数据是否 存在违禁用语。

在上述实施例中,该监控系统还可以包括违禁用语配置模块40,工作人 员可以向违禁用语配置模块中配置违禁用语,或者通过机器学习、爬虫获取 等方式获得违禁用语,并对转换为预设违禁字符进行存储,进而在数据审核 模块20对游戏数据进行识别时,可以从违禁用语配置模块40中读取预设违 禁字符,以依据读取的预设违禁字符对游戏数据中的违禁用语进行识别。当 有违禁用语增加、删减、修改时,只需要对违禁用语配置模块40中存储的预 设违禁字符进行配置即可,无需对其他模块进行改动,系统修改方便、灵活。

在本申请任一实施例中,如图2所示,可选地,所述系统还包括:音频 识别模块50,与所述数据获取模块10以及所述数据审核模块20连接,用于 在所述游戏数据为音频形式时,对所述游戏数据进行音频识别,将所述游戏 数据从音频形式转换为文本形式。

在上述实施例中,该监控系统还可以包括音频识别模块50,针对游戏中 音频转文字的发言方式,即玩家通过声音输入,语音识别转换为文字后进行 展示的方式,可以通过音频识别模块50进行音频识别,将音频形式的游戏数 据转换为文本形式,以便后续对文本形式的游戏数据进行违禁用语识别。

在本申请任一实施例中,如图2所示,可选地,所述系统还包括:数据 预处理模块60,与所述数据获取模块10以及所述音频识别模块50连接,用 于对文本形式的游戏数据进行标准化处理,其中,所述标准化处理包括文本 分词、过滤预设字符、繁体转换简体,所述预设字符至少包括特殊字符和/或 HTML。

在上述实施例中,该监控系统还可以包括数据预处理模块60,该数据预 处理模块60用于对文本形式的游戏数据进行标准化处理,具体与数据获取模 块10以及音频识别模块50连接,数据预处理模块60可以从数据获取模块10 以及音频识别模块50中读取文本形式的游戏数据,并进行标准化处理。在实 际应用中,具体可以进行文本分词、过滤特殊字符、过滤HTML、繁体向简 体转换等标准化处理。在实际应用场景中,可以先对游戏数据进行切词处理, 按照游戏数据中各字符顺序生成字符序列[字符1,字符2,字符3,…字符 N],为了避免通过字符拆分或通过在字符中间插入特殊字符的形式来逃避审 核,还可以对字符序列执行数据清洗操作,去除第一字符序列中乱码、空格, 以及起到混淆作用的特殊字符,如对于聊天数据“明~教”,在拆分为字符序列 时,可得到字符序列:[明,~,教],“~”这一字符对于聊天内容的意思表示作 用可以忽略,玩家输入这一字符的目的可能在于逃避违规审核,因此可以将“~” 这一字符去除,字符序列变为[明,教]。另外,为了防止玩家使用HTML标 签来逃避监测,还可以进行HTML过滤去掉游戏数据中的HTML标签,此外, 目前很多输入法带有繁体输入,针对玩家输入的文本内容可能包含繁体字的 情况,还可以对游戏数据进行繁体向简体转换,从而利用标准化处理后的游 戏数据进行违规用语识别。

在本申请任一实施例中,如图2所示,可选地,所述数据审核模块20, 包括:违禁用语识别子模块21,与所述数据预处理模块60连接,用于按照预 设单次字符识别数量,对标准化处理后的游戏数据进行分段,以及分别对每 一段游戏数据包含的字符进行全排列得到待监控字符组合,并按预设识别规 则对所述待监控字符组合进行违禁用语识别。

在上述实施例中,数据审核模块20具体包括违禁用语识别子模块21,通 过违禁用语识别子模块21对标准化处理后的游戏数据进行分段、重新组合, 从而进行识别。本实施例中,为了防止玩家将违禁词颠倒,来逃避监测,以 实现发布违禁用语的目的。可以将标准化处理后得到的游戏数据的字符序列 拆分为一个一个的字符,然后一次性按顺序取出若干个字符,将他们排列组 合得到待监控字符组合,而后对待监控字符组合进行识别,以实现对游戏数 据识别的目的。具体可以基于正则表达式对待监控字符组合进行匹配,识别待监控字符组合中的违规字符。

在本申请任一实施例中,如图2所示,可选地,所述数据审核模块20, 还包括:字符匹配子模块22,与所述违禁用语识别子模块21连接,用于在所 述违禁用语识别子模块21未识别出违禁用语时,对所述游戏数据中包含的任 一字符进行字符匹配确定所述任一字符对应的匹配字符;所述违禁用语识别 子模块21,还用于按照预设单次字符识别数量选择所述匹配字符并进行全排 列,并按预设识别规则对全排列的匹配字符进行违禁用语识别。

在上述实施例中,针对一些玩家输入与违规用词的字音或字形相似的字 的情况,还可以先进行字符匹配,再对匹配字符进行排列组合,从而进行违 禁用语识别,具体可以利用数据审核模块20中的字符匹配子模块22进行字 符匹配。可选地,所述字符匹配子模块22,具体用于在所述违禁用语识别子 模块21未识别出违禁用语时,计算所述游戏数据中任一字符与预设违禁字符 的音码相似度和形码相似度,并按对应的权重对所述音码相似度和所述形码 相似度加权求和,依据加权求和结果确定所述任一字符对应的匹配字符。

在具体应用场景中,对于单字的相似度匹配,采用公式

其中,p

其中,s

A=(w

将集合A中各个部件之间的相似度通过人工分类和定义,由此构成m×m 的原子部件相似矩阵。

其中:w

在本申请任一实施例中,如图2所示,可选地,所述系统还包括:识别 规则训练模块70,用于通过有效性分析对违禁用语样本进行筛选,并基于筛 选后的违禁用语样本训练违禁用语识别模型;所述违禁用语识别子模块21通 过调用所述识别规则训练模块训练好的所述违禁用语识别模型进行违禁用语 识别。

在上述实施例中,该监控系统还包括识别规则训练模块70,该模块用语 训练违禁用语识别规则,识别规则具体可以为违禁用语识别模型,从而违禁 用于识别子模块21通过调用识别规则训练模块70中训练好的模型实现违禁 用语的识别。关于违禁用语识别模型的训练,首先需要获取数据,所谓数据, 就是指训练模型所需要的大量的违禁样本信息,该样本决定了机器学习结果 的上限,然后筛选出显著特征的、摒弃非显著特征的词语或者语句,这样能 使算法的效果和性能得到显著的提高,这里可以运用特征有效性分析的相关技术,例如相关系数、卡方检验、平均互信息、条件熵、后验概率、逻辑回 归权重等方法,最后用大量的数据,也就是大量的违规消息来进行测试,进 行模型诊断,根据要屏蔽的信息,来调整相关的参数,得到最终的识别模型。 此外根据需要,这个识别模型可以调优,不断地加入新的数据,对模型进行 训练。

在本申请任一实施例中,如图2所示,可选地,所述系统还包括:惩罚 规则配置模块80,用于配置在不同游戏数据类型中各违禁用语对应的违禁评 分规则、违禁评分对应的违禁等级、违禁等级的惩罚规则以及违禁用语对应 的替代字符,其中,游戏数据类型包括私密聊天、组队聊天、世界聊天以及 可展示信息;所述违禁惩罚模块30与所述惩罚规则配置模块80连接,所述 违禁惩罚模块30还用于在所述游戏数据包含违禁用语时,读取所述惩罚规则 配置模块80中的所述违禁评分规则、所述违禁评分对应的违禁等级、所述违 禁等级的惩罚规则以及所述违禁用语对应的替代字符,确定所述游戏数据的 违禁评分、违禁等级以及惩罚信息,对所述游戏数据中的违禁用语进行替换, 并将替换后的游戏数据以及所述惩罚信息发送至所述游戏客户端,以对相应 游戏账号进行惩罚处理并输出替换后的游戏数据。

在上述实施例中,该监控系统还可以包括惩罚规则配置模块80,可以针 对不同的游戏数据类型,配置各违禁用语的评分规则,例如词语A在私密聊 天中和世界聊天中对应的评分规则可以不同,当然也可以相同。不同的违禁 消息有不同的分值占比,用户有一个违禁分值阈值,数据审核模块20判断游 戏数据存在违禁用语后,违禁惩罚模块30可以调用惩罚规则配置模块80中 的违禁评分规则、违禁评分对应的违禁等级、违禁等级的惩罚规则,计算这 条游戏数据的违禁分值,并将该条游戏数据所占分值附加到用户的违禁分值上,确定违禁分值对应的违禁等级,并进一步确定该违禁等级对应的惩罚规 则,在实际应用中,一旦用户的违禁分值超过系统规定的分数线,该用户将 会面临禁言、或者封号的惩罚。另外,惩罚规则配置模块80中还可以配置用 于替代违规字符的替代字符,例如*,从而将违禁词汇转换成*进行输出。

在本申请任一实施例中,如图2所示,可选地,所述系统还包括:违禁 数据记录模块90,与所述违禁惩罚模块30连接,以及通过服务器接口与游戏 服务器连接,用于记录并向所述游戏服务器发送所述惩罚信息和所述违禁等 级;所述违禁惩罚模块30还用于读取所述违禁数据记录模块90中的违禁记 录,并结合所述违禁记录确定相应游戏账号的违禁等级。

在上述实施例中,该监控系统还可以包括违禁数据记录模块90,用于记 录违禁惩罚模块30确定的惩罚信息、违禁等级记录下来,例如记录用户的违 禁分值,以便该用户下次有违禁发言时进行分值累加,另外,还可以将惩罚 信息、违禁等级发送到游戏服务器中进行备份。

通过应用本实施例的技术方案,游戏数据的监控系统可满足:1、具有聊 天信息上报接收功能,能够对上报的聊天信息进行分析,匹配出不规范的聊 天信息,按危险等级进行处理和记录。2、系统应能根据人工智能学习,定时 更新监控内容,能准确的识别不规范的聊天信息及游戏中非法商业宣传。3、 监控中心可以对存在问题的聊天信息进行屏蔽,并对违规的玩家按危险等级 采取相应的措施。4、需支持语音聊天识别功能,对语音中的关键字进行分析 和审查。5、针对聊天信息的数量级非常大,需要服务器支持每秒千万级数据处理能力。

在一种具体实施方式中,游戏数据监控系统中,Chat模块(即数据获取 模块10)用于接收用户输出,是聊天监控的入口。其下分为ChatSecret(监控 私密聊天入口),Chateam(监控组队聊天入口),ChatWorld(监控世界聊天入 口)等。其中的RegexMatch函数,接受到用户输入之后,会利用使用分词算 法,对用户的输入进行分词,然后使用正则与违禁词库中的词进行匹配,若 匹配上,则根据评分体系,进行评分并录入数据库。若通过正则匹配之后没 有出现违规,则数据会流向RisingSpace、ChineseSplit、HighLight等函数,进 行针对跳字处理,汉字拆分,高亮方法进行检测,若检测出有违禁词汇,则 根据评分体系,进行评分并录入数据库。之后进行组合判断,将通过前面几 个函数的数据放入到SimTradTran、HtmlFilter函数进行简体/繁体转换,HTML 过滤,进行监测,若出现违禁,则根据评分体系,进行评分并录入数据库。 Packageconfig模块(即违禁惩罚模块30)用于读取配置的模块(即惩罚规则 配置模块80),可以让管理员根据配置的不同筛查数据库中用户的评分,并根据评分进行对用户的惩处。另外,通过AIProcess模块对监测出来的的违禁 词汇进行自动屏蔽,将违禁词汇转换成*进行输出。

在本实施例中提供了一种游戏数据的监控方法,所述游戏数据的监控方 法应用于如图1或图2的游戏数据的监控系统中,该方法包括:

A1,数据获取模块通过客户端接口从游戏客户端获取待监控的游戏数据, 其中,所述数据获取模块具体包括私密聊天监控入口、组队聊天监控入口、 世界聊天监控入口以及可展示信息监控入口;

A2,数据审核模块识别所述游戏数据是否存在违禁用语;

A3,违禁惩罚模块在所述游戏数据存在违禁用语时向所述游戏客户端发 送惩罚信息。

进一步的,作为上述实施例具体实施方式的细化和扩展,为了完整说明 本实施例的具体实施过程,提供了另一种游戏数据的监控方法,该方法包括:

B1,数据获取模块通过客户端接口从游戏客户端获取待监控的游戏数据, 其中,所述数据获取模块具体包括私密聊天监控入口、组队聊天监控入口、 世界聊天监控入口以及可展示信息监控入口;

B2,音频识别模块在所述游戏数据为音频形式时,对所述游戏数据进行 音频识别,将所述游戏数据从音频形式转换为文本形式;

B3,数据预处理模块对文本形式的游戏数据进行标准化处理,其中,所 述标准化处理包括文本分词、过滤预设字符、繁体转换简体,所述预设字符 至少包括特殊字符和/或HTML。

B4,数据审核模块调用违禁用语配置模块中的所述预设违禁字符,依据 所述预设违禁字符识别所述游戏数据是否存在违禁用语;其中,违禁用语识 别子模块,按照预设单次字符识别数量,对标准化处理后的游戏数据进行分 段,以及分别对每一段游戏数据包含的字符进行全排列得到待监控字符组合, 并按预设识别规则对所述待监控字符组合进行违禁用语识别;字符匹配子模 块,在所述违禁用语识别子模块未识别出违禁用语时,对所述游戏数据中包 含的任一字符进行字符匹配确定所述任一字符对应的匹配字符;所述违禁用 语识别子模块,按照预设单次字符识别数量选择所述匹配字符并进行全排列, 并按预设识别规则对全排列的匹配字符进行违禁用语识别;所述字符匹配子 模块,在所述违禁用语识别子模块未识别出违禁用语时,计算所述游戏数据 中任一字符与预设违禁字符的音码相似度和形码相似度,并按对应的权重对 所述音码相似度和所述形码相似度加权求和,依据加权求和结果确定所述任 一字符对应的匹配字符;识别规则训练模块通过有效性分析对违禁用语样本 进行筛选,并基于筛选后的违禁用语样本训练违禁用语识别模型,所述违禁 用语识别子模块通过调用所述识别规则训练模块训练好的所述违禁用语识别 模型进行违禁用语识别;

B5,惩罚规则配置模块,配置在不同游戏数据类型中各违禁用语对应的 违禁评分规则、违禁评分对应的违禁等级、违禁等级的惩罚规则以及违禁用 语对应的替代字符,其中,游戏数据类型包括私密聊天、组队聊天、世界聊 天以及可展示信息;

B6,违禁惩罚模块在所述游戏数据包含违禁用语时,读取所述惩罚规则 配置模块中的所述违禁评分规则、所述违禁评分对应的违禁等级、所述违禁 等级的惩罚规则以及所述违禁用语对应的替代字符,确定所述游戏数据的违 禁评分、违禁等级以及惩罚信息,对所述游戏数据中的违禁用语进行替换, 并将替换后的游戏数据以及所述惩罚信息发送至所述游戏客户端,以对相应 游戏账号进行惩罚处理并输出替换后的游戏数据;所述违禁惩罚模块读取所 述违禁数据记录模块中的违禁记录,并结合所述违禁记录确定相应游戏账号 的违禁等级;

B7,违禁数据记录模块记录并向所述游戏服务器发送所述惩罚信息和所 述违禁等级。

本领域技术人员可以理解附图只是一个优选实施场景的示意图,附图中 的模块或流程并不一定是实施本申请所必须的。本领域技术人员可以理解实 施场景中的装置中的模块可以按照实施场景描述进行分布于实施场景的装置 中,也可以进行相应变化位于不同于本实施场景的一个或多个装置中。上述 实施场景的模块可以合并为一个模块,也可以进一步拆分成多个子模块。

上述本申请序号仅仅为了描述,不代表实施场景的优劣。以上公开的仅 为本申请的几个具体实施场景,但是,本申请并非局限于此,任何本领域的 技术人员能思之的变化都应落入本申请的保护范围。

相关技术
  • 一种游戏数据的监控系统以及游戏数据的监控方法
  • 一种游戏数据监控方法和装置
技术分类

06120113291887