商品识别及结算方法、装置、电子设备、存储介质

文献发布时间：2023-06-19 11:14:36

技术领域

本说明书一个或多个实施例涉及人工智能技术领域，尤其涉及一种商品识别及结算方法、装置、电子设备、存储介质。

背景技术

在相关技术中，机器学习技术可利用算法从已有数据中学习，对现实世界的情况作出判断和决策。机器学习技术包括有监督学习、无监督学习、半监督学习、强化学习等等。

针对有监督学习的训练过程，输入的样本数据被称为“训练集”，训练集中的样本数据有一个明确的标识或结果（即样本标签），在利用有监督学习算法建立预测模型时，有监督学习算法建立一个学习过程，将预测结果与“训练集”的实际结果进行比较，不断的调整预测模型，直到模型的预测结果达到一个预期的准确率。

有监督学习的常见应用场景包括分类问题、回归问题等，常见算法包括逻辑回归、神经网络、决策树、支持向量机、贝叶斯分类器等等。

发明内容

有鉴于此，本说明书一个或多个实施例提供一种商品识别及结算方法、装置、电子设备、存储介质。

为实现上述目的，本说明书一个或多个实施例提供技术方案如下：

根据本说明书一个或多个实施例的第一方面，提出了一种商品识别模型的训练方法，包括：

获取样本数据集合，所述样本数据集合中的各个样本数据包含至少一个单品和/或至少一个由多个单品组合得到的组合商品的图像数据；其中，单品的图像数据被标注有相应的单品类别信息，组合商品的图像数据被标注有相应的组合类别信息；

针对所述样本数据集合中的任一样本数据，对所述任一样本数据进行划分以得到所述任一样本数据中各个单品的图像数据，所述任一样本数据包含的组合商品的图像数据被划分为组成所述组合商品的各个单品的图像数据；

将划分得到的图像数据分别作为编解码网络的编码器中各个时间步对应的编码网络的输入参数，并将所述任一样本数据中标注的单品类别信息和组合类别信息分别作为所述编解码网络的解码器中各个时间步对应的解码网络的输出参数，以对所述编解码网络进行训练得到商品识别模型。

可选的，所述编码器的时间步长与划分所述任一样本数据得到的单品数量相匹配。

可选的，所述解码器的时间步长与所述任一样本数据中标注的单品类别信息和组合类别信息的数量之和相匹配；

或者，所述解码器的时间步长为预设时间步长。

可选的，所述任一样本数据通过对相应的原始图像数据进行主体检测得到；

所述方法还包括：确定划分得到的各个图像数据对应的单品在所述原始图像数据中的位置信息，按照针对所述原始图像数据的预设方向和所述位置信息对划分得到的各个图像数据进行排序；

所述将划分得到的图像数据分别作为编解码网络的编码器中各个时间步对应的编码网络的输入参数，包括：将划分得到的图像数据按照排序依次作为所述编码器中各个时间步对应的编码网络的输入参数。

根据本说明书一个或多个实施例的第二方面，提出了一种商品识别方法，应用于服务端；所述方法包括：

获取商户的参考商品的参考图像数据，所述参考商品属于单品或者由多个单品组合得到的组合商品，单品的参考图像数据被标注有相应的单品类别信息，组合商品的参考图像数据被标注有相应的组合类别信息；

在所述参考商品属于单品的情况下，通过上述实施例中任一项方法中的商品识别模型对所述参考图像数据进行特征推理得到所述参考商品的第一单品特征，并建立所述参考商品的参考图像数据被标注的单品类别信息与所述第一单品特征之间的映射关系；在所述参考商品属于组合商品的情况下，对所述参考图像数据进行划分得到所述参考商品中各个单品的图像数据，通过所述商品识别模型分别对划分得到的各个图像数据进行特征推理得到对应于各个单品的第二单品特征，将各个第二单品特征共同作为所述参考商品的组合商品特征，并建立所述参考商品的参考图像数据被标注的组合类别信息与所述组合商品特征之间的映射关系；

在接收到目标商品的待识别图像数据的情况下，对所述待识别图像数据进行划分得到所述目标商品包含的单品的图像数据，通过所述商品识别模型分别对划分得到的各个图像数据进行特征推理得到对应于各个单品的第三单品特征，在建立的映射关系中查询与所述第三单品特征相匹配的目标特征，并将所述目标特征对应的类别信息作为针对所述目标商品的识别结果。

根据本说明书一个或多个实施例的第三方面，提出了一种商品识别方法，应用于实体门店的客户端；所述方法包括：

向服务端上传参考商品的参考图像数据，所述参考商品属于单品或者由多个单品组合得到的组合商品，单品的参考图像数据被标注有相应的单品类别信息，组合商品的参考图像数据被标注有相应的组合类别信息；在所述参考商品属于单品的情况下，所述参考图像数据被所述服务端通过上述实施例中任一项方法中的商品识别模型进行特征推理得到所述参考商品的第一单品特征，并建立所述参考商品的参考图像数据被标注的单品类别信息与所述第一单品特征之间的映射关系；在所述参考商品属于组合商品的情况下，所述参考图像数据被所述服务端划分得到所述参考商品中各个单品的图像数据，通过所述商品识别模型分别对划分得到的各个图像数据进行特征推理得到对应于各个单品的第二单品特征，将各个第二单品特征共同作为所述参考商品的组合商品特征，并建立所述参考商品的参考图像数据被标注的组合类别信息与所述组合商品特征之间的映射关系；

在采集到目标商品的待识别图像数据的情况下，向所述服务端发送所述待识别图像数据，以由所述服务端对所述待识别图像数据进行划分得到所述目标商品包含的单品的图像数据，通过所述商品识别模型分别对划分得到的各个图像数据进行特征推理得到对应于各个单品的第三单品特征，在建立的映射关系中查询与所述第三单品特征相匹配的目标特征，并将所述目标特征对应的类别信息作为针对所述目标商品的识别结果；

接收所述服务端返回的所述识别结果。

根据本说明书一个或多个实施例的第四方面，提出了一种商品结算方法，应用于服务端；所述方法包括：

接收实体门店的客户端上传的针对目标商品的待识别图像数据，所述目标商品包含至少一个单品和/或至少一个由多个单品组合得到的组合商品；

对所述待识别图像数据进行划分得到所述目标商品包含的各个单品的图像数据，并将划分得到的各个单品的图像数据分别输入至上述实施例中任一项方法中的商品识别模型；其中，所述商品识别模型的输出结果用于被按照相应的结算规则进行价格结算，结算规则包括对应于单品的第一结算规则和对应于组合商品的第二结算规则。

可选的，所述对所述待识别图像数据进行划分得到所述目标商品包含的各个单品的图像数据，包括：

对所述待识别图像数据进行主体检测得到所述目标商品的主体图像数据；

通过预设分类模型对所述主体图像数据进行分类以得到所述目标商品包含的各个单品的图像数据。

可选的，结算规则与所述目标商品的容器规格相关；所述方法还包括：

根据所述待识别图像数据识别出所述目标商品的容器的容器规格，所述容器规格用于被按照相应的结算规则进行结算。

根据本说明书一个或多个实施例的第五方面，提出了一种商品结算方法，应用于实体门店的客户端；所述方法包括：

采集目标商品的待识别图像数据，所述目标商品包含至少一个单品和/或至少一个由多个单品组合得到的组合商品；

向服务端上传所述待识别图像数据，以由所述服务端对所述待识别图像数据进行划分得到所述目标商品包含的各个单品的图像数据，并将划分得到的各个单品的图像数据分别输入至上述实施例中任一项方法中的商品识别模型；

展示针对所述目标商品的结算价格，所述结算价格通过将所述商品识别模型的输出结果按照相应的结算规则进行结算得到，结算规则包括对应于单品的第一结算规则和对应于组合商品的第二结算规则。

根据本说明书一个或多个实施例的第六方面，提出了一种商品识别模型的训练装置，包括：

获取单元，获取样本数据集合，所述样本数据集合中的各个样本数据包含至少一个单品和/或至少一个由多个单品组合得到的组合商品的图像数据；其中，单品的图像数据被标注有相应的单品类别信息，组合商品的图像数据被标注有相应的组合类别信息；

划分单元，针对所述样本数据集合中的任一样本数据，对所述任一样本数据进行划分以得到所述任一样本数据中各个单品的图像数据，所述任一样本数据包含的组合商品的图像数据被划分为组成所述组合商品的各个单品的图像数据；

训练单元，将划分得到的图像数据分别作为编解码网络的编码器中各个时间步对应的编码网络的输入参数，并将所述任一样本数据中标注的单品类别信息和组合类别信息分别作为所述编解码网络的解码器中各个时间步对应的解码网络的输出参数，以对所述编解码网络进行训练得到商品识别模型。

可选的，所述编码器的时间步长与划分所述任一样本数据得到的单品数量相匹配。

可选的，所述解码器的时间步长与所述任一样本数据中标注的单品类别信息和组合类别信息的数量之和相匹配；

或者，所述解码器的时间步长为预设时间步长。

可选的，所述任一样本数据通过对相应的原始图像数据进行主体检测得到；

所述划分单元还用于：确定划分得到的各个图像数据对应的单品在所述原始图像数据中的位置信息，按照针对所述原始图像数据的预设方向和所述位置信息对划分得到的各个图像数据进行排序；

将划分得到的图像数据按照排序依次作为所述编码器中各个时间步对应的编码网络的输入参数。

根据本说明书一个或多个实施例的第七方面，提出了一种商品识别装置，应用于服务端；所述装置包括：

获取单元，获取商户的参考商品的参考图像数据，所述参考商品属于单品或者由多个单品组合得到的组合商品，单品的参考图像数据被标注有相应的单品类别信息，组合商品的参考图像数据被标注有相应的组合类别信息；

特征提取单元，在所述参考商品属于单品的情况下，通过上述实施例中任一项方法中的商品识别模型对所述参考图像数据进行特征推理得到所述参考商品的第一单品特征，并建立所述参考商品的参考图像数据被标注的单品类别信息与所述第一单品特征之间的映射关系；在所述参考商品属于组合商品的情况下，对所述参考图像数据进行划分得到所述参考商品中各个单品的图像数据，通过所述商品识别模型分别对划分得到的各个图像数据进行特征推理得到对应于各个单品的第二单品特征，将各个第二单品特征共同作为所述参考商品的组合商品特征，并建立所述参考商品的参考图像数据被标注的组合类别信息与所述组合商品特征之间的映射关系；

识别单元，在接收到目标商品的待识别图像数据的情况下，对所述待识别图像数据进行划分得到所述目标商品包含的单品的图像数据，通过所述商品识别模型分别对划分得到的各个图像数据进行特征推理得到对应于各个单品的第三单品特征，在建立的映射关系中查询与所述第三单品特征相匹配的目标特征，并将所述目标特征对应的类别信息作为针对所述目标商品的识别结果。

根据本说明书一个或多个实施例的第八方面，提出了一种商品识别装置，应用于实体门店的客户端；所述装置包括：

注册单元，向服务端上传参考商品的参考图像数据，所述参考商品属于单品或者由多个单品组合得到的组合商品，单品的参考图像数据被标注有相应的单品类别信息，组合商品的参考图像数据被标注有相应的组合类别信息；在所述参考商品属于单品的情况下，所述参考图像数据被所述服务端通过上述实施例中任一项方法中的商品识别模型进行特征推理得到所述参考商品的第一单品特征，并建立所述参考商品的参考图像数据被标注的单品类别信息与所述第一单品特征之间的映射关系；在所述参考商品属于组合商品的情况下，所述参考图像数据被所述服务端划分得到所述参考商品中各个单品的图像数据，通过所述商品识别模型分别对划分得到的各个图像数据进行特征推理得到对应于各个单品的第二单品特征，将各个第二单品特征共同作为所述参考商品的组合商品特征，并建立所述参考商品的参考图像数据被标注的组合类别信息与所述组合商品特征之间的映射关系；

发送单元，在采集到目标商品的待识别图像数据的情况下，向所述服务端发送所述待识别图像数据，以由所述服务端对所述待识别图像数据进行划分得到所述目标商品包含的单品的图像数据，通过所述商品识别模型分别对划分得到的各个图像数据进行特征推理得到对应于各个单品的第三单品特征，在建立的映射关系中查询与所述第三单品特征相匹配的目标特征，并将所述目标特征对应的类别信息作为针对所述目标商品的识别结果；

接收单元，接收所述服务端返回的所述识别结果。

根据本说明书一个或多个实施例的第九方面，提出了一种商品结算装置，应用于服务端；所述装置包括：

接收单元，接收实体门店的客户端上传的针对目标商品的待识别图像数据，所述目标商品包含至少一个单品和/或至少一个由多个单品组合得到的组合商品；

识别单元，对所述待识别图像数据进行划分得到所述目标商品包含的各个单品的图像数据，并将划分得到的各个单品的图像数据分别输入至上述实施例中任一项方法中的商品识别模型；其中，所述商品识别模型的输出结果用于被按照相应的结算规则进行价格结算，结算规则包括对应于单品的第一结算规则和对应于组合商品的第二结算规则。

可选的，所述识别单元具体用于：

对所述待识别图像数据进行主体检测得到所述目标商品的主体图像数据；

通过预设分类模型对所述主体图像数据进行分类以得到所述目标商品包含的各个单品的图像数据。

可选的，结算规则与所述目标商品的容器规格相关；所述识别单元还用于：

根据所述待识别图像数据识别出所述目标商品的容器的容器规格，所述容器规格用于被按照相应的结算规则进行结算。

根据本说明书一个或多个实施例的第十方面，提出了一种商品结算装置，应用于实体门店的客户端；所述装置包括：

采集单元，采集目标商品的待识别图像数据，所述目标商品包含至少一个单品和/或至少一个由多个单品组合得到的组合商品；

上传单元，向服务端上传所述待识别图像数据，以由所述服务端对所述待识别图像数据进行划分得到所述目标商品包含的各个单品的图像数据，并将划分得到的各个单品的图像数据分别输入至上述实施例中任一项方法中的商品识别模型；

展示单元，展示针对所述目标商品的结算价格，所述结算价格通过将所述商品识别模型的输出结果按照相应的结算规则进行结算得到，结算规则包括对应于单品的第一结算规则和对应于组合商品的第二结算规则。

根据本说明书一个或多个实施例的第十一方面，提出了一种电子设备，包括：

处理器；

用于存储处理器可执行指令的存储器；

其中，所述处理器通过运行所述可执行指令以实现如上述任一实施例中所述的方法。

根据本说明书一个或多个实施例的第十二方面，提出了一种计算机可读存储介质，其上存储有计算机指令，该指令被处理器执行时实现如上述实施例中任一所述的步骤。

本说明书的技术方案涉及对商品类别的识别，商品可能为多个单品（单品之间相互独立，不存在关联），也可能为由多个单品组合得到的组合商品（单品之间存在关联，共同组成组合商品）。因此，用户在选取商品时，该商品中包含的单品可能为独立的商品（与所选取的商品中其他单品无法构成组合商品），也可能为组合商品的一部分（可与所选取的商品中其他单品构成组合商品）。

Seq2Seq（Sequence to Sequence）模型中的Encoder-Decoder（编码-解码）网络能够充分学习特征序列中各个特征之间的关联关系，使得后续使用该Seq2Seq（Sequence toSequence）模型时可有效识别存在关联的多个特征，从而将该多个特征作为一个整体。而组合商品同样存在所包含的各个单品之间存在关联的特点。对此，可将组合商品的识别问题作为sequence-to-sequence的任务，通过上述样本数据来训练得到编解码网络中编码器和解码器中的函数，可有效学习到组合商品中各个单品之间的关联关系，对多个单品做自适应的合并匹配，将属于同一组合商品的单品对应的图像特征合并至相应的组合类别，而无法构成组合商品的单品则保留该单品的单品类别进行输出。

进一步的，多个单品分别单独售卖和共同构成一组合商品进行售卖，相应的结算规则可能存在差异。因此，基于对组合商品和单品的识别，可分别采用对应于单品的第一结算规则来对识别出的单品进行价格结算，以及采用对应于组合商品的第二结算规则来对识别出的组合商品进行价格结算，从而准确对用户选取的商品进行价格结算。

附图说明

图1是一示例性实施例提供的一种组合商品的示意图。

图2是一示例性实施例提供的一种商品识别模型的训练方法的流程图。

图3是一示例性实施例提供的另一种商品识别模型的训练方法的流程图。

图4是一示例性实施例提供的一种编解码网络的示意图。

图5是一示例性实施例提供的一种商品结算方法的流程图。

图6是一示例性实施例提供的另一种商品结算方法的流程图。

图7是一示例性实施例提供的一种菜品结算方法的交互图。

图8是一示例性实施例提供的一种商品识别方法的流程图。

图9是一示例性实施例提供的另一种商品识别方法的流程图。

图10是一示例性实施例提供的一种设备的结构示意图。

图11是一示例性实施例提供的一种商品识别模型的训练装置的框图。

图12是一示例性实施例提供的一种商品识别装置的框图。

图13是一示例性实施例提供的另一种商品识别装置的框图。

图14是一示例性实施例提供的一种商品结算装置的框图。

图15是一示例性实施例提供的另一种商品结算装置的框图。

具体实施方式

这里将详细地对示例性实施例进行说明，其示例表示在附图中。下面的描述涉及附图时，除非另有表示，不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本说明书一个或多个实施例相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本说明书一个或多个实施例的一些方面相一致的装置和方法的例子。

需要说明的是：在其他实施例中并不一定按照本说明书示出和描述的顺序来执行相应方法的步骤。在一些其他实施例中，其方法所包括的步骤可以比本说明书所描述的更多或更少。此外，本说明书中所描述的单个步骤，在其他实施例中可能被分解为多个步骤进行描述；而本说明书中所描述的多个步骤，在其他实施例中也可能被合并为单个步骤进行描述。

实体门店在出售商品时，可提供单品和组合商品供用户购买。其中，组合商品由多个指定的单品构成，即将该多个指定的单品进行绑定销售。对于组合商品中的多个单品，各个单品之间并非相互独立。而针对组合商品中的某一单品，存在实体门店也提供单独销售的情况。与此同时，实体门店可配置自动收银设备，该自动收银设备设有摄像头，可采集用户选取的商品，从而对其进行类别识别（比如识别商品的名称），确定出各个商品的价格以对该用户本次购买的所有商品进行价格结算。

由于单品的结算规则和组合商品的结算规则存在差异，对于用户选取的商品（可选取某一单品，也可选取组合商品），应识别其中的各个单品是否能够构成组合商品，从而准确计算价格。

结合图1进行举例说明。组合商品汉堡套餐10包括以下单品：可乐11、汉堡12和薯条13；其中，结算规则如表1所示：

可见，若对汉堡套餐10包括的单品分别单独进行结算，则价格为24元；而若将可乐11、汉堡12和薯条13识别为汉堡套餐10，则价格为22元。除此之外，用户也可能仅选取了可乐11和汉堡12，在该情况下应该将可乐11和汉堡12作为两个单品进行结算，而并非将两者作为套餐。

对此，本说明书提供一种商品识别模型的训练方案，可训练得到用于识别商品组合的商品识别模型，从而确定用户购买的商品中包含的单品应该按照单独结算来计算价格，还是按照套餐来计算价格。

请参见图2，图2是一示例性实施例提供的一种商品识别模型的训练方法的流程图。如图2所示，该方法应用于任意用于训练模型的服务器中，可以包括以下步骤：

步骤202，获取样本数据集合，所述样本数据集合中的各个样本数据包含至少一个单品和/或至少一个由多个单品组合得到的组合商品的图像数据；其中，单品的图像数据被标注有相应的单品类别信息，组合商品的图像数据被标注有相应的组合类别信息。

在本实施例中，可获取包含多个样本数据的样本数据集合，样本数据可以仅包含单品（至少一个）的图像数据，也可以仅包含组合商品（至少一个）的图像数据，还可以同时包含单品和组合商品。需要注意的是，虽然组合商品由多个单品组成，但是该组合商品应当理解为一件商品，组成该组合商品的多个单品并非相互独立。因此，组合商品的图像数据作为一个整体被标注有相应的组合类别信息，而可供单独销售的各个单品（每个单品分别为不同的整体）的图像数据则分别被标注有相应的单品类别信息。应当理解的是，某个单品既可以单独售卖，也可作为组合商品的一部分。换言之，针对同一单品，当该单品单独售卖（即整个图像数据中该单品与其他单品并未构成组合商品，或者整个图像数据不包含其他单品）时，为该单品对应的图像数据标注单品类别信息；当该单品与整个图像数据中其他单品共同构成组合商品时，为该组合商品对应的图像数据标注组合类别信息。比如，对于某个仅包含一个组合商品的图像数据，应当为该图像数据标注组合商品对应的组合类别信息，而并非分别为组合商品中的每个单品标注单品类别信息。

可由训练商品识别模型的开发人员人工完成上述标注操作，或者通过其他任意方式来完成样本数据的标注，以尽可能保证样本数据标签的准确性，本说明书并不对标注样本数据的方式进行限定。其中，类别信息（单品类别信息和组合类别信息）具体可以为商品（单品和组合商品）的名称。

举例而言，单品可以是番茄炒蛋、小炒肉和米饭等商品，这些商品均可以单独售卖；还可将番茄炒蛋、小炒肉和米饭作为炒肉套餐进行售卖。那么，可分别拍摄番茄炒蛋、小炒肉和米饭等单品的图像数据（共三份图像数据），并分别标注各个单品的名称作为标签。同时，还可拍摄一份炒肉套餐的图像数据，并为该图像数据标注名称为“炒肉套餐”的标签。当然，实际标签可采用更为简洁的字符串来表示，如表2所示：

步骤204，针对所述样本数据集合中的任一样本数据，对所述任一样本数据进行划分以得到所述任一样本数据中各个单品的图像数据，所述任一样本数据包含的组合商品的图像数据被划分为组成所述组合商品的各个单品的图像数据。

Seq2Seq（Sequence to Sequence）模型可利用特征序列的全局信息，综合序列上下文，推断出与特征序列相对应的序列表述。其中，Seq2Seq模型可采用编解码网络，编解码网络可以学习特征序列中各个特征之间的关联关系，使得后续使用Seq2Seq模型时可有效识别存在关联的多个特征，从而将该多个特征作为一个整体。

而组合商品同样存在所包含的各个单品之间存在关联的特点。因此，对于样本数据集合中的任一样本数据（即每个样本数据执行相同的操作），可将该任一样本数据进行划分得到各个单品的图像数据。其中，对于被标注有单品类别信息的图像数据（说明所对应的单品可单独作为一个整体），则无需进一步划分；而对于被标注组合类别信息的图像数据（说明所对应的商品为组合商品），则将其划分为各个单品的图像数据。

基于对样本数据的划分，可将组合商品的识别问题作为sequence-to-sequence的任务，通过划分得到的图形数据来训练编解码网络中的编码器和解码器，从而确定编码器中的编码网络的函数映射关系（即函数的具体数值），以及解码器中的解码网络的函数映射关系，即学习到组合商品中各个单品之间的关联关系，对多个单品做自适应的合并匹配，将属于同一组合商品的单品对应的图像特征合并至相应的组合类别，而无法构成组合商品的单品则保留该单品的单品类别进行输出。

下面以识别菜品为例，结合图3对上述过程进行详细说明。请参见图3，图3是一示例性实施例提供的另一种商品识别模型的训练方法的流程图。如图3所示，该方法可以包括以下步骤：

在步骤302中，将菜品图像输入至多主体检测网络。

可拉取带有类别标签的菜品图像，并将菜品图像输入至多主体检测网络。主体也叫做显著性区域，是图像中最具视觉吸引力的对象。在菜品识别的应用场景下，菜品图像的背景复杂，菜品主体不够突出，导致最终的识别效果较差。对此，可结合主体检测算法检测出菜品主体的坐标位置，以便裁剪出对应主体的区域用于训练菜品识别模型，从而提升菜品识别模型的性能。

具体而言，可训练用于菜品主体检测的多主体检测网络。比如，采用U2-Net的分割网络，输入菜品图像，输出菜品的主体掩膜图像，区分主体区域和背景区域。其中，主体掩膜图像为与输入的菜品原图同样尺寸的二值化mask，白色区域为主体部分（显著区域），黑色区域为背景部分（非显著区域）。

在步骤304中，截取菜品图像的主体区域。

在利用训练好的多主体检测网络检测出菜品图像中主体的坐标位置后，裁剪出主体所在的显著区域。

在步骤306中，输入至二分类网络。

在步骤308中，获取菜品多主体区域的图像特征。

二分类网络可将输入的图像分为菜品和无关项两种类别，以从多主体（菜品）中剔除纸巾、餐盘、餐具、酱料包等无关项，并且可以得到多主体菜品区域的图像特征。

比如，可采用CNN（Convolutional Neural Networks，卷积神经网络），可选择ResNet18。当然，也可采用其他任意神经网络模型，比如VGG（Visual Geometry Group）、ResNet（Residual Neural Network）、DenseNet（Dense Convolutional Network）和GoogleNet等，本说明书并不对此进行限制。

在步骤310中，将菜品多主体区域的图像特征输入至编解码网络。

二分类网络的输出为多主体菜品区域的图像特征，将多个菜品区域的图像特征按照预设顺序（比如从左到右、从上到下等）排列，并在前后分别加入开始符和终止符以合成特征序列，输入到编解码网络(encoder-decoder network)中。编解码网络可选择transformer，采用attention注意力机制来搭建模型。当然，也可采用RNN（RecurrentNeural Network，循环神经网络）、LSTM（Long Short-Term Memory，长短期记忆网络）、BERT（Bidirectional Encoder Representations from Transformers）和GRU（GatedRecurrent Unit Recurrent Neural Networks）等，本说明书并不对此进行限制。

二分类网络也可仅用于筛选出无关项，对于多主体菜品区域的图像特征，可重新训练一个专门用于图像特征提取的模型，以提取出各个主体菜品区域的图像特征，以提高特征提取的准确率。

步骤206，将划分得到的图像数据分别作为编解码网络的编码器中各个时间步对应的编码网络的输入参数，并将所述任一样本数据中标注的单品类别信息和组合类别信息分别作为所述编解码网络的解码器中各个时间步对应的解码网络的输出参数，以对所述编解码网络进行训练得到商品识别模型。

编解码网络中的编码器和解码器存在时间步（Timesteps）的概念，编码器将输入序列转化成一个固定长度的特征向量C，解码器再将之前生成的特征向量C再转化成输出序列。其中，编码器的每个时间步对应一个解码网络；类似的，编码器的每个时间步对应一个解码网络。

作为一示例性实施例，可将编码器的时间步长（时间步的数量）设置为与划分上述步骤204中任一样本数据得到的单品数量相匹配，即除终止符对应的时间步以外，每个时间步与一个单品相对应，使得编码器能够生成一个表示该样本数据中所有商品的特征向量C，特征向量C包含了输入的样本数据的特征。比如，编码器的时间步长=单品数量+1。

类似的，可将解码器的时间步长设置为与上述步骤204中任一样本数据中标注的单品类别信息和组合类别信息的数量之和相匹配，即除终止符对应的时间步以外，每个时间步与一个类别信息相对应，从而对多个单品做自适应的合并匹配，将属于同一组合商品的单品对应的图像特征合并至相应的组合类别，而无法构成组合商品的单品则保留该单品的单品类别进行输出。当然，也可将解码器的时间步长设定为预设时间步长。比如，解码器的时间步长=类别数量之和+1。

除此之外，输入编码器的为特征序列，也即各个时间步之间存在时序的概念。为了匹配编码器的输入参数存在时序的特点，可对划分得到的图像数据进行排序。具体而言，正如上述图3示出的实施例，样本数据通过对相应的原始图像数据进行主体检测得到，那么可确定划分得到的各个图像数据对应的单品在原始图像数据中的位置信息，然后按照针对原始图像数据的预设方向和位置信息对划分得到的各个图像数据进行排序，从而将划分得到的图像数据按照排序依次作为编码器中各个时间步对应的编码网络的输入参数。下面结合图4对训练编解码网络得到商品识别模型的过程进行详细说明。

请参见图4，图4是一示例性实施例提供的一种编解码网络的示意图。如图4所示，编解码网络由一个编码器（Encoder）和一个解码器（Decoder）组成，图4中以编解码包含4个时间步，解码器包含3个时间步为例进行说明。编码器和解码器的内部基于神经网络，可以理解为包含多层网络，每一层网络都对输入做一次函数映射。编码器和解码器采用的网络结构可根据实际情况灵活选取，比如可采用RNN、LSTM、BERT、Transformer等，本说明书并不对此进行限制。

编码器负责接收划分得到的各个主体区域（对应各个单品）的图像特征X1~X3，当接收到终止符EOS时，生成对应本次输入的整个样本数据的特征向量C。

举例而言，样本数据共包含豆浆、油条和咖啡3个单品，豆浆和油条组成套餐“中式早餐”。引入注意力机制，在每个时间步输入主体区域的图像特征，将上一时间步的输出作为下一时间步的输入。具体而言，编码器在每个时间步接收一个图像特征，第一个时间步的编码器接收X1（对应于豆浆），经过编码器的函数映射生成一个向量输入到第二个时间步的编码器，同时第二个时间步接收X2（对应于油条），得到一个向量输入第三个时间步的编码器，同时第三个时间步的编码器接收X3（对应于咖啡），第四个时间步接收到X4（EOS终止符），生成一个可以表示图像特征序列信息的特征向量C。H0是编码器的初始状态输入，比如可采用全部为零的矩阵表示。

解码器Decoder将编码器生成的特征向量C作为自己的隐藏状态输入，并将开始符SOS作为初始输入以开始解码，并通过循环输出结果。具体而言，Y1表示X1和X2共同组成的组合类别“中式早餐”，Y2表示X3的单品类别“咖啡”，Y3表示终止符EOS。第一个时间步的解码器的输入是特征向量C和开始符SOS，第一个时间步的输出为Y1。Y1和C共同作为第二个时间步的解码器的输入，第二个时间步的输出为Y2。Y2和C共同作为第三个时间步的解码器的输入，第三个时间步的输出为Y3。

在训练编解码网络的过程中，可训练得到编码器和解码器中神经网络的函数参数，从而后续可利用训练得到的编解码网络来识别图像数据中包含的单品和套餐。

需要注意的是，可按照图像数据的预设方向来定义图像特征序列的顺序，比如从上到下、从左到右来对图像数据包含的各个单品进行排序，以得到各个单品对应的图像特征的顺序。当然，也可随机排列各个单品的图像特征，本说明书并不对此进行限制。

基于对编解码网络进行训练得到的商品识别模型，后续可利用该商品识别模型实时对用户在实体门店选取的商品进行识别，从而自动进行价格结算。

请参见图5，图5是一示例性实施例提供的一种商品结算方法的流程图。如图5所示，该方法应用于部署有商品识别模型的服务端中，可以包括以下步骤：

步骤502，接收实体门店的客户端上传的针对目标商品的待识别图像数据，所述目标商品包含至少一个单品和/或至少一个由多个单品组合得到的组合商品。

实体门店在出售商品时，可提供单品和组合商品供用户购买。其中，组合商品由多个指定的单品构成，即将该多个指定的单品进行绑定销售。对于组合商品中的多个单品，各个单品之间并非相互独立。而针对组合商品中的某一单品，存在实体门店也提供单独销售的情况。与此同时，实体门店可配置客户端，比如为自动收银设备，该自动收银设备设有摄像头，可采集用户选取的商品，从而对其进行类别识别（比如识别商品的名称），确定出各个商品的价格以对该用户本次购买的所有商品进行价格结算。

商品可能为多个单品（单品之间相互独立，不存在关联），也可能为由多个单品组合得到的组合商品（单品之间存在关联，共同组成组合商品）。因此，用户在选取商品时，所选取的目标商品中包含的单品可能为独立的商品（与所选取的商品中其他单品无法构成组合商品），也可能为组合商品的一部分（可与所选取的商品中其他单品构成组合商品）。

步骤504，对所述待识别图像数据进行划分得到所述目标商品包含的各个单品的图像数据，并将划分得到的各个单品的图像数据分别输入至商品识别模型；其中，所述商品识别模型的输出结果用于被按照相应的结算规则进行价格结算，结算规则包括对应于单品的第一结算规则和对应于组合商品的第二结算规则。

在本实施例中，在对待识别图像数据进行划分的过程中，可先对待识别图像数据进行主体检测得到目标商品的主体图像数据，然后再通过预设分类模型对主体图像数据进行分类以得到目标商品包含的各个单品的图像数据。其中，对于划分待识别图像数据得到各个单品的图像数据的过程，具体可参考上述图2-3示出的实施例中的相关记载，在此不再赘述。

由于单品的结算规则和组合商品的结算规则存在差异，对于用户选取的商品（可选取某一单品，也可选取组合商品），应识别其中的各个单品是否能够构成组合商品，从而准确计算价格。对于识别结果为单品的商品，按照对应于单品的第一结算规则进行结算，对于识别结果为组合商品的商品，按照对应于组合商品的第二结算规则进行结算。类似的，具体结算的过程可参考上述针对图1的举例，在此不再赘述。

进一步的，存在结算规则与目标商品的容器规格相关的情况。比如，对于同一类商品，存在“小杯、中杯、大杯”、“小碗、中碗、大碗”等不同容器规格，而不同容器规格对应的商品价格也随之不同。在该情况下，可根据待识别图像数据识别出目标商品的容器的容器规格，该容器规格用于被按照相应的结算规则进行结算。比如，参考上述图3所示实施例中的二分类网络，容器则属于菜品主体的无关项，为了识别出容器规格，可训练用于识别容器规格的分类网络以进一步对上述二分类网络识别出的无关项进一步识别。或者，可采用三分类网络，用于分别识别菜品主体、容器和其他无关项，以代替图3所示实施例中的二分类。或者，在识别出容器后，可根据容器在目标商品的主体图像中的面积占比来确定该容器的规格。以菜品为例，可以建立如表3所示的对应关系：

那么，可计算出容器的面积占比n，通过上述对应关系确定出相应的容器规格。当然，表3仅为一示例性举例，具体形式可根据实际需求灵活设定。

对应于上述服务端侧的实施例，本说明书还提供了实体门店的客户端侧的实施例，在服务端侧实施例中所涉及的描述同样可以适用于客户端侧的实施例，下文中不再对此进行赘述。

请参见图6，图6是一示例性实施例提供的另一种商品结算方法的流程图。如图6所示，该方法应用于实体门店的客户端，可以包括以下步骤：

步骤602，采集目标商品的待识别图像数据，所述目标商品包含至少一个单品和/或至少一个由多个单品组合得到的组合商品。

步骤604，向服务端上传所述待识别图像数据，以由所述服务端对所述待识别图像数据进行划分得到所述目标商品包含的各个单品的图像数据，并将划分得到的各个单品的图像数据分别输入至商品识别模型。

步骤606，展示针对所述目标商品的结算价格，所述结算价格通过将所述商品识别模型的输出结果按照相应的结算规则进行结算得到，结算规则包括对应于单品的第一结算规则和对应于组合商品的第二结算规则。

为了便于理解，下面结合图7对商品结算的过程进行详细描述。请参见图7，图7是一示例性实施例提供的一种菜品结算方法的交互图。如图7所示，该交互过程可以包括以下步骤：

步骤702，自动收银机采集用户选取的菜品图像。

在本实施例中，实体门店可配置自动收银机作为客户端，该自动收银机配置有摄像头，那么用户在选购商品后，可将选购的商品携带至自动收银机处以供自动收银机采集图像，从而完成自动结算的过程。

步骤704，自动收银机向服务端上传菜品图像。

步骤706，服务端通过菜品识别模型进行菜品识别。

步骤708，服务端按照结算规则计算菜品价格。

在本实施例中，服务端可配置上述训练得到的商品识别模型，并按照上述图3-4所示实施例的方式将图像数据输入至商品识别模型进行识别。

下面对编解码网络的输入和输出进行举例说明。其中，编解码网络的输入为图片中多个菜品主体区域的图像特征，输出为图片中菜品的类别，包括单品和套餐。

1）图像包含多个单品。

比如中式快餐的自选菜，用户点了番茄炒蛋、小炒肉和米饭。编码器的输入X1～X3分别是番茄炒蛋主体区域的图像特征、小炒肉主体区域的图像特征、米饭主体区域的图像特征。解码器的输出是图像的识别结果，Y1～Y3分别为番茄炒蛋、小炒肉和米饭，输出的长度为3。

2）图像包含一份套餐

承接于上述自选菜的举例，如果商家定义番茄炒蛋、小炒肉和米饭为定价15元的炒肉套餐，输入保持不变，解码器的输出为Y1，用于表示炒肉套餐，输出的长度为1。

3）图像同时包括套餐和单品

用户点了包含番茄炒蛋、小炒肉和米饭的炒肉套餐，又另外点了一份鸡爪和一瓶可乐。编码器的输入长度为5，X1～X5分别为番茄炒蛋主体区域的图像特征、小炒肉主体区域的图像特征、米饭主体区域的图像特征、鸡爪主体区域的图像特征和可乐主体区域的图像特征。解码器的输出长度为3，Y1~Y3分别表示炒肉套餐、鸡爪和可乐。

步骤710，服务端返回识别结果和相应的价格信息。

步骤712，自动收银机展示识别结果、价格信息和付款码。

在本实施例中，自动收银机可向用户展示收款码，或者由用户展示付款码以供自动收银机扫码，从而与支付平台进行交互完成支付过程。

在本说明书涉及的应用场景中，为了适用不同门店的商品信息，对于新开的门店或者门店新上架的商品，需要对每个商品类别拍摄大量图片整理成训练集以对商品识别模型进行迭代更新，并且需要为每家实体门店定制模型，从而保证识别的准确率。然而，针对每家门店定制商品识别模型，以及为模型进行迭代更新，将导致效率低下，成本太高。

对此，本说明提出一种基于预先训练得到的商品识别模型的商品识别方案，可避免上述针对每家门店定制商品识别模型，以及为模型进行迭代更新的问题，从而降低成本，提升效率。

请参见图8，图8是一示例性实施例提供的一种商品识别方法的流程图。如图8所示，该方法应用于服务端，可以包括以下步骤：

步骤802，获取商户的参考商品的参考图像数据，所述参考商品属于单品或者由多个单品组合得到的组合商品，单品的参考图像数据被标注有相应的单品类别信息，组合商品的参考图像数据被标注有相应的组合类别信息。

当新开一家门店或者门店新上架的商品时，为了快速实现上新，避免重新训练模型，采用注册和自学习机制。具体而言，对于新开的门店或者门店新推出的商品，由门店人员对每种商品（作为参考商品）拍摄若干张图片作为参考图像并标注相应的商品类别以上传至服务端，由服务端将这些图像通过上述图2-3所示实施例中的方式输入至预先训练好的商品识别模型中进行特征推理，得到相应的商品特征保存至标准商品库中。那么，标准商品库中保存有图像数据、图像特征和类别的映射关系。由于门店上架的商品总量较小，通过上述注册和自学习机制，可将特征推理得到的商品特征作为表征门店中各类商品的标准特征，后续将实时获取的用户所选取商品的商品特征与上述标准商品库中的标准特征进行匹配，然后将匹配命中的标准特征对应的类别作为识别结果即可。

步骤804，在所述参考商品属于单品的情况下，通过上述商品识别模型对所述参考图像数据进行特征推理得到所述参考商品的第一单品特征，并建立所述参考商品的参考图像数据被标注的单品类别信息与所述第一单品特征之间的映射关系；在所述参考商品属于组合商品的情况下，对所述参考图像数据进行划分得到所述参考商品中各个单品的图像数据，通过所述商品识别模型分别对划分得到的各个图像数据进行特征推理得到对应于各个单品的第二单品特征，将各个第二单品特征共同作为所述参考商品的组合商品特征，并建立所述参考商品的参考图像数据被标注的组合类别信息与所述组合商品特征之间的映射关系。

步骤806，在接收到目标商品的待识别图像数据的情况下，对所述待识别图像数据进行划分得到所述目标商品包含的单品的图像数据，通过所述商品识别模型分别对划分得到的各个图像数据进行特征推理得到对应于各个单品的第三单品特征，在建立的映射关系中查询与所述第三单品特征相匹配的目标特征，并将所述目标特征对应的类别信息作为针对所述目标商品的识别结果。

对于划分待识别图像数据得到各个单品的图像数据的过程，具体可参考上述图2-3示出的实施例中的相关记载，在此不再赘述。可通过计算相似度来确定出与第三单品特征相匹配的目标特征。比如，计算当前特征与第三单品特征之间的余弦距离、欧氏距离等等。当相似度超过预设阈值时，判定两特征相匹配。或者，将与标准商品库（保持上述建立的映射关系）中与第三单品特征之间相似度最高的特征作为目标特征。

在实际应用中，可建立包含门店所有单品的商品特征的第一标准商品库，以及建立包含门店所有组合商品的商品特征的第二标准商品库。其中，第二标准商品库保存的每个商品特征包括相应组合商品包含的所有单品的单品特征。那么，可将得到的所有第三单品特征共同作为一个整体，优先在第二标准商品库中查询是否有与之相匹配的商品特征，并将匹配命中的商品特征对应的组合商品的类别作为识别结果。若未查询到相匹配的商品特征，则再分别将每个第三单品特征与第一标准商品库中保存的商品特征（均为单品的图像特征）进行匹配，将匹配命中的商品特征对应的单品商品的类别作为识别结果。

对于特征推理的过程，在将图像数据输入编解码网络后，可采用解码器中神经网络的中间层计算出的向量数据作为特征推理的结果。由于采用了神经网络来进行训练，可充分利用神经网络的特征编码能力，使用神经网络的中间层（隐藏层）计算出的向量来作为输入数据的特征向量。比如，解码器的最后一层是用来输出识别结果的，前面的层都在执行特征提取的操作，而且层数越深，特征学习的更全面。因此，可选取解码器中神经网络的中间层中的最后一层（即倒数第二层：输出层的前一层）保存的输出特征作为表征参考商品中单品的第三单品特征。

请参见图9，图9是一示例性实施例提供的另一种商品识别方法的流程图。如图9所示，该方法应用于实体门店的客户端，可以包括以下步骤：

步骤902，向服务端上传参考商品的参考图像数据，所述参考商品属于单品或者由多个单品组合得到的组合商品，单品的参考图像数据被标注有相应的单品类别信息，组合商品的参考图像数据被标注有相应的组合类别信息。

在所述参考商品属于单品的情况下，所述参考图像数据被所述服务端通过上述商品识别模型进行特征推理得到所述参考商品的第一单品特征，并建立所述参考商品的参考图像数据被标注的单品类别信息与所述第一单品特征之间的映射关系；在所述参考商品属于组合商品的情况下，所述参考图像数据被所述服务端划分得到所述参考商品中各个单品的图像数据，通过所述商品识别模型分别对划分得到的各个图像数据进行特征推理得到对应于各个单品的第二单品特征，将各个第二单品特征共同作为所述参考商品的组合商品特征，并建立所述参考商品的参考图像数据被标注的组合类别信息与所述组合商品特征之间的映射关系。

步骤904，在采集到目标商品的待识别图像数据的情况下，向所述服务端发送所述待识别图像数据，以由所述服务端对所述待识别图像数据进行划分得到所述目标商品包含的单品的图像数据，通过所述商品识别模型分别对划分得到的各个图像数据进行特征推理得到对应于各个单品的第三单品特征，在建立的映射关系中查询与所述第三单品特征相匹配的目标特征，并将所述目标特征对应的类别信息作为针对所述目标商品的识别结果。

步骤906，接收所述服务端返回的所述识别结果。

与上述方法实施例相对应，本说明书还提供了相应的装置实施例。

图10是一示例性实施例提供的一种设备的示意结构图。请参考图10，在硬件层面，该设备包括处理器1002、内部总线1004、网络接口1006、内存1008以及非易失性存储器1010，当然还可能包括其他业务所需要的硬件。本说明书一个或多个实施例可以基于软件方式来实现，比如由处理器1002从非易失性存储器1010中读取对应的计算机程序到内存1008中然后运行。当然，除了软件实现方式之外，本说明书一个或多个实施例并不排除其他实现方式，比如逻辑器件抑或软硬件结合的方式等等，也就是说以下处理流程的执行主体并不限定于各个逻辑单元，也可以是硬件或逻辑器件。

请参考图11，商品识别模型的训练装置可以应用于如图7所示的设备中，以实现本说明书的技术方案。其中，该商品识别模型的训练装置可以包括：

获取单元1101，获取样本数据集合，所述样本数据集合中的各个样本数据包含至少一个单品和/或至少一个由多个单品组合得到的组合商品的图像数据；其中，单品的图像数据被标注有相应的单品类别信息，组合商品的图像数据被标注有相应的组合类别信息；

划分单元1102，针对所述样本数据集合中的任一样本数据，对所述任一样本数据进行划分以得到所述任一样本数据中各个单品的图像数据，所述任一样本数据包含的组合商品的图像数据被划分为组成所述组合商品的各个单品的图像数据；

训练单元1103，将划分得到的图像数据分别作为编解码网络的编码器中各个时间步对应的编码网络的输入参数，并将所述任一样本数据中标注的单品类别信息和组合类别信息分别作为所述编解码网络的解码器中各个时间步对应的解码网络的输出参数，以对所述编解码网络进行训练得到商品识别模型。

可选的，所述编码器的时间步长与划分所述任一样本数据得到的单品数量相匹配。

可选的，所述解码器的时间步长与所述任一样本数据中标注的单品类别信息和组合类别信息的数量之和相匹配；

或者，所述解码器的时间步长为预设时间步长。

可选的，所述任一样本数据通过对相应的原始图像数据进行主体检测得到；

所述划分单元1102还用于：确定划分得到的各个图像数据对应的单品在所述原始图像数据中的位置信息，按照针对所述原始图像数据的预设方向和所述位置信息对划分得到的各个图像数据进行排序；

将划分得到的图像数据按照排序依次作为所述编码器中各个时间步对应的编码网络的输入参数。

请参考图12，一种商品识别装置可以应用于如图7所示的设备中，以实现本说明书的技术方案。其中，该商品识别装置应用于服务端，可以包括：

获取单元1201，获取商户的参考商品的参考图像数据，所述参考商品属于单品或者由多个单品组合得到的组合商品，单品的参考图像数据被标注有相应的单品类别信息，组合商品的参考图像数据被标注有相应的组合类别信息；

特征提取单元1202，在所述参考商品属于单品的情况下，通过上述实施例中任一项方法中的商品识别模型对所述参考图像数据进行特征推理得到所述参考商品的第一单品特征，并建立所述参考商品的参考图像数据被标注的单品类别信息与所述第一单品特征之间的映射关系；在所述参考商品属于组合商品的情况下，对所述参考图像数据进行划分得到所述参考商品中各个单品的图像数据，通过所述商品识别模型分别对划分得到的各个图像数据进行特征推理得到对应于各个单品的第二单品特征，将各个第二单品特征共同作为所述参考商品的组合商品特征，并建立所述参考商品的参考图像数据被标注的组合类别信息与所述组合商品特征之间的映射关系；

识别单元1203，在接收到目标商品的待识别图像数据的情况下，对所述待识别图像数据进行划分得到所述目标商品包含的单品的图像数据，通过所述商品识别模型分别对划分得到的各个图像数据进行特征推理得到对应于各个单品的第三单品特征，在建立的映射关系中查询与所述第三单品特征相匹配的目标特征，并将所述目标特征对应的类别信息作为针对所述目标商品的识别结果。

请参考图13，另一种商品识别装置可以应用于如图7所示的设备中，以实现本说明书的技术方案。其中，该商品识别装置应用于实体门店的客户端，可以包括：

注册单元1301，向服务端上传参考商品的参考图像数据，所述参考商品属于单品或者由多个单品组合得到的组合商品，单品的参考图像数据被标注有相应的单品类别信息，组合商品的参考图像数据被标注有相应的组合类别信息；在所述参考商品属于单品的情况下，所述参考图像数据被所述服务端通过上述实施例中任一项方法中的商品识别模型进行特征推理得到所述参考商品的第一单品特征，并建立所述参考商品的参考图像数据被标注的单品类别信息与所述第一单品特征之间的映射关系；在所述参考商品属于组合商品的情况下，所述参考图像数据被所述服务端划分得到所述参考商品中各个单品的图像数据，通过所述商品识别模型分别对划分得到的各个图像数据进行特征推理得到对应于各个单品的第二单品特征，将各个第二单品特征共同作为所述参考商品的组合商品特征，并建立所述参考商品的参考图像数据被标注的组合类别信息与所述组合商品特征之间的映射关系；

发送单元1302，在采集到目标商品的待识别图像数据的情况下，向所述服务端发送所述待识别图像数据，以由所述服务端对所述待识别图像数据进行划分得到所述目标商品包含的单品的图像数据，通过所述商品识别模型分别对划分得到的各个图像数据进行特征推理得到对应于各个单品的第三单品特征，在建立的映射关系中查询与所述第三单品特征相匹配的目标特征，并将所述目标特征对应的类别信息作为针对所述目标商品的识别结果；

接收单元1303，接收所述服务端返回的所述识别结果。

请参考图14，一种商品结算装置可以应用于如图7所示的设备中，以实现本说明书的技术方案。其中，该商品结算装置应用于服务端，可以包括：

接收单元1401，接收实体门店的客户端上传的针对目标商品的待识别图像数据，所述目标商品包含至少一个单品和/或至少一个由多个单品组合得到的组合商品；

识别单元1402，对所述待识别图像数据进行划分得到所述目标商品包含的各个单品的图像数据，并将划分得到的各个单品的图像数据分别输入至上述实施例中任一项方法中的商品识别模型；其中，所述商品识别模型的输出结果用于被按照相应的结算规则进行价格结算，结算规则包括对应于单品的第一结算规则和对应于组合商品的第二结算规则。

可选的，所述识别单元1402具体用于：

对所述待识别图像数据进行主体检测得到所述目标商品的主体图像数据；

通过预设分类模型对所述主体图像数据进行分类以得到所述目标商品包含的各个单品的图像数据。

可选的，结算规则与所述目标商品的容器规格相关；所述识别单元1402还用于：

根据所述待识别图像数据识别出所述目标商品的容器的容器规格，所述容器规格用于被按照相应的结算规则进行结算。

请参考图15，另一种商品结算装置可以应用于如图7所示的设备中，以实现本说明书的技术方案。其中，该商品结算装置应用于实体门店的客户端，可以包括：

采集单元1501，采集目标商品的待识别图像数据，所述目标商品包含至少一个单品和/或至少一个由多个单品组合得到的组合商品；

上传单元1502，向服务端上传所述待识别图像数据，以由所述服务端对所述待识别图像数据进行划分得到所述目标商品包含的各个单品的图像数据，并将划分得到的各个单品的图像数据分别输入至上述实施例中任一项方法中的商品识别模型；

展示单元1503，展示针对所述目标商品的结算价格，所述结算价格通过将所述商品识别模型的输出结果按照相应的结算规则进行结算得到，结算规则包括对应于单品的第一结算规则和对应于组合商品的第二结算规则。

上述实施例阐明的系统、装置、模块或单元，具体可以由计算机芯片或实体实现，或者由具有某种功能的产品来实现。一种典型的实现设备为计算机，计算机的具体形式可以是个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件收发设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任意几种设备的组合。

在一个典型的配置中，计算机包括一个或多个处理器 (CPU)、输入/输出接口、网络接口和内存。内存可能包括计算机可读介质中的非永久性存储器，随机存取存储器(RAM) 和/或非易失性内存等形式，如只读存储器 (ROM) 或闪存(flash RAM)。内存是计算机可读介质的示例。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括，但不限于相变内存 (PRAM)、静态随机存取存储器 (SRAM)、动态随机存取存储器 (DRAM)、其他类型的随机存取存储器 (RAM)、只读存储器 (ROM)、电可擦除可编程只读存储器 (EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘 (DVD) 或其他光学存储、磁盒式磁带、磁盘存储、量子存储器、基于石墨烯的存储介质或其他磁性存储设备或任何其他非传输介质，可用于存储可以被计算设备访问的信息。按照本文中的界定，计算机可读介质不包括暂存电脑可读媒体(transitory media)，如调制的数据信号和载波。

还需要说明的是，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。

上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下，在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外，在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中，多任务处理和并行处理也是可以的或者可能是有利的。

在本说明书一个或多个实施例使用的术语是仅仅出于描述特定实施例的目的，而非旨在限制本说明书一个或多个实施例。在本说明书一个或多个实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式，除非上下文清楚地表示其他含义。还应当理解，本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。

应当理解，尽管在本说明书一个或多个实施例可能采用术语第一、第二、第三等来描述各种信息，但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如，在不脱离本说明书一个或多个实施例范围的情况下，第一信息也可以被称为第二信息，类似地，第二信息也可以被称为第一信息。取决于语境，如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。

以上所述仅为本说明书一个或多个实施例的较佳实施例而已，并不用以限制本说明书一个或多个实施例，凡在本说明书一个或多个实施例的精神和原则之内，所做的任何修改、等同替换、改进等，均应包含在本说明书一个或多个实施例保护的范围之内。

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
专利发明人：张培尧;邵蔚元;王强;刘树春;张飞云;
专利申请人：浙江口碑网络技术有限公司;口碑(上海)信息技术有限公司;

上一篇：一种基于用户体验量化指标的智能网络调度方法及系统
下一篇：缓存内存块的淘汰方法、装置及电子设备