掌桥专利:专业的专利平台
掌桥专利
首页

技术领域

本发明涉及人工智能领域,更具体的说是一种基于AI的智能设计系统。

背景技术

AIGC是指利用人工智能技术生成内容,近年来,AIGC得到了快速发展,尤其是线上的文创产业得到了广泛应用,通过先进的算法,AI能够创作出文字、图像、音频、视频等多种形式的内容,并能够根据用户需求进行个性化定制。

现有技术的文创品制作,都是通过用户进行目前的文创商品大多是通过手工制作的方式来实现的,手工制作的生产效率相对较低,制作过程也比较繁琐,成本较高,难以满足市场快速变化的需求,普通用户不具备一定的文化底蕴和创意,创新性有限。

发明内容

本发明的目的是克服以上的技术缺陷,提供一种基于AI的智能设计系统。本发明。

为解决上述技术问题,本发明提供的技术方案为:一种基于AI的智能设计系统,包括图像输入模块、文字识别模块、文字解析模块、多模态融合模块、AR图片生成模块、图片输出模块、用户交互模块以及数据存储和管理模块。

进一步的,所述的图像输入模块负责接收和处理用户输入的图像,处理各种格式的图像转化为适合后续处理的标准格式。

进一步的,所述的文字识别模块利用先进的深度学习算法和模型,对输入的图像进行文字识别,所述的文字识别模块可以识别图像中的文字,并将其转化为计算机可以处理的文本信息。

进一步的,所述的文字解析模块对识别出的文字进行语义解析和处理,提取关键信息和特征,所述的文字解析模块为后续的图片生成提供基础。

进一步的,所述的图片生成模块根据解析模块提取的文字信息和特征,将使用生成对抗网络(GAN)或其他深度学习生成模型,生成与文字描述相符的图片,所述的图片生成模块根可以根据需要调整生成的图片的各种参数,如颜色、形状、大小等。

进一步的,所述的多模态融合模块将文字信息和图像信息进行融合,确保生成的图片不仅在视觉上,而且在语义上与原始文字保持一致。

进一步的,所述的图片输出模块将生成的图片将通过图片输出模块展示给用户,用户可以选择保存图片,或者将其分享到其他平台。

进一步的,所述的用户交互模块通过上传图片,调整参数,并查看生成的图片,使用户可以上传图片,调整参数,并查看生成的图片。

进一步的,所述的数据存储和管理模块用于存储和管理用户数据、模型参数、训练数据等。

本发明与现有技术相比的优点在于:本发明通过图像输入模块收集用户的需求和喜好,自动生成独特的图像内容,通过文字解析模块不断优化和改进生成的文创品,以满足用户更加个性化、多样化的需求,通过多模态融合模块将文字信息和图像相融合,不断优化和改进生成的内容,以满足用户更加个性化、多样化的需求,为用户提供更加良好的制作体验和成就感。

附图说明

图1是本发明提出的一种基于AI的智能设计系统的结构图。

图2是本发明提出的一种基于AI的智能设计系统的文字识别流程图。

图3是本发明提出的一种基于AI的智能设计系统的图像识别流程图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。

在本发明实施例的描述中,需要说明的是,若出现术语“中心”、“上”、“下”、“左”、“右”、“竖直”、“水平”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,或者是该发明产品使用时惯常摆放的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。

此外,若出现术语“水平”、“竖直”、“悬垂”等术语并不表示要求部件绝对水平或悬垂,而是可以稍微倾斜。如“水平”仅仅是指其方向相对“竖直”而言更加水平,并不是表示该结构一定要完全水平,而是可以稍微倾斜。

在本发明实施例的描述中,“多个”代表至少2个。

在本发明实施例的描述中,还需要说明的是,除非另有明确的规定和限定,若出现术语“设置”、“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。

下面结合附图对本发明做进一步的详细说明。

如图1-2所示,一种基于AI的智能设计系统,包括图像输入模块、文字识别模块、文字解析模块、多模态融合模块、AR图片生成模块、图片输出模块、用户交互模块以及数据存储和管理模块。

参考图1,图像输入模块负责接收和处理用户输入的图像,处理各种格式的图像转化为适合后续处理的标准格式,文字识别模块利用先进的深度学习算法和模型,对输入的图像进行文字识别,文字识别模块可以识别图像中的文字,并将其转化为计算机可以处理的文本信息,文字解析模块对识别出的文字进行语义解析和处理,提取关键信息和特征,文字解析模块为后续的图片生成提供基础,图片生成模块根据解析模块提取的文字信息和特征,将使用生成对抗网络(GAN)或其他深度学习生成模型,生成与文字描述相符的图片。

其中,图片生成模块根可以根据需要调整生成的图片的各种参数,如颜色、形状、大小等,多模态融合模块将文字信息和图像信息进行融合,确保生成的图片不仅在视觉上,而且在语义上与原始文字保持一致,图片输出模块将生成的图片将通过图片输出模块展示给用户,用户可以选择保存图片,或者将其分享到其他平台,用户交互模块通过上传图片,调整参数,并查看生成的图片,使用户可以上传图片,调整参数,并查看生成的图片,数据存储和管理模块用于存储和管理用户数据、模型参数、训练数据等。

本发明在具体实施时,用户首先使用纸和笔在纸张上进行简笔画创作或者输入文字诗词灯,通过设计拍摄进行上传,图像输入模块处理用户输入的图像,并将其转化成后续处理的标准格式,通过文字识别模块识别文字及图像,将其转化成可处理的文本信息,通过手机扫码进入到编辑界面,在此界面,首先需要完成鉴权操作以确认用户身份,并根据需要完成付费流程,使用手机扫描与该系统关联的二维码,进入到用户交互模块的编辑界面输入个性化提示词,改变调整画作,在编辑界面中,用户可以输入个性化的提示词或描述,这些提示词通过文字解析模块进行语义解析和处理,提取关键信息和特征,将用于指导AI模型,帮助调整和优化简笔画作品,基于AIGC技术,图片生成模块根据提取的文字信息及特征,通过多模态融合模块将文字信息和图像信息进行融合转化为图片。此外,还可以使用Runway等先进技术,将静态图片转化为动态视频,通过图片输出模块将生成的图片展示给用户,用户可以对生成的图片或视频中的物品进行标定,用户可以通过手机扫描二维码查看生成图片AR效果,生成图片的参数储存在数据存储和管理模块进行保存,以便修改数据。

以上对本发明及其实施方式进行了描述,这种描述没有限制性,附图中所示的也只是本发明的实施方式之一,实际的结构并不局限于此。总而言之如果本领域的普通技术人员受其启示,在不脱离本发明创造宗旨的情况下,不经创造性的设计出与该技术方案相似的结构方式及实施例,均应属于本发明的保护范围。

相关技术
  • 无创超声处理细胞在制备外泌体中的应用、外泌体及其制备方法和应用
  • Mal-PEG6-NHS-ester在外泌体示踪修饰中的应用和外泌体修饰的方法
  • Mal-PEG6-NHS-ester在外泌体示踪修饰中的应用和外泌体修饰的方法
技术分类

06120116559990