掌桥专利:专业的专利平台
掌桥专利
首页

信息提供装置、信息提供方法以及程序

文献发布时间:2024-04-18 19:52:40


信息提供装置、信息提供方法以及程序

技术领域

本公开涉及提供与材料有关的信息的信息提供装置等。

背景技术

以往,提出了提供与论文等文献中记载的材料或者实验有关的信息的信息提供装置(例如,参照专利文献1~3)。在专利文献1中作为信息提供装置而提出的数值检索装置提取多个文献各自所记载的材料的数值数据,计算这些数值数据之间的相似度。在专利文献2中作为信息提供装置而提出的辅助装置提取与论文中记载的合成工艺有关的信息,提供表示从起始材料到目标材料的合成工艺的信息。在专利文献3中作为信息提供装置而提出的可靠性评价系统评价与实验有关的文献的可靠性。也即是说,可靠性评价系统根据实验方法等关键字的输入来检索文献,基于保持所检索到的文献的投稿目的地杂志的有用度的杂志有用度列表、和所输入的关键字的出现频率,计算对该文献的可靠度。

现有技术文献

专利文献1:日本特开2020-80087号公报

专利文献2:国际公开第2021/039175号

专利文献3:日本特开2008-152701号公报

发明内容

然而,上述各专利文献的信息提供装置需要用于适当地提供与材料有关的信息的进一步改善。

于是,本公开提供能够实现用于适当地提供与材料有关的信息的进一步改善的信息提供装置等。

本公开的一个技术方案涉及的信息提供装置具备:提取部,其从至少一个文献信息提取用于识别多个材料中的每一个的识别信息和所述多个材料中的每一个的特性值;导出部,其基于有关材料与其他一个以上的材料之间的特性值的相似度,导出有关材料的特性值的可靠度;以及图像处理部,其生成将所述多个材料中的每一个的所述特性值(i)以与针对有关材料的特性值而导出的所述可靠度相应的显示方式表示、且(ii)与有关材料的所述识别信息相关联而表示的第1图像,并将所述第1图像向显示部输出。

此外,该总括性的或者具体的技术方案既可以通过系统、方法、集成电路、或者计算机程序、计算机可读取的记录介质来实现,也可以通过装置、系统、方法、集成电路、计算机程序以及计算机可读取的记录介质的任意组合来实现。记录介质例如包括CD-ROM(Compact Disc-Read Only Memory)等非易失性的记录介质。

本公开的信息提供装置能够实现用于适当地提供与材料有关的信息的进一步改善。

附图说明

图1是表示实施方式1中的信息提供系统的构成例的框图。

图2A是表示实施方式1中的由图像处理部显示于显示部的显示画面的一例的图。

图2B是表示实施方式1中的由图像处理部显示于显示部的显示画面的另一例的图。

图3是表示实施方式1中的元数据的一例的图。

图4是表示实施方式1中的原文(本文)数据的一例的图。

图5是表示实施方式1中的从原文数据的语句中提取出的材料名以及特性值的一例的图。

图6A是表示实施方式1中的原文数据内的作为提取对象的图的一例的图。

图6B是表示实施方式1中的从提取对象的图中提取出的特性值的一例的图。

图7A是表示实施方式1中的由提取部作为提取对象的图的一例的图。

图7B是表示实施方式1中的由提取部从提取对象中排除的图的一例的图。

图8A是表示实施方式1中的原文数据内的作为提取对象的表的一例的图。

图8B是表示实施方式1中的从提取对象的表中提取出的特性值的一例的图。

图9是表示实施方式1中的材料名的正规化处理的一例的图。

图10是实施方式1中的材料的特性值的变换处理的一例。

图11是表示实施方式1中的更新后的提取信息表的一例的图。

图12是表示实施方式1中的包含更新后的提取信息表的显示画面的一例的图。

图13是表示实施方式1中的包含特性值图表(graph)的图表显示画面的一例的图。

图14是表示实施方式1中的表示可靠度的图表显示画面的一例的图。

图15A是表示实施方式1中的表示可靠度的图表显示画面的另一例的图。

图15B是表示实施方式1中的变更了偏差(bias)后的图表显示画面的一例的图。

图15C是表示实施方式1中的变更了偏差后的图表显示画面的另一例的图。

图16是表示实施方式1中的信息提供装置的整体处理动作的一例的流程图。

图17是表示实施方式1中的由提取部进行的处理的一例的流程图。

图18A是表示实施方式1的变形例中的信息提供系统的构成例的框图。

图18B是表示实施方式1的变形例中的信息提供系统的构成的另一例的框图。

图19是表示实施方式2中的资料显示画面的一例的图。

图20是表示实施方式2中的资料显示画面的另一例的图。

图21是表示实施方式2中的显示有编辑资料的资料显示画面的一例的图。

图22是表示实施方式2中的显示有编辑资料的资料显示画面的另一例的图。

图23是表示实施方式2中的显示有编辑资料的资料显示画面的另一例的图。

图24是表示实施方式2中的信息提供装置的整体处理动作的一例的流程图。

具体实施方式

(得到本公开的见解)

为了合成新材料,需要从庞大的材料数据中找出具有适当的特性的材料。可是,从庞大的材料数据中发现最佳的材料需要很多时间和费用,即使是经验丰富的研究人员,要发现新材料也并不容易。因此,在进行利用计算机的材料探索(搜索)。也即是说,从论文或专利等文献中大量提取与材料合成有关的信息,将提取出的信息积存于数据库,从所积存的信息获得与材料开发有关的见解。例如,如上述专利文献1~3那样进行相似度的计算、表示合成工艺的信息的提供、对于文献的可靠性的评价等。

然而,在上述专利文献1~3的信息提供装置中,虽然可提供各种信息,但是存在难以知晓文献中记载的材料的特性值是否可信这一问题。例如,优异数据(champion data)即使作为材料的特性值而示出最高的值,其可靠性(即再现性)低的情况也很多。

于是,本发明的发明人发现了从文献中提取多个材料中的每一个的特性值,基于这些提取出的特性值的相似度,导出这些特性值的可靠度,并以与这些可靠度相应的显示方式显示多个特性值,从而想到了本公开。

即,本公开的一个技术方案涉及的信息提供装置具备:提取部,其从至少一个文献信息提取用于识别多个材料中的每一个的识别信息和所述多个材料中的每一个的特性值;导出部,其基于有关材料与其他一个以上的材料之间的特性值的相似度,导出有关材料的特性值的可靠度;以及图像处理部,其生成将所述多个材料中的每一个的所述特性值(i)以与针对有关材料的特性值而导出的所述可靠度相应的显示方式表示、且(ii)与有关材料的所述识别信息相关联而表示的第1图像,并将所述第1图像向显示部输出。例如,识别信息是材料的名称、即材料名,材料名也可以是组成式。多个材料可以是同一材料,也可以是互不相同的材料,还可以是具有共同的用途或者元素种类等的材料。在具体例子中,多个材料是电池的正极或者负极所使用的材料。例如,相似度越低,则导出越低的可靠度,相似度越高,则导出越高的可靠度。

由此,在所显示的第1图像中,多个材料中的每一个的特性值以与该特性值的可靠度相应的显示方式显示,且该特性值关联有材料的识别信息。因此,材料研究人员等用户通过观察该第1图像,能够从该第1图像容易地掌握例如存储于数据库的庞大数量的文献信息所记述的材料的特性值的可靠性。例如,如果材料的特性值与其他很多材料相似,则用户能够容易地掌握该材料的特性值是可信赖的。

所述提取部也可以提取多个类别特性值作为所述特性值。例如,多个类别特性值是材料的电传导度(电导率)以及活化能值。

由此,能够容易地掌握材料具有的多个类别特性值的可靠性。

所述多个类别特性值也可以包括第1类别特性值和第2类别特性值,所述图像处理部也可以将由用于表示所述第1类别特性值的第1坐标轴、和用于表示所述第2类别特性值的第2坐标轴构成的特性映射设定于所述第1图像,将与所述多个材料中的每一个对应的标记(mark)以与针对有关材料的特性值而导出的所述可靠度相应的显示方式重叠在所述特性映射上的与有关材料的所述第1类别特性值和所述第2类别特性值对应的位置上。例如,特性映射是将电传导度和活化能值分别表示于第1坐标轴和第2坐标轴的特性值图表。而且,与各材料对应的标记在与该材料的电传导度和活化能值对应的特性值图表上的位置上以与这些类别特性值的可靠度相应的显示方式而被配置。

由此,能够整体更容易地掌握各材料具有的多个类别特性值的可靠度。

所述导出部也可以基于与所述材料对应的所述标记、和与所述其他一个以上的材料中的每一个对应的所述标记之间的距离,确定所述材料中的所述特性值的相似度。例如,这些距离的平均值越短,则确定越大的值作为相似度。也即是说,多个标记的密集程度越高,则针对该标记所示的特性值确定越高的相似度,相反,多个标记的密集程度越低,则针对该标记所示的特性值确定越低的相似度。

由此,针对材料的多个类别特性值,能够适当地确定一个相似度,其结果,能够适当地导出基于相似度的可靠度。

所述图像处理部也可以决定针对所述材料的特性值而导出的所述可靠度越高则越浓的颜色的浓度作为所述特性值的所述显示方式,生成以所决定的所述颜色的浓度表示所述特性值的所述第1图像。

由此,能够让用户在视觉上容易地掌握特性值的可靠度。此外,在以所决定的颜色的浓度表示特性值的第1图像中,既可以是该特性值的数值本身以所决定的颜色的浓度显示,也可以是表示该特性值的标记以所决定的颜色的浓度显示。

所述提取部也可以还针对所述多个材料中的每一个,从所述至少一个文献信息提取表示有关材料的属性的属性信息,所述导出部也可以基于所述材料中的所述特性值的相似度、和针对所述材料而提取出的所述属性信息,导出所述材料中的所述特性值的可靠度。例如,所述导出部也可以通过所述材料中的所述特性值的相似度、和基于针对所述材料而提取出的所述属性信息的属性值的加权加法运算,导出所述材料中的所述特性值的可靠度。

由此,由于基于特性值的相似度、材料的属性,导出该特性值的可靠度,因此能够多方面地导出可靠度,能够提高该可靠度的准确度。通过将相似度和属性各自的权重作为偏差进行调整,能够导出与用户的目的相应的可靠度。

所述属性信息也可以表示所述至少一个文献信息中的、记载有与所述属性信息对应的所述材料的识别信息和特性值的文献信息的出版时期作为所述属性,所述导出部也可以使用表示所述出版时期的新颖性的所述属性值导出所述特性值的可靠度。例如也可以,所述出版时期越新,所述属性值则表示越大的值,所述材料中的所述特性值的相似度越高、且与所述材料对应的所述属性值越大,所述导出部则导出越大的值作为所述材料中的所述特性值的可靠度。例如,出版时期是出版年月日。

由此,针对新的文献信息中记述的特性值,能够导出比较高的可靠度。因此,能够对注重出版时期的用户导出适当的可靠度。

所述属性信息也可以表示所述至少一个文献信息中的、记载有与所述属性信息对应的所述材料的识别信息和特性值的文献信息的被引用数作为所述属性,所述导出部也可以使用与所述被引用数相应的所述属性值导出所述特性值的可靠度。例如也可以,所述被引用数越多,所述属性值则表示越大的值,所述材料中的所述特性值的相似度越高、且与所述材料对应的所述属性值越大,所述导出部则导出越大的值作为所述材料中的所述特性值的可靠度。

由此,针对被引用数多的文献信息中记述的特性值,能够导出比较高的可靠度。因此,能够对注重被引用数的用户导出适当的可靠度。

所述属性信息也可以表示所述至少一个文献信息中的、记载有与所述属性信息对应的所述材料的识别信息和特性值的文献信息的作者作为所述属性,所述导出部也可以使用与所述文献信息的作者和其他一个以上的文献信息的各个作者是否相同相应的所述属性值导出所述特性值的可靠度。例如也可以,所述其他一个以上的文献信息的作者中的、与所述文献信息的作者不同的作者的数量越多,所述属性值则表示越大的值,所述材料中的所述特性值的相似度越高、且与所述材料对应的所述属性值越大,所述导出部则导出越大的值作为所述材料中的所述特性值的可靠度。

由此,针对与其他很多文献信息不同的作者著作的文献信息中记述的特性值,能够导出比较高的可靠度。也即是说,如果互不相同的作者著作的很多文献信息中记述的特性值相似,那么针对这些特性值,导出高的可靠度。另一方面,即使在很多文献信息中记述有彼此相似的特性值,如果这些文献信息由相同的作者所著,那么针对这些特性值,也导出低的可靠度。因此,能够对注重文献信息的作者的同一性的用户导出适当的可靠度。

所述属性信息也可以表示与所述属性信息对应的所述材料的合成方法作为所述属性,所述导出部也可以使用与所述材料的合成方法和所述其他一个以上的材料的各个合成方法的相似程度相应的所述属性值导出所述特性值的可靠度。例如也可以,所述材料的合成方法和所述其他一个以上的材料的各个合成方法的相似程度越大,所述属性值则表示越大的值,所述材料中的所述特性值的相似度越高、且与所述材料对应的所述属性值越大,所述导出部则导出越大的值作为所述材料中的所述特性值的可靠度。例如,所述材料的合成方法也可以包括合成所述材料所使用的温度条件、时间条件和装置的种类中的至少一个。

由此,如果在文献信息中记述有该特性值的材料利用与其他文献信息同样的合成方法而合成,那么针对该特性值,能够导出比较高的可靠度。因此,能够对注重合成方法的用户导出适当的可靠度。

所述提取部也可以还取得材料条件,对于符合所述材料条件的一个以上的材料中的每一个,从所述至少一个文献信息提取关于有关材料的信息作为显示信息候选,所述图像处理部也可以进而取得材料的多种属性中的每一种的权重,从由所述提取部提取出的多个所述显示信息候选中选择一个以上的与具有被导出了阈值以上的所述可靠度的特性值的材料对应的显示信息候选并分别作为显示信息,生成将一个以上的所述显示信息中的、与所述多种属性中的每一种对应的显示信息仅表示与所述多种属性中的每一种的权重相应的分量的第2图像,并将所述第2图像向显示部输出。

由此,通过调节多种属性中的每一种的权重即偏差,能够变更第2图像所表示的、与多种属性中的每一种对应的显示信息的分量。因此,用户能够按各属性任意地调整显示信息的分量,以使得多显示与用户感兴趣的属性有关的显示信息,少显示与用户不感兴趣的属性有关的显示信息。再者,这些所显示的显示信息是与可靠度为阈值以上的材料有关的信息,因此,用户能够放心地将这些显示信息用于材料研究等工作。显示符合材料条件的材料的显示信息,该材料条件例如是与材料所包含的元素种类或者材料的组成有关的条件。由此,能够将所显示的一个以上的显示信息限定于用户感兴趣的材料。

以下,参照附图,对本公开的实施方式进行说明。以下说明的实施方式均表示本公开的一个具体例子。因此,以下的实施方式中表示的数值、形状、材料、构成要素、构成要素的配置位置和连接形态等仅为一例,并非旨在限定本公开。由此,对于以下的实施方式中的构成要素中的、没有记载在表示最上位概念的独立权利要求中的构成要素,作为任意的构成要素来说明。

此外,各图是示意图,不一定是严格图示出的图。在各图中,对于实质上相同的构成附加同一标号,并省略或简化重复的说明。

(实施方式1)

[装置构成]

图1是表示实施方式1中的信息提供系统的构成例的框图。本实施方式中的信息提供系统1000是提供与材料有关的信息的系统,如图1所示,具备信息提供装置100、输入部11、文献数据库(DB)12以及显示部13。

输入部11受理用户的输入操作,将与该输入操作相应的输入信号向信息提供装置100输出。此外,输入部11例如构成为键盘、触控传感器、触摸板或者鼠标等。通过使用该输入部11,能够实现更直观的输入操作。

显示部13从信息提供装置100取得图像信号,显示与该图像信号相应的图像。显示部13例如是液晶显示器、等离子显示器、有机EL(Electro-Luminescence,电致发光)显示器等,但不限定于这些。

文献数据库12例如是硬盘等记录介质,存储有多个文献信息D。多个文献信息D各自是文献的电子数据。文献例如是与材料、材料合成、该材料合成的实验等有关的论文等。这些文献信息D包含原文数据D1和元数据D2。原文数据D1例如是作为网络期刊(也被称为电子期刊)所发行的PDF或者XML形式的电子化的论文。元数据D2是与在原文数据D1中所表示的图、表、图像、作者、研究机构、论文出版年月日、标题等有关的数据。这种元数据D2附属于原文数据D1。此外,在本实施方式中,元数据D2附属于原文数据D1,但也可以不附属于原文数据D1。信息提供装置100在元数据D2不附属于原文数据D1的情况下,也可以从服务器等下载与该原文数据D1对应的文献的出版社所提供的该元数据D2,并使其附属于该原文数据D1。

这种文献数据库12既可以经由互联网等通信网络连接于信息提供装置100,也可以不经由通信网络而直接连接于信息提供装置100。此外,文献数据库12也可以是硬盘以外的记录介质、例如RAM(Random Access Memory)、ROM(Read Only Memory)或者半导体存储器等。文献数据库12可以是易失性的也可以是非易失性的。

信息提供装置100基于从输入部11输出的输入信号,并基于存储于文献数据库12的多个文献信息D,提供与材料有关的信息。也即是说,信息提供装置100将与材料有关的信息显示于显示部13。具体而言,信息提供装置100取得来自输入部11的输入信号,从文献数据库12中检索与该输入信号相应的至少一个文献信息D。而且,信息提供装置100从该检索出的至少一个文献信息D中提取多个信息,生成基于这些多个信息的图像,将表示该图像的图像信号向显示部13输出。此外,信息提供装置100例如也可以由中央运算处理装置(CPU)等处理器和存储器构成。在该情况下,处理器通过执行例如存储于存储器的计算机程序而作为信息提供装置100发挥功能。

具体而言,如图1所示,信息提供装置100具备提取部101、第1信息处理部102、第2信息处理部103、第3信息处理部104、导出部105以及图像处理部106。

提取部101取得从输入部11输出的输入信号,从文献数据库12中检索与该输入信号相应的至少一个文献信息D。再者,提取部101从这些文献信息D中提取表示材料的名称的第1信息、表示材料的特性值的第2信息和表示材料的属性的第3信息。此外,材料的名称在以下也被称为材料名,是用于识别材料的识别信息。在文献信息D对于材料合成进行了记述的情况下,与第1信息、第2信息和第3信息对应的材料是通过该材料合成最终生成的材料,也被称为最终材料或者目标材料。而且,提取部101将第1信息向第1信息处理部102输出,将第2信息向第2信息处理部103输出,将第3信息向第3信息处理部104输出。

第1信息处理部102进行利用预先确定的方法修正由第1信息表示的材料名的处理,将该已处理完的第1信息向导出部105输出。

第2信息处理部103进行利用预先确定的方法修正由第2信息表示的材料的特性值的处理,将该已处理完的第2信息向导出部105输出。

第3信息处理部104进行利用预先确定的方法修正由第3信息表示的材料的属性的处理,将该已处理完的第3信息向导出部105输出。

导出部105从第1信息处理部102、第2信息处理部103以及第3信息处理部104取得已处理完的第1信息、第2信息以及第3信息。而且,导出部105将已处理完的第1信息、第2信息以及第3信息合并,进而基于这些信息,导出所提取出的各材料的特性值的可靠度。导出部105将包含这些导出的可靠度的输出信号向图像处理部106输出。

图像处理部106从导出部105取得输出信号,通过进行与该输出信号相应的图像处理而生成第1图像。而且,图像处理部106将表示该第1图像的图像信号向显示部13输出。

此外,本实施方式中的第1信息处理部102、第2信息处理部103以及第3信息处理部104也可以不对从文献数据库12中提取的所有第1信息、所有第2信息以及所有第3信息进行修正。也即是说,第1信息处理部102、第2信息处理部103以及第3信息处理部104也可以根据需要而将这些信息的一部分进行修正。在本实施方式中,信息提供装置100具备第1信息处理部102、第2信息处理部103以及第3信息处理部104,但也可以不具备它们中的至少一个。

以下,对图1所示的各构成要素的详情进行说明。

[从元数据的信息提取]

图2A和图2B是表示由图像处理部106显示于显示部13的显示画面的一例的图。

如图2A所示,图像处理部106将显示画面20显示于显示部13。显示画面20包括文献一览窗口21、提取信息表22以及提取开始按钮23a。

在文献一览窗口21中,显示存储于文献数据库12的文献信息D的一览。也即是说,显示存储于文献数据库12的各文献信息D的图标以及文献ID。文献ID是用于识别文献信息D的识别信息。

提取信息表22是用于表示从这些文献信息D提取出的信息的表。这些信息例如是文献ID、出版年月日、杂志名、标题、被引用数、最终材料名、电传导度以及活化能值等。出版年月日是与文献信息D对应的论文被出版的年月日,杂志名是刊登了该论文的杂志的名称。标题是该论文的标题,被引用数是该论文被其他论文引用了的次数。最终材料名是通过该论文中记述的材料合成而最终生成的最终材料的名称。电传导度是表示该最终材料中的电传导的容易度的电传导度或者电传导率,以下也被简称为“传导度”。活化能值是表示该最终材料的活化能的大小的值。

在此,在初始的提取信息表22中,没有表示从这些文献信息D提取出的信息,表示了这些信息的类别名。此外,在图2A和图2B的例子中,作为这些信息的类别名而表示了“杂志”、“最终材料”和“活化”,该“杂志”意味着杂志名,“最终材料”意味着最终材料名,“活化”意味着活化能值。

提取开始按钮23a是用于使从存储于文献数据库12的多个文献信息D的对上述的各信息的提取开始的按钮。

用户通过进行对于输入部11的输入操作,从显示于该文献一览窗口21的所有文献信息D,选择所期望的一个以上的文献信息D的图标,并选择提取开始按钮23a。输入部11将与这样的输入操作相应的输入信号向提取部101输出。也即是说,用户选择所期望的一个以上的文献信息D,指示信息提供装置100从这些文献信息D提取各种信息。

提取部101当从输入部11取得了上述的输入信号时,从选择出的一个以上的文献信息D的元数据D2中,例如分别提取表示出版年月日、杂志名、标题以及被引用数的4个书目信息。而且,提取部101对选择出的每个文献信息D,将该文献信息D的文献ID、和从该文献信息D的元数据D2中提取出的4个书目信息向图像处理部106输出。此外,出版年月日、杂志名、标题以及被引用数中的每一个也可说是材料的属性。也即是说,4个书目信息分别也可说是第3信息。

图像处理部106当从提取部101取得了上述的文献ID和4个书目信息时,如图2B所示,将显示于显示部13的显示画面20更新。也即是说,图像处理部106将该文献ID与由4个书目信息表示的出版年月日、杂志名、标题以及被引用数相互关联而写入提取信息表22。

在这种更新后的显示画面20所包含的提取信息表22中,表示了各文献信息D的出版年月日、杂志名、标题等。因此,用户能够集中材料领域来进行分析,或进行与材料有关的每个年代的分析。

如图2B所示,图像处理部106使补充开始按钮23b包含于更新后的显示画面20。补充开始按钮23b是用于使从存储于文献数据库12的多个文献信息D的原文数据D1的对表示最终材料名、传导度以及活化能值的3个信息的提取开始的按钮。

图3是表示元数据的一例的图。

元数据D2是结构化的数据,例如是bib形式的文件。也即是说,元数据D2是附加有“bib”作为扩展名的文件,也被称为BIB文件。在这种元数据D2中,例如如图3所示,记述有论文的标题、该论文的作者的名称、该作者所属的组织的名称(Affiliation)、和该论文的出版年月日等。在元数据D2中也可以表示被引用数。提取部101从这种元数据D2中提取上述的4个书目信息。此外,作者的名称也被称为作者名,作者所属的组织也被称为研究机构。

[从原文数据的信息提取]

当通过由用户向输入部11进行的输入操作而选择了补充开始按钮23b时,提取部101从输入部11取得与该输入操作相应的输入信号,开始从已经选择出的一个以上的文献信息D的原文数据D1中提取信息。

图4是表示原文数据D1的一例的图。

如图4所示,原文数据D1包括用自然语言记述的语句、表、和图表等图。提取部101将这些语句、表和图看为提取对象,从该提取对象提取上述的第1信息、第2信息以及第3信息。换言之,提取部101取得从该提取对象提取出的上述的第1信息、第2信息以及第3信息。此外,在原文数据D1包含有文本数据的情况下,提取部101从该文本数据提取第1信息、第2信息以及第3信息。换言之,提取部101取得从该文本数据提取出的第1信息、第2信息以及第3信息。在原文数据D1不包含文本数据的情况下,提取部101也可以将在原文数据D1中被图像化的语句变换为文本数据,从该文本数据提取第1信息、第2信息以及第3信息。换言之,提取部101也可以取得从变换得到的文本数据提取出的第1信息、第2信息以及第3信息。

提取部101在从文本数据提取第1信息、第2信息以及第3信息的情况下,也可以使用自然语言处理的工具或者深度学习的工具进行提取。自然语言处理的工具例如是CoreNLP或者MeCab等。深度学习的工具例如是word2vec、BERT、Tensorflow或者PyTorch等。由此能够高精度地提取各信息。此外,也可以在一个信息的提取中并用多种工具。由此,能够以更高的精度提取各信息。

表示材料名的词经常由元素符号和数字的组合来记述。因此,提取部101也可以使用登记有元素符号和数字的组合的模式(pattern)的辞典,通过将文本数据与该模式进行对照,提取与该模式匹配的词作为材料名。提取部101用正则表达式表示文本数据所包含的元素符号和数字的组合,将该正则表达式与模式进行对照。而且,提取部101也可以提取与匹配该模式的正则表达式对应的元素符号和数字的组合作为材料名。正则表达式是遵照预先确定的规则的表达式。例如,在文本数据表示“The conductivity and activationenergy for Li6.25Al0.25La3Zr2O12 with an ion dose of 2.7x 10-14cm-2are 4.6x10-3S cm-1and 0.11eV,respectively.”的情况下,提取部101通过用正则表达式记述元素符号和数字的组合,并将该正则表达式与模式进行对照,提取材料名“Li6.25Al0.25La3Zr2O12”。由此,能够适当地提取用户希望提取的信息。此外,在本公开中,元素符号的右侧相邻的数字即使该字符不是下标数字也表示该元素的组成比或者原子数。

提取部101例如从提取对象的语句中提取“Li6.25Al0.25La3Zr2O12”作为材料名,提取“4.6×10

提取部101例如从提取对象的表中提取“3.70×10

提取部101例如从提取对象的图表中提取材料的特性值即传导度。此时,提取部101由于图表的轴的标签或者说明文字包含有“conductivity”或者“Scm

图5是表示从原文数据D1的语句中提取出的材料名以及特性值的一例的图。

提取部101从原文数据D1的各语句提取材料名。此时,例如如图5所示,提取部101将文献ID、提取行号和跨度(span)与该提取出的材料名关联而记录于提取列表31。文献ID是包含作为所提取出的材料名的提取源的原文数据D1的文献信息D的识别信息。提取行号是在该原文数据D1中记述有该材料名的行的编号。跨度表示在该提取行号的行中该材料名的记述开始的起点和该记述结束的终点。起点由从行的开头字符到材料名的开头字符的字符数表示,终点由从行的开头字符到材料名的结尾字符的字符数表示。

此外,在材料名跨越多行的情况下,也可以将这些多行的编号记录为提取行号。提取行号也可以是在该原文数据D1中记述有该材料名的语句的编号。语句的编号例如是对原文数据D1的所有语句分配的用于识别该语句的编号。提取部101也可以将提取行号、和在原文数据D1中记述有该材料名的页的编号记录于提取列表31。

在此,提取部101在提取材料名时,例如提取元素符号和数字的组合作为材料名,如果在该元素符号和数字的旁边有括号,则可以也提取该括号和括号内的字符串作为材料名的一部分。例如,提取部101提取“Li6.25Al0.25La3Zr2O12(LALZ)”作为材料名。提取部101也可以将该括号内的字符串识别为材料名的缩写(简称)。例如,提取部101将“Li6.25Al0.25La3Zr2O12(LALZ)”中的“Li6.25Al0.25La3Zr2O12”识别为标准的材料名的表现方式,将“LALZ”识别为该材料名“Li6.25Al0.25La3Zr2O12”的缩写。其结果,提取部101也从原文数据D1中提取“LALZ”作为材料名。

此外,提取部101在判断为该括号内的字符串包含有变量时,不会将该括号内的字符串识别为材料名的缩写。例如如果像“x=0.1,0.2,0.3”等这样,括号内的字符串包含变量x,提取部101不会将该括号内的字符串识别为材料名的缩写。由提取部101提取的材料名有时包含有多个成分的混合比例。例如像材料名“60Li2SO4*40Li3BO3”这样,存在成分“Li2SO4”和成分“Li3BO3”的混合比例“60:40”包含于材料名的情况。这样的变量以及混合比例也可以通过由第1信息处理部102进行的后述的处理来修正。

由提取部101提取的材料名如上所述是目标材料或者最终材料的名称。例如,在原文数据D1包含多个材料名的情况下,提取部101也可以使用自然语言处理的工具或者深度学习的工具等,从这些多个材料名中提取最终材料的名称。例如,若原文数据D1中记述有语句“XXX was synthesized using…”,则提取部101检测该语句中的“synthesized”作为关键字。而且,提取部101判断为成为该关键字的对象的“XXX”是最终材料的名称(即最终材料名),提取该最终材料名“XXX”。

提取部101从原文数据D1的各语句中提取材料名、特性值。例如,特性值是传导度。此时,例如如图5所示,提取部101将文献ID、提取行号和跨度与该提取出的特性值关联而记录于提取列表32。文献ID是包含作为所提取出的特性值的提取源的原文数据D1的文献信息D的识别信息。提取行号是在该原文数据D1中记述有该特性值的行的编号。此外,提取行号也可以如上所述是语句的编号。跨度表示在该提取行号的行中该材料名的记述开始的起点和该记述结束的终点。起点由从行的开头字符到特性值的开头字符的字符数表示,终点由从行的开头字符到特性值的结尾字符的字符数表示。

在具体的例子中,原文数据D1的语句为“The conductivity and activationenergy for Li6.25Al0.25La3Zr2O12 with an ion dose of 2.7x 10-14cm-2are 4.6x10-3S cm-1and 0.11eV,respectively.”。在该情况下,提取部101通过用正则表达式记述数字和单位的组合,并将该正则表达式与模式进行对照,从该语句中识别并提取“4.6×10-3Scm-1”作为特性值。

在此,论文的原文数据D1大量地包括多种不包含材料名以及材料的特性值的语句。例如包含参考文献或者致谢词等的语句等。即,在原文数据D1所具有的所有语句是提取对象的情况下,存在提取很多材料名以及特性值以外的噪声的可能性。也即是说,容易发生提取错误。因此,本实施方式中的提取部101也可以将包含与材料有关的单词等的语句作为提取对象来处理。

例如,包含有材料名或者特性值等的语句中有时包含有与它们关联的关键字。也即是说,如果语句中包含关键字,则该语句中包含有材料名或者特性值的可能性高。例如,“XXX was synthesized using…”和“The conductivity and activation energy forXXX are YYY S cm

提取部101在提取材料名和特性值时,例如按语句或者小节等处理单位,如果能从该处理单位提取出材料名和特性值中的一方,则也打算从该处理单位提取另一方。提取部101在尽管从处理单位提取到了材料名和特性值中的一方,但是无法提取到另一方的情况下,也可以将该处理单位积存于数据库。这种处理单位也可以用作机器学习的教师数据。提取部101也可以促使用户从该处理单位进行材料名的提取、特性值的提取或者材料名和特性值的提取。也即是说,提取部101也可以经由图像处理部106向显示部13显示错误消息,促使用户进行材料名的提取、特性值的提取或者材料名和特性值的提取。

图6A是表示原文数据D1内的作为提取对象的图的一例的图,图6B是表示从提取对象的图中提取出的特性值的一例的图。

提取部101从原文数据D1的虚线图、散点图等图中提取材料名以及特性值。例如,如图6A所示,提取部101从文献ID“0001”和文献ID“0002”各自的原文数据D1所包含的图表,提取材料的传导度和温度。例如,该传导度是特性值。该温度是在用于合成材料的合成方法中使用的一个条件,是该材料的属性。提取部101在这些提取中例如使用图像处理、图像识别、深度学习等的工具。

在此,图6A所示的图表的纵轴表示传导度,横轴表示温度。此外,横轴也被称为x轴,纵轴也被称为y轴。而且,图表中描绘了材料的状态为Bulk的情况下的虚线和材料的状态为Total的情况下的虚线。Bulk例如是材料为单体的状态,Total例如是材料被组入产品的状态。在x轴上对1000℃、1200℃、1400℃、1600℃、1800℃、2000℃标注了刻度。

提取部101例如如图6A那样从该图表中的Bulk的虚线和Total的虚线分别读取与由图表的x轴上的各刻度表示的温度对应的传导度。由此,针对Bulk的材料和Total的材料中的每一方,提取与1000℃、1200℃、1400℃、1600℃、1800℃和2000℃中的各个温度对应的传导度。

例如,提取部101在文献ID“0001”的原文数据D1的图表中,读取“0.0070S/cm”作为x轴的温度为1000℃时的、由Bulk的虚线表示的y轴的传导度。此外,x轴的温度也被称为x值,y轴的传导度也被称为y值。

接着,如图6B所示,提取部101将上述的文献ID、该文献ID的原文数据D1所包含的图表的图号、x轴的标注了刻度的温度即x值、和针对该x值读出的传导度即y值记录于提取列表33。再者,提取部101将该图表的x轴的标签及y轴的标签、与读出的传导度对应的材料的状态(即Bulk或Total)、和该图表的说明文字(caption)记录于提取列表33。此外,由于该说明文字中经常记载有材料名,因此能够应用该说明文字作为将该x值及y值与材料名关联时的线索。

此外,如图6A的例子那样,即使图表中包含多条虚线,提取部101也将它们进行区分而提取传导度和温度。在图6A的例子中,提取部101按图表的x轴上标注的每个刻度,提取该刻度的温度和与该温度对应的传导度,但也可以不按每个刻度提取它们。例如,提取部101也可以按由用户指定的任意的温度间隔所表示的每个温度,提取该温度和与该温度对应的传导度。具体而言,在图6A所示的例子中,针对1000℃、1200℃、1400℃、1600℃、1800℃和2000℃中的每个温度,提取该温度和与该温度对应的传导度。在该情况下,它们的温度间隔为200℃。可是,提取部101也可以根据由用户向输入部11的输入操作,将该温度间隔设定为100℃。在该情况下,提取部101在从1000℃到2000℃的范围内按由100℃的温度间隔表示的每个温度,提取该温度和与该温度对应的传导度。也即是说,提取部101提取1000℃、1100℃、1200℃、1300℃、1400℃、1500℃、1600℃、1700℃、1800℃、1900℃和2000℃中的每个温度、和与这些温度对应的传导度。由此,能够切实地提取用户希望提取的传导度和温度等信息。此外,提取部101在提取标注了刻度的温度以外的温度时,例如通过使用图像识别的工具,确定两个刻度间的长度和这些刻度的温度。接着,提取部101使用所确定的长度和温度,对位于这些刻度间的中间点的温度进行插补。由此,能够适当地提取标注了刻度的温度以外的温度和与该温度对应的传导度。

在图6B所示的提取列表33中,也可以记录与所提取的图号的图相邻的语句的行号或者语句的编号。由此,通过参照提取列表33,能够容易地找到与图关联的语句。

图7A是表示由提取部101作为提取对象的图的一例的图,图7B是表示由提取部101从提取对象中排除的图的一例的图。

原文数据D1中除了与材料的特性值有关的图以外还存在很多与特性值无关的图。与特性值无关的图例如有用于说明概要、实验顺序等的简图、或者实验装置、资料等的照片等。因此,在原文数据D1所包含的所有图都被作为提取对象的情况下,对于特性值等的提取,容易产生错误。

于是,提取部101从原文数据D1包含的所有图中筛选如图7A所示那样成为提取对象的图,并将图7B所示的图从提取对象中排除。例如如图7B所示,从提取对象中排除的图是表示反应过程的图、表示材料结构的图等。例如,提取部101通过使用图像识别的工具、自然语言处理的工具、深度学习的工具等,筛选作为提取对象的图。图像识别的工具例如是OpenCV、Pillow等。由此,能够进行高精度的筛选。

或者,提取部101也可以通过使用基于正则表达式的模式匹配,筛选作为提取对象的图。提取部101从图的说明文字、标签等中提取单词、单位或者字符串等,根据提取出的单词等,生成正则表达式。而且,提取部101将该正则表达式与模式进行对照,将包含与模式匹配的正则表达式的图作为提取对象来处理。此外,上述的标签例如是标注在图表的轴上的标签。由此,能够进行高精度的筛选。

具体而言,提取部101从图6A所示的图表的y轴的标签“Conductivity(S/cm)”或者说明文字“Fig 1.Temperature dependent electrical conductivity ofLi6.25Al0.25La3Zr2O12 samples”等中提取各单词,用正则表达式表示这些单词,并将该正则表达式与模式进行对照。例如,y轴的标签所包含的“Conductivity”或者“S/cm”的正则表达式与模式匹配,说明文字所包含的“conductivity”的正则表达式与模式匹配。其结果,提取部101将图6A所示的图表作为提取对象来处理。由此,能够抑制打算从与特性值没有关联的图中勉强提取特性值的处理。

图8A是表示原文数据D1内的作为提取对象的表的一例的图,图8B是表示从提取对象的表中提取出的特性值的一例的图。

提取部101从原文数据D1的例如图8A所示的表1及表2中提取特性值。在特性值的提取中,与上述同样,提取部101使用图像识别的工具、深度学习的工具或者基于正则表达式的模式匹配等。

例如,在记述有特性值的表中,列名单元格中经常记述有“conductivity”、“eV”、“S/cm”、“Scm

具体而言,在图8A的文献ID“0001”的表2中,一个列名单元格中记述有“Conductivity”和“Scm

接着,如图8B所示,提取部101将检测出的材料名、检测出的关键字和提取出的特性值记录于提取列表34。此时,提取部101将材料名例如记录于提取列表34中的“行标签”这一列,将关键字记录于提取列表34中的“列标签”这一列。再者,提取部101将提取到该特性值的表的图号、和包含该表的原文数据D1的文献ID记录于提取列表34。

在表中还记述有作为特性值的传导度以外的值的情况下,提取部101也可以提取该值作为其他特性值。该值例如也可以是密度。在如图8A的表1那样,表示了“Cubic”、“Hexagonal”等结构的情况下,提取部101也可以提取表示该结构的信息。表示像这样提取出的密度及结构的信息与传导度一起记录于提取列表34。此外,该表示密度及结构的信息也可以作为第3信息来处理。

如上,本实施方式中的提取部101对于多个材料中的每一个,从至少一个文献信息D提取用于识别该材料的识别信息(即材料名)和该材料的特性值。此外,识别信息是第1信息,特性值是第2信息。提取部101提取多个类别特性值作为该材料的特性值。该多个类别特性值包括第1类别特性值和第2类别特性值。例如,第1类别特性值是传导度,第2类别特性值是活化能值。再者,提取部101对于多个材料中的每一个,从该至少一个文献信息D提取表示该材料的属性的属性信息。此外,属性信息是第3信息。例如,属性是出版年月日、被引用数、作者名以及温度等。

[由第1信息处理部进行的修正处理]

第1信息处理部102从提取部101取得表示材料名的第1信息。也即是说,材料名由第1信息处理部102取得。在该第1信息的取得中,第1信息处理部102也可以从提取部101取得分别包含第1信息的图5所示的提取列表31和图8B所示的提取列表34。第1信息处理部102将该所取得的材料名进行修正。该修正也被称为修正处理或者正规化处理。

图9是表示材料名的正规化处理的一例的图。

利用自然语言处理、或者深度学习等机器学习进行的材料名的提取很难是以100%的精度进行提取。例如,材料名在论文的开头是以材料的正式名称(例如Li6.25Al0.25La3Zr2O12等)来记载的,但有时在中段以后,会以略语(例如LALZO等)来记载。再者,材料名有时会表现出各成分的混合比例或者状态等。由此,一个材料的材料名有时会以多种表现方式来记述。例如Sulfonatedpolyimide、SPI、SPI/poly(vinylidenefluoride)(PVDF)blends、50wt%of SPI content等那样,记述有多种表现方式。因此,如图5和图9所示,在由提取部101生成的提取列表31中,以多种表现方式记录了同一材料的材料名。

于是,第1信息处理部102通过执行将提取列表31中包含的材料名的表现方式进行修正的正规化处理,将该提取列表31变换为修正后的提取列表31a。

例如,第1信息处理部102将提取列表31中包含的材料名“Li6.25Al0.25La3Zr2O12(LALZ)”中的、括号内的字符串识别为括号外的字符串的缩写,将括号外的字符串识别为材料名的标准的表现方式。而且,第1信息处理部102判断为该缩写与标准的表现方式等同,将该括号及括号内的缩写从该材料名中删除。再者,第1信息处理部102将提取列表31中包含的缩写替换为标准的表现方式。具体而言,第1信息处理部102将提取列表31中包含的材料名“LALZ”修正为“Li6.25Al0.25La3Zr2O12”。或者,第1信息处理部102将该缩写从提取列表31中删除。

第1信息处理部102识别为提取列表31中包含的材料名“Li6.25AlxLa(1-x)Zr2O12(x=0.1,0.2,0.3)”中的x是变量。此外,该变量x表示Al与La的混合比例。而且,第1信息处理部102从“Li6.25AlxLa(1-x)Zr2O12(x=0.1,0.2,0.3)”中删除(x=0.1,0.2,0.3),对“Li6.25AlxLa(1-x)Zr2O12”的变量x代入“x=0.1,0.2,0.3”的值。由此,第1信息处理部102将“Li6.25AlxLa(1-x)Zr2O12(x=0.1,0.2,0.3)”分解为“Li6.25Al0.1La0.9Zr2O12”、“Li6.25Al0.2La0.8Zr2O12”和“Li6.25Al0.3La0.7Zr2O12”。而且,第1信息处理部102将提取列表31中包含的分解前的“Li6.25AlxLa(1-x)Zr2O12”修正为通过分解而得到的3种表现方式。

第1信息处理部102通过对提取列表31中包含的材料名“60Li2SO4*40Li3BO3”与材料名“Li2SO4-Li3BO3”进行比较,判断为材料名“60Li2SO4*40Li3BO3”中记述有混合比例。其结果,第1信息处理部102将提取列表31中包含的“60Li2SO4*40Li3BO3”删除。或者,第1信息处理部102将提取列表31中包含的“60Li2SO4*40Li3BO3”修正为“Li2SO4-Li3BO3”。

通过这种由第1信息处理部102对提取列表31中包含的材料名的表现方式进行的修正,生成修正后的提取列表31a。

此外,第1信息处理部102也可以从提取列表31中搜索跨度的起点或者终点彼此接近、且表现方式彼此相似的两个材料名,如果能找到这两个材料名,则判断为这些材料名被针对相同的材料而使用。第1信息处理部102也可以通过对原文数据D1中的语句进行自然语言处理的依存句法解析等,判断对相同的材料使用了多种表现方式的材料名。

由提取部101进行的材料名等的提取有时会发生乱码、提取错误等。乱码例如由从PDF或者XML形式的文件中包含的图像数据变换为文本数据时的错误而引发。提取错误例如由字符的走样等原因而引发。第1信息处理部102也可以检测这种乱码、提取错误,修正提取列表31中包含的材料名。

[由第2信息处理部进行的修正处理]

第2信息处理部103从提取部101取得表示材料的特性值的第2信息。也即是说,特性值由第2信息处理部103取得。在该第2信息的取得中,第1信息处理部102也可以从提取部101取得分别包含第2信息的图5所示的提取列表32、图6B所示的提取列表33以及图8B所示的提取列表34。第2信息处理部103将该所取得的特性值进行修正。该修正也被称为修正处理或者变换处理。

图10是材料的特性值的变换处理的一例。

第2信息处理部103将由提取部101提取出的特性值所包含的数字和单位的组合变换为数字。第2信息处理部103例如使用预先登记有在材料论文中频繁出现的单位的辞典,将由提取部101提取出的特性值中的数字变换为使用基准单位表现的数字,并将该特性值所包含的单位删除。第2信息处理部103也可以将特性值所包含的使用10的乘方的数字的表现方式变换为不使用10的乘方的数字的表现方式。

例如,如图10所示,第2信息处理部103通过将提取出的特性值“4.6×10

例如像“2.0-2.2mScm

例如像“4.38(6)×10

由提取部101从原文数据D1的图中提取出的特性值有可能是错的。例如,有时作为提取对象的图的图像不清晰、或该图中包含的多条虚线过于重叠、或该虚线不清楚、或图太小。在这种情况下,提取后的特性值有可能是错的。具体而言,如图6A所示,文献ID“0002”的原文数据D1的图表中包含有局部放大图。由于该局部放大图的原因,由提取部101提取出的特性值有可能是错的。

第2信息处理部103可以将这样的错误的特性值进行修正,也可以将其删除。例如,第2信息处理部103也可以利用图像识别工具,推定图中的容易发生错误的部分,并将从该部分提取出的特性值删除。或者,第2信息处理部103也可以对从图中提取出的特性值与从同一原文数据D1中的其他图中提取出的特性值进行比较,检测彼此大不相同的特性值,并将该特性值删除。在特性值是传导度的情况下,第2信息处理部103例如也可以使用预先登记有传导度可取的数值范围的辞典,在提取出的传导度超出了该所登记的数值范围的情况下,将该传导度删除。或者,第2信息处理部103也可以将该传导度修理为数值范围的上限值或者下限值。

包含由提取部101从原文数据D1的表中提取出的特性值的提取列表34有可能是错的。例如,如图8A所示,在文献ID“0001”的表2中,标注了2层的列标签。也即是说,具有记述了“Experimental1”的列标签和记述了“Conductivity(mScm-1)”的列标签。在该情况下,如图8B所示,提取部101中提取列表34中的列标签这一列,有时会在应该记录“Conductivity(mScm-1)”的地方,错误地记录为“Experimental1”。

在该情况下,第2信息处理部103将提取列表34中表示的特性值“2.45”与上述的登记于辞典的传导度可取的数值范围进行比较。而且,如果该特性值包含于数值范围,则即使在提取列表34中对该特性值关联了“Experimental1”,第2信息处理部103也判断为该特性值与“Conductivity(mScm-1)”相关联。其结果,第2信息处理部103将提取列表34的“Experimental1”替换为“Conductivity(mScm-1)”,将该特性值作为传导度来处理。

由提取部101从原文数据D1的表中提取出的特性值有可能是错的。例如,在该表不清楚的情况下,提取出的特性值有可能是错的。在该情况下,第2信息处理部103也可以通过将该特性值与登记于辞典的特性值可取的数值范围进行比较,检测该特性值的错误。

[由第3信息处理部进行的修正处理]

第3信息处理部104从提取部101取得表示材料的属性的第3信息。也即是说,属性由第3信息处理部104取得。在该第3信息的取得中,第3信息处理部104也可以从提取部101取得分别包含第3信息的图6B所示的提取列表33。在该提取列表33中,作为第3信息而表示有x值、即温度。第3信息处理部104将该所取得的第3信息、即属性与第1信息处理部102以及第2信息处理部103同样地进行修正。

[各信息的合并处理]

导出部105针对每个原文数据D1,通过取得分别从第1信息处理部102、第2信息处理部103以及第3信息处理部104输出的信息并进行合并而生成综合信息。也即是说,导出部105将从第1信息处理部102输出的已处理完的第1信息、从第2信息处理部103输出的已处理完的第2信息和从第3信息处理部104输出的已处理完的第3信息与原文数据D1的文献ID相关联。此外,已处理完的第1信息、已处理完的第2信息以及已处理完的第3信息分别表示已修正完的材料名、已修正完的特性值以及已修正完的属性。由此,生成对文献ID关联有材料名、特性值以及属性的综合信息。

例如,导出部105针对每个原文数据D1,从第1信息处理部102、第2信息处理部103以及第3信息处理部104分别取得已修正完的提取列表(例如,提取列表31a)。而且,导出部105基于这些提取列表中表示的图号、提取行号、跨度等,确定材料名与特性值的距离、材料名与属性的距离,并将材料名、特性值以及属性关联。导出部105将从同一语句或者图中提取出的材料名、特性值以及属性关联。再者,也能够将从彼此相邻的多个语句等中提取出的材料名、特性值以及属性关联。此外,距离既可以是记述有两个信息的提取行号之差,也可以是基于提取行号和跨度的距离。例如,导出部105也可以通过计算从材料名的终点到特性值的起点的字符数,确定该材料名与特性值的距离。导出部105既可以根据该距离制作关联规则,也可以使用自然语言处理的依存句法工具,将材料名、特性值以及属性关联。自然语言处理的依存句法工具例如是ChemDataExtractor等。

而且,导出部105将多个原文数据D1中的每一个的综合信息向图像处理部106输出。图像处理部106从导出部105取得该综合信息,通过使提取信息表22包含这些综合信息而将该提取信息表22更新。

图11是表示更新后的提取信息表22的一例的图。

更新后的提取信息表22包含从各原文数据D1提取出的综合信息、即第1信息、第2信息以及第3信息。第1信息表示最终材料名,两个第2信息分别表示传导度以及活化能值,两个第3信息分别表示作者名以及研究机构名。此外,在提取信息表22中作为信息的类别名而记载的“作者”以及“研究机构”分别意味着作者名以及研究机构名。

此外,在图11所示的例子中,作者名以及研究机构名分别作为第3信息、即作为属性而从原文数据D1中提取。可是,这些属性也可以从文献信息D的元数据D2中提取。在图11所示的例子中,作为最终材料名而表示了“LiSo…”,但该最终材料名的具体例子是“Li7La3Zr2O12”、“LiCoO2”、“Li3P-LiCl”、“Li1.33Ti1.67O4”、“Li2CO3”等。

图12是表示包括更新后的提取信息表22的显示画面20的一例的图。

如图12所示,图像处理部106将包括更新后的提取信息表22的显示画面20显示于显示部13。此时,图像处理部106使该显示画面20包括图表显示开始按钮23c。图表显示开始按钮23c是用于使特性值图表的显示开始的按钮。在图12的例子中,传导度以及活化能值分别是特性值。特性值图表是表示各文献信息D所表示的特性值的图表。此外,在图12所示的提取信息表22中,没有表示作者名以及研究机构名,但也可以表示出这些名称。

用户通过参照这种显示画面20的提取信息表22,能够确认在哪一年月日出版的文献中记述有具有怎样的特性值的材料。在图12所示的显示画面20中,没有包含图2A和图2B的文献一览窗口21,但也可以包含该文献一览窗口21。在该情况下,用户通过进行对输入部11的输入操作,可以解除该文献一览窗口21内的文献信息D的图标的选择,也可以选择新的图标。根据该选择以及选择的解除,图像处理部106也可以将提取信息表22更新。根据这种提取信息表22,能够进行按年代的分析、集中材料领域的分析等。

图13是表示包括特性值图表的图表显示画面的一例的图。图13、图14、图15A、图15B、图15C中记载的“活化”意味着“活化能”。

例如,用户通过进行对输入部11的输入操作,选择图12所示的显示画面20的图表显示开始按钮23c。由此,输入部11将促使显示特性值图表的输入信号向图像处理部106输出。图像处理部106取得了该输入信号时,将显示于显示部13的显示画面20切换为图表显示画面20a。

如图13所示,该图表显示画面20a包含特性值图表24、可靠度显示按钮23d以及返回按钮23e。可靠度显示按钮23d是用于显示与特性值图表24中描画的标记对应的特性值的可靠度的按钮。返回按钮23e是用于使图表显示画面20a返回到图12的显示画面20的按钮,对该返回按钮23e例如附有“回到表”的字符串。

特性值图表24是将活化能值表示于横轴、将传导度表示于纵轴的图表。图像处理部106针对提取信息表22中表示的每个材料名(即最终材料名),在与关联于该材料名而表示的两种特性值对应的特性值图表24上的位置描画标记。该两种特性值是第1类别特性值以及第2类别特性值,具体而言是传导度以及活化能值。在图13所示的例子中,标记是x记号。图像处理部106在这些标记的旁边附上与该标记对应的材料名。由此,表示从由用户选择的多个文献信息D提取出的、多个材料中的每一个的传导度以及活化能值的特性值图表24显示在图表显示画面20a内。特性值图表24将传导度以及活化能值与材料名相关联而表示。

此外,与描画于特性值图表24的各标记对应的材料或者材料名可以相同,也可以互不相同。例如,这些材料可以是用于电池的负极或者正极的同一用途的材料,也可以是各自包含元素种类Li的材料。这些材料也可以是虽然各自包含相同的多个元素种类但是这些元素种类的组成比互不相同的材料。在图13~图15C所示的例子中,作为材料名而表示了“LiSo…”,但该材料名的具体例子是“Li7La3Zr2O12”、“LiCoO2”、“Li3P-LiCl”、“Li1.33Ti1.67O4”、“Li2CO3”等。

例如,材料研究人员等用户通过参照这样的图表显示画面20a,能够考虑特性值的平衡来探寻与自身的实验环境或者实验对象相符的材料。

此外,图像处理部106也可以自动地调整特性值图表24的纵轴和横轴的标度(scale)。这种自动调整标度的功能有望帮助用户准确地捕捉特性值的全貌。例如,图像处理部106决定与提取信息表22中表示的特性值的最大值以及最小值相应的标度。在具体的例子中,图像处理部106将特性值的最小值设定于特性值图表24的原点,将特性值的最大值设定于特性值图表24的轴的末尾。可是,当在提取信息表22中作为特性值而包含有离群值(异常值)的情况下,由于存在该离群值,因而有可能难以在特性值图表24上观察离群值以外的特性值。在具体的例子中,提取信息表22中包含的所有特性值中的99%的特性值在0~0.001的范围内,剩余1%的特性值在1.0~2.0的范围内。在该情况下,该1%的特性值是离群值。若使用这些特性值决定标度,则由于1%的离群值,会在特性值图表24的与该特性值对应的轴上,以0~2.0的范围设定每0.1的刻度。其结果,难以适当地观察原本成为观察对象的99%的特性值。因此,图像处理部106也可以将提取信息表22中包含的离群值省略,基于该离群值以外的特性值生成特性值图表24。由此,能够适当地观察原本成为观察对象的特性值。

或者,图像处理部106也可以根据该材料的类别,调整特性值图表24的纵轴和横轴的标度。例如,图像处理部106根据该材料的材料名确定该材料的类别,将与该类别相关联的特性值的标度设定为特性值图表24的纵轴和横轴的标度。在具体的例子中,若确定固体电解质作为材料的类别,由于固体电解质的传导度为0~0.001S/cm,因此图像处理部106将特性值图表24的与传导度对应的轴的标度设定为0~0.001。这种固体电解质的传导度的范围也可以预先登记于存储器。图像处理部106也可以根据由用户向输入部11的输入操作,调整特性值图表24的纵轴和横轴的标度。图像处理部106在判断为特性值是传导度时,也可以在特性值图表24的轴上设定针对传导度预先确定的对数计数法的标度。

当根据由用户向输入部11的输入操作,选择了一个标记时,图像处理部106也可以经由提取部101取得记述了与该标记对应的材料名以及两种特性值的文献信息D,并显示于显示部13。

[可靠度的导出处理]

例如,用户通过进行对输入部11的输入操作,选择图13所示的图表显示画面20a的可靠度显示按钮23d。由此,输入部11向导出部105输出促使显示可靠度的输入信号。导出部105取得了该输入信号时,导出特性值图表24中表示的各材料的传导度以及活化能值的可靠度。而且,导出部105向图像处理部106输出包含这些导出的可靠度的输出信号。图像处理部106在从导出部105取得了输出信号时,将特性值图表24中描画的各材料的标记变更为与针对该材料的传导度以及活化能值而导出的可靠度相应的显示方式。

在具体的一例中,导出部105计算导出对象的材料的标记与除此以外的多个材料中的每一个的标记之间的距离,进而计算这些距离的平均值。此外,该距离可以是欧氏距离,也可以是曼哈顿距离等,还可以是除此以外的其他距离。接着,导出部105计算该导出对象的材料所具有的特性值的相似度。导出对象的材料的标记与除此以外的多个材料中的每一个的标记之间的距离的平均值越大,则相似度越小,该平均值越小,则相似度越大。例如,相似度由0~100的范围内的数值表示。该特性值是传导度以及活化能值。接着,导出部105将该相似度决定为可靠度。如此,在本实施方式中,针对导出对象的材料的两种特性值,计算出一个可靠度。

对于8个不同的坐标显示于图13的特性值图表24(图12的更新后的提取信息表22具有ID001~ID008的数据)的情况,例示上述处理。将与由ID001确定的传导度值及活化能值的第1组对应的坐标(0.41,0.048)称为第1坐标,……,将与由ID008确定的传导度值及活化能值的第8组对应的坐标(0.15,0.077)称为第8坐标。不同的坐标的个数也可以是8个以外的数。

导出部105计算第1坐标与第2坐标的距离L12、~、第1坐标与第8坐标的距离L18、第2坐标与第3坐标的距离L23、~、第2坐标与第8坐标的距离L28、~、和第7坐标与第8坐标的距离L78。计算出的距离的数量为(8×7)/2=28。

导出部105计算与第1坐标有关的平均即L(avg1)=(L12+…+L18)/7、与第2坐标有关的平均即L(avg2)=(L12+L23+…+L28)/7、~、和与第8坐标有关的平均即L(avg8)=(L18+L28+…+L78)/7。

导出部105在L(avgn)大时,将对于传导度及活化能值的第n组的相似度设定得较小,在L(avgn)小时,将对于传导度及活化能值的第n组的相似度设定得较大。n为1~8的自然数。

图14是示出表示可靠度的图表显示画面20a的一例的图。

如图14所示,图像处理部106将特性值图表24中描画的各标记以与对于由该标记表示的材料的两种特性值的可靠度、即对于传导度及活化能值的可靠度相应的形态显示。在具体的例子中,这些标记为圆形,两种特性值的可靠度越高,图像处理部106使与该两种特性值对应的标记的颜色越浓,两种特性值的可靠度越低,图像处理部106使与该两种特性值对应的标记的颜色越淡。换言之,在特性值图表24中多个标记的密集程度越高,图像处理部106使这些标记的颜色越浓,密集程度越低,图像处理部106使这些标记的颜色越淡。因此,位于远离其他很多标记的位置的标记显示得较淡,因而,用户能够判断为与该标记对应的材料的特性值比较不可靠。相反,相互靠近聚集的标记显示地较浓,因而能够判断为与这些标记对应的材料的特性值比较可靠。

图像处理部106使可靠度非显示按钮23f代替上述的可靠度显示按钮23d而包含并显示于该图表显示画面20a。该可靠度非显示按钮23f是用于使可靠度非显示的按钮,例如是用于使图14所示的图表显示画面20a返回到图13所示的图表显示画面20a的按钮。

如此,在本实施方式中,向用户提示对于从文献信息D提取出的特性值的可靠度。在由用户选择的多个文献信息D是与材料合成的实验有关的论文的电子数据的情况下,可靠度是基于从一篇论文提取出的信息推定的、表示该论文中记述的一次实验的再现性的指标。再现性是在现实中进行多次实验时,表示成功的次数相对于该试行次数的比例的指标。在一位作者进行类似的实验,获得具有相似特性值的材料,并在多篇论文中进行了发表的情况下,可以说其发表的次数越多,则该材料的合成实验成功的概率越高。因此,也能够根据由一位作者发表论文的次数计算再现性。如果在分别由互不相同的作者或者不同的研究机构出版的论文中,记载有相似的特性值,则能够提示高可靠度,能够考虑作者或者研究机构的开发技能而将可靠度可视化。即使由互不相同的装置测量多个特性值,如果这些特性值接近,那么也能够判断为对于这些特性值的可靠性高,可期待提高可靠度的准确度的效果。因此,可期待本实施方式在重视过去报告的与材料合成有关的论文的数量的材料研究人员探索期望的材料时有帮助。

此外,在本实施方式中,虽然提示对于传导度以及活化能值即两种特性值的可靠度,但它们也可以是其他特性值,也可以提示对于一种特性值的可靠度。在本实施方式中,特性值图表24由表示传导度以及活化能值的2轴构成,但也可以由表示3种特性值的3轴构成。也即是说,特性值图表24也可以构成为三维图表。该3种特性值中的一种也可以是用于材料合成的条件、例如温度或者时间等。再者,特性值图表24也可以由4个以上的轴构成。也即是说,该特性值图表24表示4种以上的特性值。此外,由于4轴以上的特性值图表24的可视化是困难的,因而也可以使用PCA(Principal Component Analysis,主成分分析)、t-SNE(t-Distributed Stochastic Neighbor Embedding,t-随机邻近嵌入)等维度削减方法,将轴数削减为2轴或者3轴而构成特性值图表24。图像处理部106也可以根据由用户向输入部11的输入操作,选择轴的种类和数量。这种轴种类的选择以及轴数量的增加能够提高特性值的表现力,能够进行更详细的分析。

根据对于材料的特性值的可靠度的高低来改变与该材料对应的标记的颜色的浓度的功能是材料研究人员迅速确认大量的特性值所需的功能,具有使人容易理解地示出在特性值图表24中应该关注的区域的效果。例如,用户重视再现性的高低而探索材料时,可以关注颜色浓的标记的材料来探索材料。相反地,用户重视材料的稀缺性而探索材料时,可以关注颜色淡的标记的材料来探索材料。由此,能够实现与材料研究人员等用户的目的相应的材料探索。

在特性值图表24中描画的材料的标记的颜色也可以与在用户平时使用的元素符号表中用于该材料的主要成分的元素的颜色相同。例如,在材料的主要成分的元素为Li的情况下,如果在元素符号表中Li的区域用黄色表示,则图像处理部106也可以将该材料的标记用黄色显示于显示部13。在具体的例子中,图像处理部106预先保持表示用户平时使用的元素符号表的数据,确定提取信息表22中表示的材料的主要成分的元素,并基于预先保持的上述的数据,决定与该元素对应的颜色。而且,图像处理部106将与该材料对应的标记的颜色决定为像上述这样决定的颜色,在特性值图表24中描画该颜色的标记。由此,用户能够根据特性值图表24中表示的各标记的颜色,容易地掌握与它们对应的材料的主要成分,能够实现数据分析的进一步的高效化。

如此,本实施方式中的导出部105对于多个材料中的每一个,基于该材料与其他一个以上的材料之间的特性值的相似度,导出该材料的特性值的可靠度。而且,图像处理部106生成将该多个材料中的每一个的特性值(i)以与针对该材料的特性值而导出的可靠度相应的显示方式表示、且(ii)与该材料的识别信息相关联而表示的第1图像,并将该第1图像向显示部13输出。第1图像例如是图14的图表显示画面20a。由此,在所显示的第1图像中,多个材料中的每一个的特性值以与该特性值的可靠度相应的显示方式显示,且该特性值关联有材料的识别信息。因此,材料研究人员等用户通过观察该第1图像,能够从该第1图像容易地掌握存储于文献数据库12的庞大数量的文献信息D所记述的材料的特性值的可靠性。

图像处理部106将由用于表示作为传导度的第1类别特性值的第1坐标轴、和用于表示作为活化能值的第2类别特性值的第2坐标轴构成的特性映射设定于第1图像。该特性映射例如是图14的特性值图表24。而且,图像处理部106将与多个材料中的每一个对应的标记以与针对该材料的特性值而导出的可靠度相应的显示方式重叠在该特性映射上的与该材料的第1类别特性值和第2类别特性值对应的位置上。由此,能够整体更容易地掌握各材料具有的多个类别特性值的可靠度。

导出部105基于与材料对应的标记、和与其他一个以上的材料中的每一个对应的标记之间的距离,确定该材料中的特性值的相似度。由此,针对材料的多个类别特性值,能够适当地确定一个相似度,其结果,能够适当地导出基于相似度的可靠度。

图像处理部106决定针对材料的特性值而导出的可靠度越高则越浓的颜色的浓度作为该特性值的显示方式,生成以所决定的颜色的浓度表示特性值的第1图像。由此,能够让用户在视觉上容易地掌握特性值的可靠度。此外,在本实施方式中,使用特性值图表24,以所决定的颜色的浓度显示表示该特性值的标记,但在不使用特性值图表24的情况下,也可以以所决定的颜色的浓度显示该特性值的数值本身。

图15A是示出表示可靠度的图表显示画面20a的另一例的图。

在图14所示的例子中,导出部105导出上述的基于距离的相似度作为可靠度。也即是说,在相似度为R0、可靠度为K的情况下,导出部105通过K=1×R0计算可靠度K。可是,对于该可靠度K的计算,导出部105也可以使相似度R0和与材料的属性相应的属性值反映于该可靠度K。例如,在4个属性值为R1、R2、R3和R4的情况下,导出部105通过K=(p×R0)+(a×R1)+(b×R2)+(c×R3)+(d×R4)、也即是说通过对于4个属性值R1~R4和相似度R0的加权加法运算,计算可靠度K。p是对于相似度R0的权重,a是对于属性值R1的权重,b是对于属性值R2的权重。c是对于属性值R3的权重,d是对于属性值R4的权重。也即是说,导出部105针对可靠度K的导出赋予多种偏差。权重p和a~d满足p+a+b+c+d=1,设定为与由用户向输入部11的输入操作相应的值。此外,对于相似度R0的权重p满足0

例如如图15A所示,图像处理部106将用于调整属性值R1~R4的权重a~d的滑动条25a~25d显示于图表显示画面20a。

滑动条25a是用于将基于出版年月日的属性值R1的权重a根据滑块1sa的位置进行设定的显示要素。该出版年月日是提取出材料的材料名、传导度以及活化能值的文献信息D的出版年月日,是该材料的属性。导出部105决定该出版年月日越新则越接近100、出版年月日越老则越接近0的值作为基于出版年月日的属性值R1。导出部105将若滑块1sa位于左端则为0、滑块1sa越接近右端则越大的值设定为权重a。例如,如果滑块1sa位于滑动条25a的中央,则权重a也可以为0.5。

滑动条25b是用于将基于被引用数的属性值R2的权重b根据滑块1sb的位置进行设定的显示要素。该被引用数是提取出材料的材料名、传导度以及活化能值的文献信息D的被引用数,是该材料的属性。导出部105决定该被引用数越多则越接近100、被引用数越少则越接近0的值作为基于被引用数的属性值R2。导出部105将若滑块1sb位于左端则为0、滑块1sb越接近右端则越大的值设定为权重b。例如,如果滑块1sb位于滑动条25b的中央,则权重b也可以为0.5。

滑动条25c是用于将基于作者名的属性值R3的权重c根据滑块1sc的位置进行设定的显示要素。该作者名是提取出材料的材料名、传导度以及活化能值的文献信息D的作者名,是该材料的属性。导出部105决定该作者名的知名度越高则越接近100、作者名的知名度越低则越接近0的值作为基于作者名的属性值R3。此外,信息提供装置100也可以保持表示各作者名的知名度的数据。导出部105将若滑块1sc位于左端则为0、滑块1sc越接近右端则越大的值设定为权重c。例如,如果滑块1sc位于滑动条25c的中央,则权重c也可以为0.5。

滑动条25d是用于将基于温度的属性值R4的权重d根据滑块1sd的位置进行设定的显示要素。该温度是为了合成所提取的材料名的材料所使用的温度,是该材料的属性。该温度也可说是材料的合成方法所包含的一个条件。导出部105计算该材料的温度与其他一个以上的材料中的每一个的温度之差,决定该温度差的平均值越小则越接近100、该平均值越大则越接近0的值作为基于该材料的温度的属性值R4。也即是说,该属性值R4表示温度的相似度。导出部105将若滑块1sd位于左端则为0、滑块1sd越接近右端则越大的值设定为权重d。例如,如果滑块1sd位于滑动条25d的中央,则权重d也可以为0.5。

此外,出版年月日、被引用数、作者名以及温度中的每一个作为第3信息而由提取部101提取。

用户通过进行对输入部11的输入操作,调整滑动条25a~25d的滑块1sa~1sd的位置。例如,用户使滑块1sa~1sd中的每一个靠向左端。在该情况下,导出部105根据通过用户的输入操作而从输入部11输出的输入信号,将出版年月日、被引用数、作者名以及温度各自的权重a~d设定为0,将相似度R0的权重p设定为1。其结果,与图14所示的例子同样地,导出部105通过K=(1×R0)+(0×R1)+(0×R2)+(0×R3)+(0×R4)、即根据相似度R0,计算可靠度K。其结果,如图15A所示,图像处理部106使与图14的例子同样的特性值图表24包含于图表显示画面20a并显示于显示部13。

如此,本实施方式中的导出部105基于材料中的特性值的相似度R0、和针对该材料而提取出的属性信息,导出该材料中的特性值的可靠度K。也即是说,导出部105通过材料中的特性值的相似度R0、和基于针对该材料而提取出的属性信息的属性值R1~R4的加权加法运算,导出该材料中的特性值的可靠度K。由此,由于基于特性值的相似度R0、材料的属性,导出该特性值的可靠度K,因此能够多方面地导出可靠度K,能够提高该可靠度K的准确度。通过将相似度R0和属性各自的权重作为偏差进行调整,能够导出与用户的目的相应的可靠度K。

图15B和图15C是表示变更了偏差后的图表显示画面20a的一例的图。

如图15B所示,用户通过进行对输入部11的输入操作,使滑动条25a~25d的滑块1sa~1sd中的滑块1sa从图15A所示的位置向右端移动。在该情况下,导出部105根据通过该输入操作而从输入部11输出的输入信号,将出版年月日的权重a例如设定为0.9,将被引用数、作者名以及温度各自的权重b~d设定为0,将相似度R0的权重p设定为0.1。其结果,导出部105通过K=(0.1×R0)+(0.9×R1)+(0×R2)+(0×R3)+(0×R4)、即对出版年月日大幅赋予偏差,计算可靠度K。其结果,如图15B所示,图像处理部106使与图14和图15A的例子不同的特性值图表24包含于图表显示画面20a并显示于显示部13。也即是说,出版年月日比相似度R0更影响可靠度K,文献信息D的出版年月日越早,与从该文献信息D提取出的材料名、传导度以及活化能值对应的标记的颜色容易显示得越浓。

换言之,若仅是所描画的标记密集,则这些标记的颜色不会变浓,而若所描画的标记密集、且与这些标记对应的出版年月日越新,则这些标记的颜色显示得越浓。如此,在图15B所示的滑动条25a~25d的设定中,提取出特性值等的文献信息D越新,则该特性值的可靠度K越高,即,与该特性值对应的标记显示得越浓。因此,可期待本实施方式在重视论文等文献信息D的新颖性的材料研究人员探索期望的材料时有帮助。

如此,在本实施方式中,属性信息表示至少一个文献信息D中的、记载有与该属性信息对应的材料的识别信息和特性值的文献信息D的出版时期作为属性。出版时期是上述的出版年月日,也可以是出版日。而且,导出部105使用表示该出版时期的新颖性的属性值R1导出特性值的可靠度K。具体而言,出版时期越新,该属性值R1则表示越大的值。而且,材料中的特性值的相似度R0越高、且与该材料对应的属性值R1越大,导出部105则导出越大的值作为该材料中的特性值的可靠度K。由此,针对新的文献信息D中记述的特性值,能够导出比较高的可靠度K。因此,能够对注重出版时期的用户导出适当的可靠度K。

接着,如图15C所示,用户通过进行对输入部11的输入操作,使滑动条25a~25d的滑块1sa~1sd中的每一个向右侧移动。导出部105根据通过该输入操作而从输入部11输出的输入信号、即根据滑块1sa~1sd中的每一个的从左端起的距离,设定权重p及a~d。权重a~d各自的比率设定为滑块1sa~1sd中的每一个的从左端起的距离的比率。例如,在图15C的例子中,如(温度的权重d)>(作者名的权重c)>(被引用数的权重b)=(出版年月日的权重a)这样设定权重a~d,对于相似度R0的权重p根据p=1-(a+b+c+d)设定。

其结果,导出部105通过K=(p×R0)+(a×R1)+(b×R2)+(c×R3)+(d×R4),即,对相似度R0、出版年月日、被引用数、作者名以及温度分别赋予比0大的值的偏差,计算可靠度K。其结果,如图15C所示,图像处理部106使与图14、图15A和图15B的例子不同的特性值图表24包含于图表显示画面20a并显示于显示部13。也即是说,材料合成的温度与其他材料的温度越相似、作者名的知名度越高、被引用数越多、出版年月日越早,则与它们对应的材料的标记的颜色容易显示得越浓。这种滑动条25a~25d的设定有望对想要多方面或者高度地检索材料的材料研究人员有效。

如此,在本实施方式中,属性信息表示至少一个文献信息D中的、记载有与该属性信息对应的材料的识别信息和特性值的文献信息D的被引用数作为属性。而且,导出部105使用与该被引用数相应的属性值R2导出特性值的可靠度K。具体而言,被引用数越多,属性值R2则表示越大的值。而且,材料中的特性值的相似度R0越高、且与该材料对应的属性值R2越大,导出部105则导出越大的值作为该材料中的特性值的可靠度K。由此,针对被引用数多的文献信息D中记述的特性值,能够导出比较高的可靠度K。因此,能够对注重被引用数的用户导出适当的可靠度K。

在本实施方式中,属性信息表示与该属性信息对应的材料的合成方法作为属性。而且,导出部105使用与该材料的合成方法和其他一个以上的材料的各个合成方法的相似程度相应的属性值R4导出特性值的可靠度K。该材料的合成方法如图15C的例子那样,是材料合成所使用的温度条件。此外,该合成方法也可以不是温度条件,而是材料合成所使用的时间条件或者装置的种类。也即是说,材料的合成方法也可以包括材料合成所使用的温度条件、时间条件和装置的种类中的至少一个。具体而言,该材料的合成方法和其他一个以上的材料的各个合成方法的相似程度越大,属性值R4则表示越大的值。而且,该材料中的特性值的相似度R0越高、且与该材料对应的属性值R4越大,导出部105则导出越大的值作为该材料中的特性值的可靠度K。由此,如果在文献信息D中记述有该特性值的材料利用与其他文献信息D同样的合成方法而合成,那么针对该特性值,能够导出比较高的可靠度K。因此,能够对注重合成方法的用户导出适当的可靠度K。

在本实施方式中,属性信息表示至少一个文献信息D中的、记载有与该属性信息对应的材料的识别信息和特性值的文献信息D的作者作为属性。而且,导出部105使用与该文献信息D的作者的知名度相应的属性值R3导出特性值的可靠度K。具体而言,作者的知名度越高,属性值则表示越大的值。而且,该材料中的特性值的相似度R0越高、且与该材料对应的属性值R3越大,导出部105则导出越大的值作为该材料中的特性值的可靠度K。由此,针对作者的知名度高的文献信息D中记述的特性值,能够导出比较高的可靠度K。因此,能够对注重文献信息D的作者的知名度的用户导出适当的可靠度K。

此外,导出部105也可以使用与该文献信息D的作者和其他一个以上的文献信息D的各个作者是否相同相应的属性值R3a导出特性值的可靠度K。也即是说,也可以使用属性值R3a代替上述的属性值R3。具体而言,上述的其他一个以上的文献信息D的作者中的、与文献信息D的作者不同的作者的数量越多,属性值R3a则表示越大的值。而且,该材料中的特性值的相似度R0越高、且与该材料对应的属性值R3a越大,导出部105则导出越大的值作为该材料中的特性值的可靠度K。由此,针对与其他很多文献信息D的作者不同的作者著作的文献信息D中记述的特性值,能够导出比较高的可靠度K。也即是说,如果互不相同的作者著作的很多文献信息D中记述的特性值相似,那么针对这些特性值,导出高的可靠度K。另一方面,即使在很多文献信息D中记述有彼此相似的特性值,如果这些文献信息D由相同的作者所著,那么针对这些特性值,也导出低的可靠度K。因此,能够对注重文献信息D的作者的同一性的用户导出适当的可靠度。

此外,在图15A~图15C的例子中,对于出版年月日、被引用数、作者名以及温度这4个属性中的每一个的偏差被调整,但也可以针对图11或者图12的提取信息表22中包含的其他属性(即第3信息)调整偏差。根据由用户向输入部11的输入操作,图像处理部106既可以增加、也可以减少偏差调整用的滑动条的数量。

在文献信息D是论文的情况下,元数据D2中有可能表示出版年月日、投稿日以及采纳日。在该情况下,提取部101从该元数据D2分别提取投稿日以及采纳日作为材料的属性,导出部105也可以使这些属性包含于提取信息表22。而且,导出部105也可以使用与从投稿日到采纳日的期间相应的属性值R5代替上述的基于出版年月日的属性值R1,也可以将该属性值R5与属性值R1一起用于可靠度K的计算。此时,导出部105例如决定该从投稿日到采纳日的期间越短则越接近100、该期间越长则越接近0的值作为属性值R5。而且,导出部105通过包含该属性值R5的加权加法运算,计算可靠度K。

由此,提示考虑了从投稿日到采纳日的期间的可靠度K,因此对于重视那种期间的材料研究人员而言,能够提供有意义的信息。也即是说,在从投稿日到采纳日的期间长的情况下,在与该期间对应的论文中,有可能会基于由审阅者指出的缺陷而反复修正。这种修正的反复可能会成为降低对于论文的可靠度、即对于登载于该论文的材料的特性值的可靠度的主要原因。于是,通过上述这样提示考虑了从投稿日到采纳日的期间的可靠度K,能够提高可靠度K的准确度。

如果杂志名和影响因子(也被称为IF)作为属性而包含于提取信息表22,那么导出部105也可以通过使用基于这些属性的属性值的加权加法运算来计算可靠度K。基于杂志名的属性值是该杂志名的知名度越高则越接近100、知名度越低则越接近0的值。基于IF的属性值是该IF越大则越接近100、IF越小则越接近0的值。

可以说这种杂志名的知名度和IF表示了作为文献信息D的论文的质量。因此,通过使用基于杂志名和IF的属性值,提示考虑了该论文的质量的可靠度K,能够提高可靠度K的准确度。

如果没有从文献信息D提取出杂志名和IF,它们没有作为属性包含于提取信息表22,那么导出部105也可以推定这些属性。例如,导出部105例如使用自然语言处理的工具等,对杂志名和IF已知的文献信息D与它们未知的文献信息D进行比较,判定这些文献信息D的相似度是否在阈值以上。而且,如果该相似度在阈值以上,那么导出部105也可以将已知的杂志名和IF推定为未知的文献信息D的杂志名和IF。由此,针对未知的文献信息D也能够计算准确度高的可靠度K。

在图15A~图15C所示的例子中,导出部105决定材料的温度的相似度作为属性值R4。可是,导出部105也可以决定材料的温度越高则越接近100、温度越低则越接近0的值作为基于该材料的温度的属性值R4。

[处理动作]

图16是表示本实施方式中的信息提供装置100的整体处理动作的一例的流程图。

(步骤S110)

首先,信息提供装置100的提取部101受理根据由用户向输入部11的输入操作而从该输入部11输出的输入信号。该输入信号例如是用于识别存储于文献数据库12的多个文献信息D中的、通过用户的输入操作而选择出的一个以上的文献信息D的信号。例如,该输入信号也可以表示文献信息D的文献ID。

(步骤S120)

接着,提取部101确定根据在步骤S110中受理到的输入信号所识别的一个以上的文献信息D,从这些文献信息D提取多个材料中的每一个的各种信息。该各种信息是指上述的第1信息、第2信息以及第3信息,即材料名、特性值以及属性。材料名是用于识别材料的识别信息。也即是说,提取部101对于多个材料中的每一个,从至少一个文献信息D提取用于识别该材料的识别信息和该材料的特性值。

(步骤S130)

接着,导出部105基于在步骤S120中提取出的多个材料的材料名、特性值以及属性,导出对于各材料的特性值的可靠度。例如,导出部105对于多个材料中的每一个,基于该材料与其他一个以上的材料之间的特性值的相似度,导出该材料的特性值的可靠度。

(步骤S140)

接着,图像处理部106基于在步骤S130中导出的对于各材料的特性值的可靠度,生成将这些特性值以与该可靠度相应的显示方式表示的第1图像。该第1图像例如是图14~图15C所示的特性值图表24。即,图像处理部106生成将多个材料中的每一个的特性值(i)以与针对该材料的特性值而导出的可靠度相应的显示方式表示、且(ii)与该材料的识别信息相关联而表示的第1图像。

(步骤S150)

接着,图像处理部106将在步骤S140中生成的第1图像显示于显示部13。即,图像处理部106将该第1图像向显示部13输出。

图17是表示由提取部101进行的处理的一例的流程图。也即是说,图17是详细表示图16的步骤S120的处理动作的流程图。

(步骤S121)

首先,提取部101从文献数据库12中取得根据上述的输入信号确定的文献信息D。

(步骤S122)

接着,提取部101进行从该文献信息D检索并提取第1信息、即材料名的处理。

(步骤S123)

接着,提取部101判定是否通过步骤S122的处理从文献信息D提取出了材料名。在此,提取部101在判定为没能提取出材料名时(步骤S123:否),重复执行从步骤S121起的处理。在重复步骤S121的处理的情况下,提取部101从文献数据库12中取得未被取得的文献信息D。

(步骤S124)

然后,提取部101在步骤S123中判定为从文献信息D提取出了材料名时(步骤S123:是),从该文献信息D提取第2信息和第3信息。第2信息和第3信息是与已经提取出的材料名对应的材料的特性值和属性。

(实施方式1的变形例)

图18A是表示实施方式1的变形例中的信息提供系统的构成例的框图。此外,对于本变形例中的各构成要素中的、与实施方式1相同的构成要素,赋予与实施方式1相同的标号,并省略详细说明。

如图18A所示,本变形例中的信息提供系统1001具备信息提供装置100、输入部11、文献数据库12、显示部13以及材料特性数据库(DB)14。

材料特性数据库14是对于多个材料中的每一个,预先将该材料的材料名与该材料的特性值和属性相关联而存储的记录介质。这种记录介质是硬盘驱动器、RAM、ROM或者半导体存储器等。此外,该记录介质可以是易失性的也可以是非易失性的。

本变形例中的信息提供装置100的导出部105使用该材料特性数据库14。例如,导出部105针对提取信息表22中表示的多个材料中的每一个的材料名,判定是否关联有特性值和属性。在此,导出部105在针对材料名判定为没有关联特性值和属性时,将该材料名作为处理对象的材料名来处理,并参照材料特性数据库14。而且,导出部105从材料特性数据库14中检索该处理对象的材料名,在材料特性数据库14中提取与该处理对象的材料名相关联的特性值和属性。导出部105将该所提取出的特性值和属性与处理对象的材料名相关联而记录于提取信息表22。

由此,即使不能从存储于文献数据库12的多个文献信息D提取材料的特性值和属性,也能够通过使用材料特性数据库14来填补该特性值和属性。

图18B是表示实施方式1的变形例中的信息提供系统1001的构成的另一例的框图。

信息提供系统1001也可以具备材料数据库15代替图18A所示的材料特性数据库14。材料数据库15是开放存取的数据库,是存储有多个材料中的每一个的各种信息的记录介质。这种记录介质是硬盘驱动器、RAM、ROM或者半导体存储器等。此外,该记录介质可以是易失性的也可以是非易失性的。

导出部105从该材料数据库15中,与提取部101同样地提取与上述的处理对象的材料名对应的特性值和属性。导出部105也可以通过参照该材料数据库15,推定与处理对象的材料名对应的特性值和属性。

(实施方式2)

本实施方式中的信息提供系统1000以及信息提供装置100具有与实施方式1的信息提供系统1000以及信息提供装置100相同的构成。本实施方式中的信息提供装置100除了实施方式1的信息提供装置100的功能、即可靠度导出功能之外,还具有资料显示功能。资料显示功能是将存储于文献数据库12的多个文献信息D中的一部分信息作为资料显示于显示部13的功能。此外,对于本实施方式中的各构成要素中的、与实施方式1相同的构成要素,赋予与实施方式1相同的标号,并省略详细说明。

图19是表示本实施方式中的资料显示画面的一例的图。

用户在通过可靠度导出功能导出了可靠度后,通过进行对输入部11的输入操作,指示信息提供装置100进行资料显示画面40的显示。图像处理部106当从输入部11取得了与该输入操作相应的输入信号时,例如将图19所示的资料显示画面40显示于显示部13。

资料显示画面40包括文献一览窗口21、材料窗口41、资料窗口42、分量调节窗口46以及返回按钮43b。

在文献一览窗口21中,显示存储于文献数据库12的文献信息D的一览。在该一览中,为了导出可靠度而由用户选择出的文献信息D的图标以与没有被选择的文献信息D的图标相区别的形态来显示。

材料窗口41是用于显示由用户输入的材料条件的窗口。材料条件例如是与构成材料的元素种类或者组成等有关的条件。

分量调节窗口46是用于调节所显示的资料的分量的窗口,包括滑动条46a~46f。滑动条46a是用于根据滑块2sa的位置来调节与出版年月日有关的资料被显示的分量的显示要素。滑动条46b是用于根据滑块2sb的位置来调节与传导度有关的资料被显示的分量的显示要素。滑动条46c是用于根据滑块2sc的位置来调节与温度有关的资料被显示的分量的显示要素。滑动条46d是用于根据滑块2sd的位置来调节与结构有关的资料被显示的分量的显示要素。滑动条46e是用于根据滑块2se的位置来调节与研究机构名有关的资料被显示的分量的显示要素。滑动条46f是用于根据滑块2sf的位置来调节与作者名有关的资料被显示的分量的显示要素。

此外,滑块2sa~2sf中的每一个为,该滑块越接近左端则表示越少的分量,越接近右端则表示越多的分量。出版年月日、传导度、温度、结构、研究机构名以及作者名分别是材料的属性。也即是说,这些滑块2sa~2sf用于调节关于出版年月日等各属性所显示的资料的分量的偏差。此外,资料的分量的偏差也被称为该资料的分量的权重。

资料窗口42是用于显示与符合由用户输入的材料条件的材料有关的资料的窗口。在该资料窗口42中,与出版年月日、传导度、温度、结构、研究机构名以及作者名中的每一个有关的资料按照由分量调节窗口46调节出的分量显示。

返回按钮43b是用于使显示于显示部13的资料显示画面40返回到实施方式1的显示画面20或者图表显示画面20a的按钮。

图20是表示本实施方式中的资料显示画面40的另一例的图。

用户通过进行对输入部11的输入操作,输入材料条件,操作滑动条46b的滑块2sb。由此,提取部101取得与该输入操作相应的材料条件。而且,图像处理部106在材料窗口41中显示“Li-Al-La-Zr-O”作为该材料条件。进而,图像处理部106使滑动条46b的滑块2sb移动到右端。此外,滑动条46a及46c~46f的滑块2sa及2sc~2sf位于左端。这种状态的分量调节窗口46意味着在资料窗口42的整体显示与传导度有关的资料。再者,图像处理部106使资料显示按钮43a包含于资料显示画面40而显示。该资料显示按钮43a是用于使资料窗口42显示资料的按钮。

接着,提取部101从由用户选择的文献数据库12内的各文献信息D提取与具有符合材料条件“Li-Al-La-Zr-O”的材料名的材料的传导度有关的信息。具体而言,提取部101首先从实施方式1的提取列表31~34及31a等中检索包含元素种类Li、Al、La、Zr及O的材料名。接着,提取部101从这些提取列表31~34及31a等中确定与该材料名相关联的文献ID和传导度。然后,提取部101从具有该文献ID的文献信息D提取记述有该传导度的图表、图、表或者语句等作为提取图像。

提取部101将包含该文献ID、传导度以及提取图像的信息作为显示信息候选而向导出部105输出。在此,提取部101在通过上述的材料名的检索,找到多个材料名时,对于这些多个材料名中的每一个,进行与上述同样的处理而将显示信息候选向导出部105输出。

导出部105在取得了多个显示信息候选时,基于这些显示信息候选所包含的传导度的可靠度,从该多个显示信息候选中筛选显示信息。也即是说,导出部105从多个显示信息候选中选择包含阈值以上的可靠度的显示信息候选作为显示信息。而且,导出部105将该所选择的一个以上的显示信息向图像处理部106输出。

图像处理部106当从导出部105取得了一个以上的显示信息时,将该一个以上的显示信息组合而生成编辑资料,将该编辑资料显示于资料显示画面40的资料窗口42。

图21是表示显示有编辑资料的资料显示画面40的一例的图。

图像处理部106将编辑资料作为“关于Li-Al-La-Zr-O材料的报告”显示于资料显示画面40。该编辑资料例如是如图21那样表示传导度排名的资料。在图21的例子中,由于与传导度对应的滑动条46b的滑块2sb位于右端,因此与传导度有关的资料显示于资料显示画面40的整体。在传导度排名中,按传导度从高到低的顺序,表示该传导度和记述有该传导度的文献信息D的文献ID。对于第1名和第2名各自的传导度,还附带显示记述有该传导度的图表等提取图像。

此外,图像处理部106也可以使资料显示画面40包含并显示保存按钮43c。该保存按钮43c是用于保存编辑资料的按钮。当通过由用户向输入部11的输入操作,选择了该保存按钮43c时,图像处理部106将该编辑资料保存在设置于信息提供装置100的存储器等记录介质中。

图22是表示显示有编辑资料的资料显示画面40的另一例的图。

接着,用户通过进行对输入部11的输入操作,操作滑动条46a及46c的滑块2sa及2sc。由此,图像处理部106使这些滑块2sa及2sc向右侧移动。例如,与传导度对应的滑块2sb向右侧的移动量最大,与出版年月日对应的滑块2sa以及与温度对应的滑块2sc向右侧的移动量比滑块2sb小。

在该情况下,提取部101从提取列表31~34及31a等中检索与材料条件“Li-Al-La-Zr-O”相应的材料名,确定与该材料名相关联的文献信息D的文献ID、出版年月日、传导度以及温度。而且,提取部101从具有该文献ID的文献信息D提取记述有该传导度的图表、图、表或者语句等作为提取图像。

接着,提取部101将包含该文献ID、材料名、出版年月日、传导度、温度以及提取图像的信息作为显示信息候选而向导出部105输出。在此,提取部101在通过上述的材料名的检索,找到多个材料名时,对于这些多个材料名中的每一个,进行与上述同样的处理而将显示信息候选向导出部105输出。

导出部105在取得了多个显示信息候选时,基于这些显示信息候选所包含的传导度的可靠度,从该多个显示信息候选中筛选显示信息。也即是说,导出部105从多个显示信息候选中选择包含阈值以上的可靠度的显示信息候选作为显示信息。而且,导出部105将该所选择的一个以上的显示信息向图像处理部106输出。

图像处理部106当从导出部105取得了一个以上的显示信息时,将该一个以上的显示信息组合而生成编辑资料,将该编辑资料显示于资料显示画面40的资料窗口42。编辑资料由后述的第1资料、第2资料以及第3资料形成。具体而言,图像处理部106基于分量调节窗口46的滑动条46a~46f的状态,将资料窗口42的总面积中的、1/2的分量分配给传导度,将1/4的分量分配给出版年月日,将剩余1/4的分量分配给温度。而且,图像处理部106在资料窗口42中的左侧的1/2的区域显示表示与图21的例子同样的传导度排名的第1资料。再者,图像处理部106将与传导度和温度有关的图表作为第2资料显示在资料窗口42中的右上侧的1/4的区域,将与传导度和出版年月日有关的图表作为第3资料显示在资料窗口42中的右下侧的1/4的区域。第2资料是将温度表示于横轴、将传导度表示于纵轴的图表,在该图表中的与各材料的温度及传导度对应的位置上画有点。而且,该位置上也可以附有材料名。第3资料是将出版年月日表示于横轴、将传导度表示于纵轴的图表,在该图表上画有多个点。该多个点中的每一个被画在与记述有材料的文献信息D的出版年月日及传导度对应的位置上。该位置上也可以附有材料名。

图23是表示显示有编辑资料的资料显示画面40的另一例的图。

用户通过进行对输入部11的输入操作,从图19的分量调节窗口46的状态,操作滑动条46a及46d~f的滑块2sa及2sd~2sf。由此,图像处理部106使这些滑块2sa及2sd~2sf向右侧移动。例如,与结构对应的滑块2sd向右侧的移动量最大,与出版年月日对应的滑块2sa、与研究机构名对应的滑块2se以及与作者名对应的滑块2sf向右侧的移动量比滑块2sd小。

在该情况下,提取部101从提取列表31~34及31a等中检索与材料条件“Li-Al-La-Zr-O”相应的材料名,确定与该材料名相关联的文献信息D的文献ID、出版年月日、传导度、结构、研究机构名以及作者名。而且,提取部101从具有该文献ID的文献信息D提取记述有该结构的图表、图或者表等作为提取图像。

提取部101将包含该文献ID、出版年月日、传导度、结构、研究机构名、作者名以及提取图像的信息作为显示信息候选而向导出部105输出。在此,提取部101在通过上述的材料名的检索,找到多个材料名时,对于这些多个材料名中的每一个,进行与上述同样的处理而将显示信息候选向导出部105输出。

导出部105在取得了多个显示信息候选时,基于这些显示信息候选所包含的传导度的可靠度,从该多个显示信息候选中筛选显示信息。也即是说,导出部105从多个显示信息候选中选择包含阈值以上的可靠度的显示信息候选作为显示信息。而且,导出部105将该所选择的一个以上的显示信息向图像处理部106输出。

图像处理部106当从导出部105取得了一个以上的显示信息时,将该一个以上的显示信息组合而生成编辑资料,将该编辑资料显示于资料显示画面40的资料窗口42。编辑资料由后述的第4资料、第5资料以及第6资料形成。具体而言,图像处理部106基于分量调节窗口46的滑动条46a~46f的状态,将资料窗口42的总面积中的、1/2的分量分配给结构以及出版年月日,将1/4的分量分配给作者名,将剩余1/4的分量分配给研究机构名。而且,图像处理部106在资料窗口42中的左侧的1/2的区域显示按出版年月日的顺序表示各材料的结构的提取图像的第4资料。再者,图像处理部106将与作者名有关的信息作为第5资料显示在资料窗口42中的右上侧的1/4的区域,将与研究机构名有关的信息作为第6资料显示在资料窗口42中的右下侧的1/4的区域。

在第4资料中,文献信息D的出版年月日越早,该文献信息D中记述的结构的提取图像越被配置在开头侧。该提取图像上也可以附有文献ID以及出版年份。

第5资料表示在由图像处理部106取得的一个以上的显示信息所包含的一个以上的作者名中,知名度为第1、2、3名的3位作者的名称、和与该3位作者关联的信息。图像处理部106例如也可以参照表示多个作者的知名度和与这些作者有关的信息的作者数据,生成第5资料。作者数据既可以保存于经由互联网等通信网而与信息提供装置100连接的服务器,也可以保存于图像处理部106或者信息提供装置100。

第6资料表示在由图像处理部106取得的一个以上的显示信息所包含的一个以上的研究机构名中,知名度为第1、2名的研究机构的名称、和与该两个研究机构关联的信息。图像处理部106例如也可以参照表示多个研究机构的知名度和与这些研究机构有关的信息的研究机构数据,生成第6资料。研究机构数据既可以保存于经由互联网等通信网而与信息提供装置100连接的服务器,也可以保存于图像处理部106或者信息提供装置100。

如此,在本实施方式中,提取部101取得材料条件,对于符合该材料条件的一个以上的材料中的每一个,从至少一个文献信息D提取与该材料有关的信息作为显示信息候选。而且,图像处理部106取得材料的多种属性中的每一种的权重。多种属性中的每一种的权重例如是出版年月日、传导度、温度、结构、研究机构名以及作者名各自的权重或者偏差。接着,图像处理部106从由提取部101提取出的多个显示信息候选中选择一个以上的与具有被导出了阈值以上的可靠度的特性值的材料对应的显示信息候选并分别作为显示信息。而且,图像处理部106生成将一个以上的显示信息中的、与该多种属性中的每一种对应的显示信息仅表示与该多种属性中的每一种的权重相应的分量的第2图像,并将该第2图像向显示部13输出。第2图像例如是图21~23所示的资料显示画面40或者资料窗口42内的编辑资料。

由此,通过调节多种属性中的每一种的权重即偏差,能够变更第2图像所表示的、与多种属性中的每一种对应的显示信息的分量。因此,用户能够按各属性任意地调整显示信息的分量,以使得多显示与用户感兴趣的属性有关的显示信息,少显示与用户不感兴趣的属性有关的显示信息。再者,这些所显示的显示信息是与可靠度为阈值以上的材料有关的信息,因此,用户能够放心地将这些显示信息用于材料研究等工作。显示符合材料条件的材料的显示信息,该材料条件例如是与材料所包含的元素种类或者材料的组成有关的条件。由此,能够将所显示的一个以上的显示信息限定于用户感兴趣的材料。在本实施方式中,由于能够自动生成与用户的期望相应的编辑资料作为技术资料,因此能够削减制作技术资料所花费的工作量。

图24是表示本实施方式中的信息提供装置100的整体处理动作的一例的流程图。

(步骤S210)

首先,信息提供装置100进行可靠度导出处理。该可靠度导出处理如实施方式1那样是导出对于多个材料中的每一个的特性值的可靠度的处理,可以包括图16的步骤S110~S130的处理,也可以包括步骤S110~S150的处理。

(步骤S220)

提取部101根据由用户向输入部11的输入操作而取得材料条件。再者,图像处理部106根据由用户向输入部11的输入操作而取得多种属性中的每一种的偏差。

(步骤S230)

接着,提取部101检索与在步骤S220中取得的材料条件相符的材料名。例如,提取部101从在步骤S210的可靠度导出处理中生成的提取列表31~34及31a等中检索该材料名。

(步骤S240)

接着,提取部101对于在步骤S230中检索出的一个以上的材料名中的每一个,生成与该材料名有关的显示信息候选。也即是说,提取部101从提取列表31~34及31a等中确定包含与该材料名相关联的文献ID的各种信息。此外,该各种信息包含具有该材料名的材料的特性值。再者,提取部101从具有该文献ID的文献信息D提取记述有该各种信息的图表、图、表或者语句等作为提取图像。而且,提取部101生成包含该文献ID、各种信息以及提取图像的信息作为显示信息候选。

(步骤S250)

接着,导出部105在取得了多个显示信息候选时,基于这些显示信息候选所包含的传导度的可靠度,从该多个显示信息候选中筛选显示信息。也即是说,导出部105从多个显示信息候选中选择包含阈值以上的可靠度的显示信息候选作为显示信息。

(步骤S260)

接着,图像处理部106当从导出部105取得了一个以上的显示信息时,将该一个以上的显示信息组合而生成第2图像。也即是说,图像处理部106生成将该一个以上的显示信息中的、与多种属性中的每一种对应的显示信息仅表示与在步骤S220中取得的该多种属性中的每一种的偏差相应的分量的第2图像。

(步骤S270)

然后,图像处理部106将该所生成的第2图像显示于显示部13。

以上,基于上述各实施方式以及变形例,对一个或多个技术方案涉及的信息处理装置进行了说明,但本公开并非限定于这些实施方式以及变形例。只要不脱离本公开的主旨,对上述各实施方式以及变形例实施本领域技术人员能想到的各种变形而得到的方式、对不同的实施方式或者不同的变形例中的构成要素进行组合而结构的方式也包含在本公开的范围内。

例如,在上述各实施方式以及变形例中,文献信息D是论文的电子数据,但也可以是教科书、杂志或者专利文献等的电子数据。

在上述各实施方式以及变形例中,信息提供装置100例如作为个人计算机等一个装置而构成,但也可以由多个装置构成。在该情况下,提取部101、第1信息处理部102、第2信息处理部103、第3信息处理部104、导出部105以及图像处理部106并非设置于同一装置,而是分散地配置于多个装置。

上述各实施方式中的图13~图15C以及图21~图23所示的各画面中不包含图2A和图2B的文献一览窗口21,但也可以包含该文献一览窗口21。在该情况下,用户通过进行对输入部11的输入操作,既可以解除该文献一览窗口21内的文献信息D的图标的选择,也可以选择新的图标。根据该选择以及选择的解除,图像处理部106也可以将特性值图表24或者资料窗口42更新。

在上述各实施方式以及变形例中,由提取部101提取的材料的特性值及属性的类别也可以根据由用户向输入部11的输入操作来指定。也即是说,提取部101也可以从输入部11取得输入信号,从文献信息D提取由该输入信号表示的类别的特性值及属性。其结果,提取部101例如也可以提取密度等以代替材料的传导度作为特性值。提取的特性值及属性的类别也可以预先确定。

在上述实施方式2中,基于特性值的可靠度,从多个显示信息候选中筛选了显示信息,但也可以不进行该筛选。在该情况下,图像处理部106也可以将由提取部101生成的所有显示信息候选分别作为显示信息来处理,将这些显示信息组合而生成第2图像。

此外,在上述各实施方式以及变形例中,各构成要素也可以由专用硬件构成,或通过执行适合于各构成要素的软件程序来实现。各构成要素也可以通过CPU或者处理器等程序执行部读取记录于硬盘或者半导体存储器等记录介质的软件程序并执行来实现。在此,实现上述各实施方式以及变形例的信息提供装置100的软件程序使计算机执行由图16、图17和图24表示的至少一个流程图所包含的各步骤。

本公开当然不限定于上述各实施方式以及变形例。如下这样的情况也包含于本公开。

(1)上述的各装置是具体而言由微处理器、ROM、RAM、硬盘单元、显示器单元、键盘、鼠标等构成的计算机系统。RAM或者硬盘单元中存储有计算机程序。通过微处理器按照计算机程序工作,各装置实现其功能。在此,计算机程序是为了实现预定的功能而组合多条表示对计算机的指令的命令码而构成的。

(2)构成上述的各装置的构成要素的一部分或者全部也可以由一个系统LSI(Large Scale Integration:大规模集成电路)构成。系统LSI是将多个构成部集成到一个芯片上制造而成的超多功能LSI,具体而言,是包括微处理器、ROM、RAM等而构成的计算机系统。RAM中存储有计算机程序。通过微处理器按照该计算机程序工作,系统LSI实现其功能。

(3)构成上述的各装置的构成要素的一部分或者全部也可以由能够装卸于各装置的IC卡或者单体模块来构成。该IC卡或者模块是由微处理器、ROM、RAM等构成的计算机系统。该IC卡或者模块也可以包括上述的超多功能LSI。通过微处理器按照计算机程序工作,该IC卡或者模块实现其功能。该IC卡或者该模块也可以具有防篡改性能。

(4)本公开也可以为上述所示的方法。既可以是由计算机实现这些方法的计算机程序,也可以是由计算机程序而成的数字信号。

本公开也可以将该计算机程序或者数字信号记录于计算机可读记录介质、例如软盘、硬盘、CD-ROM、MO、DVD、DVD-ROM、DVD-RAM、BD(Blu-ray(注册商标)Disc)、半导体存储器等。也可以是记录于这些记录介质的数字信号。

本公开也可以经由电信线路、无线或者有线通信线路、以互联网为代表的网络、或者数据广播等传送该计算机程序或者数字信号。

本公开也可以为具备微处理器和存储器的计算机系统,该存储器存储有上述的计算机程序,该微处理器按照计算机程序工作。

也可以通过将程序或者数字信号记录于记录介质而移送,或者将程序或者数字信号经由网络等进行移送,从而由独立的其他计算机系统实施。

(其他)

本公开的一个技术方案涉及的装置也可以是如下所示的装置。

一种装置,具备:

提取部,其从至少一个文献中提取多个材料名、第1特性的多个值、和第2特性的多个值;

导入部,其计算多个距离,所述多个距离中的每一个是n个不同的坐标所包含的2个不同的坐标间的距离,所述n是2以上的自然,

所述n个不同的坐标是与第1材料名对应的第1坐标、~、与第n材料名对应的第n坐标,

所述第1坐标是所述第1特性的第1值与所述第2特性的第1值的组、~、所述第n坐标是所述第1特性的第n值与所述第2特性的第n值的组,

所述多个材料名包括所述第1材料名、~、所述第n材料名,

所述第1特性的多个值包括所述第1特性的第1值、~、所述第1特性的第n值,

所述第2特性的多个值包括所述第2特性的第1值、~、所述第2特性的第n值;以及

图像处理部,其基于所述计算出的多个距离,决定所述第1坐标、~、所述第n坐标中的每一个的在二维平面上的显示方式,将所述决定的对于所述第1坐标的显示对应、~、所述决定的对于所述第n坐标的显示对应输出到显示部。

第1材料名、~、第n材料名也可以是图11所示的最终材料名一列中记载的多个最终材料名。

第1特性的第1值、~、第1特性的第n值也可以是图11所示的传导度值一列中记载的多个值。

第2特性的第1值、~、第2特性的第n值也可以是图11所示的活化能值一列中记载的多个值。

第1坐标、~第n坐标也可以是将图11中的与ID=001对应的活化能值作为x轴坐标值且将传导度值作为y轴坐标值的坐标、~、将与ID=n(未图示)对应的活化能值作为x轴坐标值且将传导度值作为y轴坐标值的坐标。

第1坐标、~、第n坐标也可以是图13中的由×示出的多个坐标。

第1坐标、~、第n坐标各自的显示方式也可以是图14中的多个圆形各自的内部所示的浓度(圆形内部的点的个数)。

多个距离也可以是图11中的、与文献ID=001对应的二维数据(活化能值、传导度值)和与文献ID=002对应的二维数据(活化能值、传导度值)的距离、~、与文献ID=001对应的二维数据(活化能值、传导度值)和与文献ID=n(未图示)对应的二维数据(活化能值、传导度值)的距离、与文献ID=002对应的二维数据(活化能值、传导度值)和与文献ID=003对应的二维数据(活化能值、传导度值)的距离、~、与文献ID=002对应的二维数据(活化能值、传导度值)和与文献ID=n(未图示)对应的二维数据(活化能值、传导度值)的距离、~、与文献ID=(n-1)对应的二维数据(活化能值、传导度值)和与文献ID=n(未图示)对应的二维数据(活化能值、传导度值)的距离。

对于n个不同的坐标的多个距离的个数为n(n-1)/2。

产业上的可利用性

本公开的信息提供装置能够适当地提供与材料有关的信息,对用于进行材料研究、材料开发或者新的材料合成的装置或者系统是有用的。

标号说明

1sa~1sd滑块;2sa~2sf滑块;11输入部;12文献数据库;13显示部;20显示画面;20a图表显示画面;21文献一览窗口;22提取信息表;23a提取开始按钮;23b补充开始按钮;23c图表显示开始按钮;23d可靠度显示按钮;23e返回按钮;23f可靠度非显示按钮;24特性值图表;25a~25d滑动条;31提取列表;31a提取列表;32提取列表;33提取列表;34提取列表;40资料显示画面;41材料窗口;42资料窗口;43a资料显示按钮;43b返回按钮;43c保存按钮;46分量调节窗口;46a~46f滑动条;100信息提供装置;101提取部;102第1信息处理部;103第2信息处理部;104第3信息处理部;105导出部;106图像处理部;D文献信息;D1原文数据;D2元数据。

相关技术
  • 水库大坝智慧监测站的工况状态监测系统
  • 一种基于LabView的水库大坝监测站管理系统
技术分类

06120116333440