在SPSS Modeler中,业务理解是数据项的第一步,读取数据是用户开始工作的第一步。
SPSS Modeler源节点可以访问平面文件、IBM SPSS Statistics(.sav)、SAS、Microsoft Excel和ODBC兼容的关系数据库。也可以使用用户输入节点生成复合数据。Modeler内部包含足够的案例数据文件,可以在安装目录中找到Demos文件夹。
示例:Demos文件下的' bank _ cu的Excel数据文件。
Excel源节点
使用Excel源节点在Microsoft Excel中。可以以xlsx文件格式输入数据。
1.1数据
1.11文件类型选择要导入的Excel文件类型。
1.12导入文件指定要导入的电子表格文件的名称和位置。
1.13使用指定的范围选择此选项可指定在Excel工作表中定义的单元格的指定范围。省略按钮(.)从可用范围列表中选择。使用命名范围时,其他工作表和数据范围设置不再可用,最终被禁用。
1.14选择工作表按索引或名称指定要导入的工作表。
指定要按索引导入的工作表的索引值。第一个工作表以0开始,第二个工作表以1开始,依此类推。
按名称指定要导入的工作表的名称。省略按钮(.),从可用工作表列表中选择。
1.15工作表范围可以从导入数据开始导入第一个非空行,也可以通过单元格的显式范围导入数据。
范围从第一个非空单元格开始,找到第一个非空单元格,并将该单元格用作数据范围左上角的单元格。
单元格的显式范围选择此选项可以按行和列指定显式范围。例如,要指定Excel范围A1:D5,可以在第一个字段中输入A1,在第二个字段中输入D5,(或R1C1和R5C4)。返回指定范围内的所有行,包括空行。
对于1.16空行,如果出现多个空行,则可以选择停止读取或返回空行,继续读取工作表末尾的所有数据(包括空行)。
第一行包含列名意味着必须使用指定范围内的第一行作为字段(列)名。如果不选择此选项,将自动生成字段名。
1.2过滤器
实现字段删除和字段重命名。
1.3类型
实现现场测量级别和现场角色定义。
1.4注释
向节点添加所需的注释和关键字。
1.5场存储和测量级别
从Excel读取值时,默认情况下,存储为数字值的字段将以连续测量级别读取,以名称存储为字符串的字段以名称读取。在“类型”选项卡上,您可以手动更改度量级别(连续和名义),但存储类型将自动确定(如果需要,可以使用过滤器节点或导出节点上的转换函数(如to_integer)进行更改)。
默认情况下,按数字类型读取数字和字符串值混合的已保存字段。也就是说,IBM SPSS Modeler中的所有字符串值都设置为null(缺少系统)值。这是因为与Excel不同,IBM SPSS Modeler不允许在字段中使用混合存储类型。为了避免此问题,您可以在Excel电子表格中手动将单元格格式设置为文本,以便将所有值(包括数字)作为字符串读取。
1.《【sas怎么引入excel】SPSS Modeler将读取Excel文件数据》援引自互联网,旨在传递更多网络信息知识,仅代表作者本人观点,与本网站无关,侵删请联系页脚下方联系方式。
2.《【sas怎么引入excel】SPSS Modeler将读取Excel文件数据》仅供读者参考,本网站未对该内容进行证实,对其原创性、真实性、完整性、及时性不作任何保证。
3.文章转载时请保留本站内容来源地址,https://www.lu-xu.com/keji/2501408.html