IBM® SPSS® Statistics 提供了许多构建预测模型的过程。 本示例使用在“直销”选项中可用的“购买倾向”功能。 “购买倾向”构建一个二项 logistic 回归模型,其中兴趣目标结果只有两个可能的结果。 在本例中,收到试验邮寄的联系人要么响应(购买产品),要么未响应(未购买产品)。
您可以使用“回归”附加选项中的 Logistic 回归来构建类似模型。 有关生成预测模型的过程的完整列表,请参阅 使用预测模型对数据进行评分。
以下示例使用两个数据文件:dmdata2.sav 用于构建模型,然后将模型应用到 dmdata3.sav。 请参阅主题 样本文件 以获取更多信息。
打开数据文件 dmdata2.sav。该文件包含收到试验邮寄的人们的各种人口统计学特征,它还包含这些人是否响应邮件的信息。 该信息记录在字段(变量)响应中。 值为 1 表示联系人对邮件做出响应,值为 0 表示联系人未做出响应。
从菜单中选择:直销 > 选择技术
选择选择最有可能购买的联系人,并单击继续。图 1。 “购买倾向:字段”选项卡
对于响应字段,选择已对测试产品做出响应。
对于正响应值,从下拉列表中选择是。 在文本字段中显示值 1,因为"是"实际上是与记录的值 1 相关联的值标签。 (如果正响应值没有定义的值标签,那么您可以在文本字段中输入该值。)
对于“预测倾向”,选择年龄、收入类别、教育、当前地址居住年限、性别、已婚、地区和孩子。
选择(勾选)将模型信息导出到 XML 文件。
单击浏览导航到要用于保存文件的位置,并输入文件名称。
在“购买倾向”对话框中,单击设置选项卡。图 2。 “购买倾向,设置”选项卡
在模型验证组中,选择(选中)验证模型和设置种子以复制结果。
使用缺省的训练样本分区大小 50% 和缺省种子值 2000000。
在“诊断输出”组中,选择(选中)总体模型质量和分类表。
对于“最小可能性”,输入 0.05。 作为一般规则,您必须指定一个接近最低目标响应率的比例值。 值 0.05 表示响应率为 5%。
单击运行以运行过程并生成模型。
NEXT