2018用什么工具打包cpk?
目前市面上能够打包Cpk的工具很多,但是大部分都需要付费使用(买断制、订阅制或者授权制)。 作为在数据挖掘领域深耕多年的企业,SAS在预测分析、数据挖掘、优化等各个领域都拥有非常完善的产品线,并可以帮助用户轻松实现模型的转换与部署,从而为用户提供智能决策支持。 在数据分析过程中,通过简单的拖拽就可以快速完成数据处理的SAS 9.4新版本更是深受广大用户的喜爱。今天小优就为大家介绍一下如何通过SAS 9.4来打包Cpm文件。
STEP 1:建立数据集 首先需要建立用于建模的数据集,我们可以使用SAS中的DATA步来生成模拟数据。
这里我们生成一个包含5000个观测值和3个变量的时间序列数据集,其中前1000个观测值为训练集,后4000个观测值为测试集。
STEP 2:选择算法并进行模型搭建 我们使用了主成分分析(Principal Component Analysis)对数据进行降维处理,并将结果保存到数据集对象中。然后选择了基于随机森林的回归方法并建立了模型。
因为时间序列数据本身具有的趋势特点,我们又添加了几余信息(RANDOM_NUMBER()函数生成的随机数)进数据集中以进行插补。最终的数据集如下图所示(仅展示部分数据): STEP 3:模型评估及可视化 我们的最终目标在于对未来情况进行预测,因此需要先对模型的训练精度以及泛化能力进行评估。
上图展示了模型对测试集进行预测时的误差情况,可以看到整体误差较小且符合预期,因此可以继续下一步工作。
为了便于比较,我们同时绘制了随机数和残差图(Residual Plot)。如果图中出现明显异常点,则需要返回到前面步骤检查是否存在错误。
STEP 4:输出预测结果 最后一步可以通过SAS提供的PROC EXPECT功能直接输出预测结果,也可以对原始数据进行压缩再输出。
通过上面简单几步的操作就能够轻松得到符合预期的Cpk文件,是不是很方便呢~感兴趣的小伙伴可以下载SAS软件试一下!