apache-spark-1.2相关内容

如何在 Apache Spark 中编码分类特征

我有一组数据,我想根据这些数据创建分类模型.每行具有以下形式: user1,class1,product1用户 1、类别 1、产品 2用户 1、类别 1、产品 5用户 2、类别 1、产品 2用户 2、类 1、产品 5用户 3、类 2、产品 1 大约有 100 万用户、2 个类和 100 万个产品.我接下来想做的是创建稀疏向量(MLlib 已经支持的东西)但是为了应用该函数,我必须首先创建密集向 ..

如何连接Apache中的星火code类别特征

我有一组在此基础上,我想创建一个分类模型数据。每一行都有以下形式: USER1,class1的,产品1 用户1,1级,产品2 用户1,1级,产品5 用户2,1级,产品2 用户2,1级,产品5 用户3,类别2,产品1 有100万左右的用户,2类和1M产品。我想下一步要做的就是创建稀疏向量(由MLlib已经支持的东西),但为了应用该功能我要创建密集向量(与0),第一。换句话说,我要我的二值化数 ..