1.Mahout简介
Apache Mahout是一个来自Apache的开源的机器学习软件库。它所实现的算法归属于机器学习。Mahout是可扩展的,旨在当所处理的数据规模远大于单机处理能力时称为一种可选的机器学习工具。Mahout当前仅关注机器学习的三个主要领域,推荐、聚类和分类。
此处给出一个简单的Mahout推荐算法示例,下文将给出详细的解析:
package com.funkyz.mahout;
import java.io.File;
import java.util.List;
import org.apache.mahout.cf.taste.impl.model.file.FileDataModel;
import org.apache.mahout.cf.taste.impl.neighborhood.NearestNUserNeighborhood;
import org.apache.mahout.cf.taste.impl.recommender.GenericUserBasedRecommender;
import org.apache.mahout.cf.taste.impl.similarity.PearsonCorrelationSimilarity;
import org.apache.mahout.cf.taste.model.DataModel;
import org.apache.mahout.cf.taste.neighborhood.UserNeighborhood;
import org.apache.mahout