0人评价
(0)人学习
一、项目背景
随着信息时代互联网技术的高速发展,越来越多的消费者已经习惯于在餐饮外卖平台上订餐。现有某个餐饮外卖平台,向广大用户提供网上订餐服务。当平台订餐完成后,平台会引导用户对于品尝过的菜品进行评价打分。运营方发现老用户的下单率呈现下降态势,为了提升老用户的活跃度和忠诚度,市场部门则提出加强与老用户的互动建议,希望针对老用户进行个性化的菜品推荐,包括用户的偏爱菜品及新菜品。
要实现菜品推荐,首先考虑的就是建立推荐系统。与搜索引擎不同,推荐系统并不需要用户提供明确的需求,而是通过分析用户的历史行为,主动为用户推荐能够满足他们兴趣和需求的信息。依据后台网站的海量数据,研究用户的兴趣偏好,分析用户的需求和行为,发现用户的兴趣点。尤其是将长尾产品(指餐饮外卖平台中热销菜品以外的菜品,它们总体数量大,但单位销量少)准确地推荐给所需要的用户。
因此,根据近期用户对菜品的评分历史数据,建立菜品推荐模型,向用户们提供菜品推荐,从而满足用户们的个性化或差异性的口味,提高餐饮外卖平台的利润。
二、项目目标
通过对用户对菜品的评分历史数据进行存储与分析挖掘,建立推荐模型,实现向用户们提供菜品推荐。项目技术目标如下。
(1) 读取用户评分历史数据。
(2) 分析用户评分历史数据的记录数、分布情况和数据重复情况。
(3) 处理用户评分历史数据中的重复评分数据。
(4) 对处理后的用户数据与菜品数据进行数据编码。
(5) 将数据编码之后的数据划分为训练集、验证集和测试集。
(6) 分别构建基于物品、基于用户、基于Spark ALS的推荐模型实现用户与菜品之间的推荐。
说明:以上技术目标仅供参考,具体分析方向可自定,需结合实际需求。
三、项目实现步骤
步骤一:了解项目背景与目标
步骤二:数据读取
(1) 启动Hadoop集群与Spark集群。
(2) 启动MySQL以及数据仓库Hive。
(3) 在Spark Shell中读取用户评分历史数据。
步骤三:数据探索与预处理
(1) 分析用户评分历史数据的记录数、分布情况和数据重复情况。
(2) 处理用户评分历史数据中的重复评分数据。
(3) 对处理后的用户数据与菜品数据进行数据编码。
(4) 将数据编码之后的数据划分为训练集、验证集和测试集。
步骤四:模型构建与推荐
分别构建基于物品、基于用户、基于Spark ALS的推荐模型实现用户与菜品之间的推荐。