【软件开发经验分享】计算机毕业设计Hadoop+Spark知识图谱体育赛事推荐系统体育赛事热度预测系统体育赛事数据分析体育赛事可视化体育赛事大数据机器学习大数据毕业设计大数据毕设机器学

最新推荐文章于 2025-02-12 08:52:19 发布

转载最新推荐文章于 2025-02-12 08:52:19 发布 · 940 阅读

4 ·

CC 4.0 BY-SA版权

原文链接：https://www.bilibili.com/video/BV1i14y1o76A/?spm_id_from=333.999.0.0

文章标签：

#大数据 #课程设计 #hadoop #大数据毕业设计 #计算机毕业设计 #spark #知识图谱

计算机毕业设计同时被 3 个专栏收录

575 篇文章

订阅专栏

推荐系统

49 篇文章

订阅专栏

python数据分析

40 篇文章

订阅专栏

该文描述了一个综合的技术项目，涉及前端使用vue.js和element-ui，后端用springboot和mybatis，大数据处理采用spark和hadoop，以及多种算法如KNN、CNN和推荐算法。项目亮点包括Spark的大屏可视化、赛事预测、评论情感分析和模拟支付等。此外，还利用Python爬虫、身份证识别API以及知识图谱进行数据获取和处理。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

开发技术

前端：vue.js、element-ui、echarts

后端：springboot、mybatis

大数据：spark、hadoop

数据库：mysql关系型数据库、neo4j图数据库

算法：协同过滤推荐算法、MLP深度学习模型、SVD神经网络混合推荐算法、lstm模型、KNN、CNN、Sklearn、K-Means

第三方平台：百度AI、阿里云短信、支付宝沙箱支付

爬虫：Python chrome-driver

创新点

Spark大屏统计可视化

赛事热度预测(KNN、CNN、Sklearn、K-Means)

4种推荐算法(协同过滤基于用户、基于物品、MLP、SVD、知识图谱推荐)

赛事评论lstm情感分析

模拟沙箱支付购买赛事门票

短信验证码修改密码

百度AI识别身份证

Python爬虫

知识图谱

…10-20种创新点

爬虫代码实现

def getLink(baseurl):
    html = requests.get(baseurl, headers=hea)
    html.encoding = 'utf8'
    soup = BeautifulSoup(html.text, 'html.parser')
    for item in soup.select('div.content_list > ul > li'):
        # 对不符合的数据进行清洗
        if (item.a == None):
            continue
        data = []
        type = item.div.text[1:3]  # 类型
        link = item.div.next_sibling.next_sibling.a['href']
        data.append(type)
        data.append(link)
        links.append(data)

if __name__ == '__main__':
    main()

spark分析代码实现

package com.bigdata.spark.reducebykey_sort

import org.apache.spark.{SparkConf, SparkContext}

/**
 * @program: spark-api-demo
 * @description: 类作用描述
 * @author: 小毕
 * @company: 清华大学深圳研究生院
 * @create: 2019-09-02 18:00
 */
object ReduceByKeySortRddDemo {

  def main(args: Array[String]): Unit = {
    val conf=new SparkConf()
      .setAppName("MapFilterApp")
      .setMaster("local")
    val sc=new SparkContext(conf)
    val rdd1=sc.parallelize(List(("tom", 1), ("jerry", 3), ("kitty", 2),  ("shuke", 1)))
    val rdd2=sc.parallelize(List(("jerry", 2), ("tom", 3), ("shuke", 2), ("kitty", 5)))
    val rdd3=rdd1.union(rdd2)
    //按key进行聚合
    val rdd4=rdd3.reduceByKey(_+_)
    rdd4.collect.foreach(println(_))
    //按value的降序排序
    val rdd5=rdd4.map(t=>(t._2,t._1)).sortByKey(false).map(t=>(t._2,t._1))
    rdd5.collect.foreach(println)
  }

}