开发技术
Hadoop、Spark、SparkSQL、Python、MySQL、协同过滤算法、皮尔逊相关系数、KNN、echarts可视化、阿里云短信接口、支付宝沙箱支付、百度AI身份证自动识别、SpringBoot、Vue.js、MyBatis-Plus
系统创新点
大屏统计可视化
用户网页端(实时推荐)
Python爬虫
机器学习离线计算分析
短信接口修改密码或者注册
支付宝沙箱支付(网页、app都实现了)
身份证自动识别认证
新增知识图谱neo4j
KNN CNN卷积神经预测音乐热度流量
SVD神经网络进行音乐推荐算法实现
代码思路分析
爬虫代码
def getLink(baseurl):
html = requests.get(baseurl, headers=hea)
html.encoding = 'utf8'
soup = BeautifulSoup(html.text, 'html.parser')
for item in soup.select('div.content_list > ul > li'):
# 对不符合的数据进行清洗
if (item.a == None):
continue
data = []
type = item.div.text[1:3] # 类型
link = item.div.next_sibling.next_sibling.a['href']
data.append(type)
data.append(link)
links.append(data)
if __name__ == '__main__':
main()
spark分析代码
package com.bigdata.spark.reducebykey_sort
import org.apache.spark.{SparkConf, SparkContext}
/**
* @program: spark-api-demo
* @description: 类作用描述
* @author: 小毕
* @company: 清华大学深圳研究生院
* @create: 2019-09-02 18:00
*/
object ReduceByKeySortRddDemo {
def main(args: Array[String]): Unit = {
val conf=new SparkConf()
.setAppName("MapFilterApp")
.setMaster("local")
val sc=new SparkContext(conf)
val rdd1=sc.parallelize(List(("tom", 1), ("jerry", 3), ("kitty", 2), ("shuke", 1)))
val rdd2=sc.parallelize(List(("jerry", 2), ("tom", 3), ("shuke", 2), ("kitty", 5)))
val rdd3=rdd1.union(rdd2)
//按key进行聚合
val rdd4=rdd3.reduceByKey(_+_)
rdd4.collect.foreach(println(_))
//按value的降序排序
val rdd5=rdd4.map(t=>(t._2,t._1)).sortByKey(false).map(t=>(t._2,t._1))
rdd5.collect.foreach(println)
}
}
运行截图
运行视频
计算机毕业设计吊打答辩现场hadoop+spark知识图谱音乐推荐系统 音乐预测系统 音乐可视化 音乐数据分析 音乐爬虫 音乐大屏 音乐大数据 大数据毕业设计