没有合适的资源?快使用搜索试试~ 我知道了~
yelp-review-rating-prediction:针对Yelp数据集挑战的LDA,TF-IDF和机器学习模型

共4个文件
ipynb:3个
md:1个

需积分: 49 10 下载量 181 浏览量
2021-05-24
18:15:33
上传
评论
收藏 585KB ZIP 举报
温馨提示
Yelp评论评级预测 概括 该项目的目的是使用评论文字来预测Yelp上的评论星级。 我们构建了以下模型,这些模型对评论数据进行文本分析以预测星级。 基准模型:最普遍的评级为3星,是该模型针对所有评论所预测的评级。 词频模型:在此模型中,我们使用单词出现的频率来预测评论等级。 LDA +情感模型:此模型通过使用潜在的狄利克雷分配(LDA)和附加的情感层,通过从评论文本中提取与评论相关的主题和情感来预测评分。 NMF +情感模型:在此模型中,我们通过从评论文本中提取与评论相关联的主题和情感,使用非负矩阵因子分解(NMF)预测评论评分,并使用附加的情感层。 我们在评估评论星级时达到了61%的准确性。 代码 大多数文件是IPython笔记本(带有JSON数据的.ipynb扩展名)。 在至少一个示例中使用以下模块: Python 2.7 NumPy 大熊猫 西皮 scikit学习
资源推荐
资源详情
资源评论

























收起资源包目录






共 4 条
- 1
资源评论


皮卡学长
- 粉丝: 88
上传资源 快速赚钱
我的内容管理 展开
我的资源 快来上传第一个资源
我的收益
登录查看自己的收益我的积分 登录查看自己的积分
我的C币 登录后查看C币余额
我的收藏
我的下载
下载帮助


最新资源
- 一、体系架构、模型设计方案、数据挖掘研究员---北京科技.doc
- 基于AMA物联网无线覆盖智慧城市解决方案.docx
- 电商案例分析慧聪网网络模式基本情况运营模式存在问题新发展.ppt
- 营改增全面实施对互联网企业的影响与对策.docx
- 电力行业信息系统安全等级保护基本要求三级.doc
- 大数据时代对社会公德的影响.docx
- 电气工程及其自动化技术的设计与应用.docx
- 长沙移动TDLTE网络技术交流汇报.ppt
- “三网融合与网络优化”赛项规程.doc
- 档案信息化过程中的主要问题及对策.docx
- AI+才是人工智能的真意所在.docx
- 物联网技术在食品安全溯源的应用与实现.docx
- 汽车电子商务中的网络安全问题研究.doc
- PLC课程设计方案(青岛理工)(自动门控制-全自动洗衣机控制).doc
- 项目投资商务合作互联网金融优秀ppt模板课件【精选模板】.ppt
- 上信息完整项目管理师上午试卷.doc
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈



安全验证
文档复制为VIP权益,开通VIP直接复制
