移动应用需求分析与分类的前沿方法
立即解锁
发布时间: 2025-09-07 00:27:19 阅读量: 10 订阅数: 12 AIGC 


大数据技术与应用研究
# 移动应用需求分析与分类的前沿方法
## 1. 聚类模型在需求变更影响分析中的应用
### 1.1 聚类模型的作用
在大规模系统(ULS)运行过程中,为了检测特定需求是否发生变化或被删除,并找出可能受影响的自动发现或依赖的需求集,采用了 k - 均值聚类算法。通过该算法,可以将需求分配到不同的聚类中,每个聚类至少包含一个到 n 个需求。
### 1.2 聚类结果展示
以下是相关的聚类结果展示:
- **需求分配到聚类**:如图 10 所示,展示了需求如何分配到各个聚类中。
- **聚类大小**:图 11 呈现了不同聚类的大小情况。
- **聚类示例**:图 12 给出了聚类 0 及其分配的需求 ID 的示例。
- **单个需求变更的影响**:图 13 显示,如果某个特定需求发生变化,同一聚类中的所有相关需求都有相同的传播概率,因为它们属于同一个聚类。
### 1.3 聚类模型的优势
该聚类模型具有以下显著优势:
- **灵活性高**:由于对书面文本需求的结构、变更请求、需求关系类型的形式语义以及系统的领域知识都没有严格控制,模型依然能够展现出良好的效果。
- **可扩展性强**:作为无监督预测模型,没有预定义的训练数据集,因此可以根据需要进行扩展。
- **批量处理能力**:能够同时处理大量的变更,不受语句数量的限制。
### 1.4 模型实现与任务流程
该模型在 RapidMiner 上实现,这是一个用于机器学习、数据挖掘、文本挖掘、预测分析和商业分析的应用程序。模型中的每个功能在工具中都由一个或多个任务表示。任务流程如下:
1. 读取需求和变更存储库。
2. 应用相似性模型。
3. 最后通过表格展示每个变更与需求之间的距离值,提供分析结果。
## 2. 埃及移动应用阿拉伯语俚语用户需求评论的关键词提取与分类方法
### 2.1 研究背景与意义
随着移动应用市场的普及和收入的增加,应用商店成为了移动应用分发和获取的重要平台。大多数移动应用平台都提供了用户评论功能,用户可以对应用进行评价、评论和评分,这为开发者提供了重要的反馈。然而,目前的移动应用平台在帮助开发者系统地收集、整理和分类用户反馈以识别用户需求方面提供的支持有限。因此,自动、系统地识别和分类移动应用用户评论中的需求对于移动应用开发中的需求获取和分析具有重要意义。
### 2.2 研究贡献
提出了一种自动方法,用于从埃及移动应用阿拉伯语俚语评论(MASR)中识别需求信息,并将其分类为功能需求(FR)、非功能需求(NFR)、情感需求(SR)和其他无法归类为 FR、NFR 或 SR 的需求。该方法重点在于应用推荐的埃及关键词选择,以识别和分类主要需求的子类别,具体如下:
- **功能需求(FR)**:包含功能请求、错误报告和更新等。
- **非功能需求(NFR)**:包括安全、性能、可用性、频率和响应时间等。
- **情感需求(SR)**:包括满意用户和不满意用户。
### 2.3 相关工作对比
在软件工程项目中,关于移动应用商店分析的研究众多,但大多数集中在分析用户评论中的特征信息及其与其他因素(如代码、评级、价格和下载量)的关系。与其他研究相比,本研究的独特之处在于将移动应用商店评论的挖掘与需求工程相结合,旨在帮助开发者更好地满足需求的演变过程。以下是一些相关研究及其与本研究的对比:
| 研究人员 | 研究内容 | 与本研究的差异 |
| --- | --- | --- |
| Finkelstein 等 | 提出提取特征的技术,用于估计移动应用的价格 | 本研究专注于从移动应用评论中提取用户需求 |
| Villarroel 等 | 将评论分类为新功能建议、错误报告等类型,并聚类相似评论 | 本研究旨在识别和分类多种需求类别 |
| Guzman 等 | 利用特征和情感方法引出用户对移动应用的各种意见 | 本研究更注重需求的分类 |
| 其他众多研究 | 涉及挖掘用户评论以获取不同信息 | 本研究针对阿拉伯语俚语评论进行需求分类 |
### 2.4 提出的方法流程
提出了一种自动化方法,用于从移动应用阿拉伯语俚语评论(特别是埃及评论)中识别和分类需求,该方法包括四个阶段:MASR 收集、预处理、关键词提取、需求识别和分类以及需求分类。具体流程如下:
```mermaid
graph LR
A[MASR 收集] --> B[预处理]
B --> C[关键词提取]
C --> D[需求识别和分类]
D --> E[需求分类]
```
#### 2.4.1 阶段一:埃及移动应用阿拉伯语俚语评论(MASR)收集
该阶段根据三个主要步骤引出 MASR,具体如下表所示:
| 步骤 | 详情 |
| --- | --- |
| 刮取 | - 刮取工具:应用 Appbot 刮取工具<br> - 应用商店:选择特定的应用商店(Google Play 商店) |
| 移动应用分类 | - 应用类别:选择 9 种不同类别的移动应用(社交、生活方式、旅行与本地、购物、工具、医疗、生产力、教育、地图与导航)<br> - 应用评级:选择在 Google Play 商店中评级超过 4 分的移动应用,以确保评论质量,满足用户需求 |
| 过滤 | 过滤不符合要求的评论,确保数据的有效性和相关性 |
## 2.4.2 阶段二:预处理
在收集到 MASR 后,需要对其进行预处理,以提高后续分析的准确性和效率。预处理主要包括以下几个步骤:
1. **文本清洗**:去除评论中的特殊字符、标点符号、HTML 标签等无用信息,将文本转换为纯文本形式。
2. **分词**:将评论中的句子分割成单个的词语或术语,便于后续的分析和处理。
3. **去除停用词**:停用词是指在文本中频繁出现但对文本含义贡献较小的词语,如“的”“是”“在”等。去除停用词可以减少数据的噪声,提高分析的准确性。
4. **词干提取**:将词语还原为其词干形式,例如将“running”还原为“run”,可以减少词汇的多样性,提高分析的效率。
### 2.4.3 阶段三:关键词提取
关键词提取是识别和分类需求的关键步骤。本方法采用了一组技术,包括词频 - 逆文档频率(TF - IDF)、词袋模型(BOW)和自然语言处理(NLP)技术,并结合推荐的埃及关键词选择,来提取与需求相关的关键词。具体步骤如下:
1. **计算 TF - IDF 值**:TF - IDF 是一种衡量词语在文档中重要性的统计方法。通过计算每个词语的 TF - IDF 值,可以确定哪些词语在评论中具有较高的重要性。
2. **构建词袋模型**:词袋模型将文本表示为一个词语的集合,忽略词语的顺序和语法结构。通过构建词袋模型,可以将评论转换为向量形式,便于后续的机器学习和深度学习分析。
3. **应用 NLP 技术**:利用 NLP 技术,如词性标注、命名实体识别等,进一步分析评论中的词语和句子结构,提取与需求相关的信息。
4. **选择推荐的埃及关键词**:根据埃及移动应用的特点和用户需求,选择一组推荐的埃及关键词,用于识别和分类需求。
### 2.4.4 阶段四:需求识别和分类
在提取关键词后,需要根据关键词来识别和分类需求。本方法采用了分类器链(CC)方法,将多标签分类问题转换为一个或多个单标签分类问题,并利用混合堆叠分类模型,结合机器学习(ML)和深度学习(DL)方法,包括逻辑回归(LR)、随机森林(RF)和多层感知器神经网络(MLP - NN),来实现需求的识别和分类。具体步骤如下:
1. **转换多标签分类问题**:使用分类器链方法,将多标签分类问题转换为一系列单标签分类问题,每个分类器负责预测一个标签。
2. **训练混合堆叠分类模型**:使用训练数据集,训练混合堆叠分类模型,包括逻辑回归、随机森林和多层感知器神经网络。
3. **预测需求类别**:使用训练好的模型,对新的评论进行预测,识别和分类需求类别。
### 2.4.5 需求分类结果
通过上述方法,对埃及 MASR 用户需求进行分类,取得了较高的准确性结果:
| 需求类别 | 分类准确率 |
| --- | --- |
| 性能 | 99.7% |
| 不满意用户 | 99.5% |
| 其他 | 98.8% |
| 安全 | 98.1% |
| 可用性 | 97.9% |
| 功能请求 | 97.4% |
## 3. 总结与展望
### 3.1 研究总结
本文介绍了两种在移动应用需求分析和分类方面的前沿方法。聚类模型通过 k - 均值聚类算法,在大规模系统需求变更影响分析中发挥了重要作用,具有灵活性高、可扩展性强和批量处理能力等优势。而针对埃及移动应用阿拉伯语俚语评论的关键词提取与分类方法,通过四个阶段的自动化流程,成功地将需求分类为功能需求、非功能需求、情感需求和其他需求,取得了较高的分类准确率。
### 3.2 未来展望
未来的研究可以在以下几个方面进行拓展:
1. **模型优化**:进一步优化聚类模型和分类模型,提高模型的准确性和效率。可以尝试使用更先进的机器学习和深度学习算法,或者结合更多的特征和数据进行训练。
2. **跨语言应用**:将方法扩展到其他语言的移动应用评论分析中,以满足全球移动应用市场的需求。
3. **实时分析**:实现对移动应用评论的实时分析,及时发现用户需求的变化,为开发者提供更及时的反馈。
4. **与其他系统集成**:将需求分析和分类方法与移动应用开发的其他环节集成,如项目管理、测试等,实现更全面的需求管理。
通过不断地研究和改进,这些方法将为移动应用开发者提供更有效的需求分析和分类工具,帮助他们更好地满足用户需求,提高移动应用的质量和用户满意度。
0
0
复制全文
相关推荐










