数据分析:从需求收集到数据运用的全流程指南
立即解锁
发布时间: 2025-09-02 02:05:36 阅读量: 5 订阅数: 26 AIGC 

# 数据分析:从需求收集到数据运用的全流程指南
## 1. 数据结构与准备的重要性
学习构建和准备数据能让分析工作更轻松,甚至挖掘出数据集中的其他潜在价值。在处理数据时,要确保每列代表单一的类别或度量,这样才能对数据提出所需的问题。同时,每列应使用单一的数据类型,以便进行计算和聚合操作,这在数据分析中是常见需求。
## 2. “合适”的数据
开展分析工作时,是否拥有“合适”的数据往往并非取决于可获取的数据,而是取决于所提出的问题。若不清楚所需数据,就几乎不可能给出正确答案。需求即需要借助数据解决的问题和挑战。随着分析能力的提升,我们要学会识别利益相关者的实际需求,然而多种因素常阻碍他们明确表达真实需求,这些因素包括:
- **背景信息**:从数据中寻找答案的人必须理解问题的背景。例如,对于“我们的利润情况如何?”这一简单问题,其答案会因全球宏观经济形势、组织发展阶段以及问题上次提出的时间而大不相同。同时,提问者的个人背景也很重要,若他们未达到目标而面临压力,就需要更具分析性的答案及改进建议;若表现出色,则希望分析能展示他们超出预期的程度。缺乏背景信息,就难以用数据呈现利益相关者的需求。
- **利益相关者的知识水平**:利益相关者的知识水平是能否明确表达需求的关键因素,包括专业知识和数据技能两方面。专业知识影响分析的详细程度,若利益相关者是新入职或通才型管理者,需求可能停留在较高层面,分析就需包含更多背景信息。仅了解数据分析的主题是不够的,了解组织内数据的运作方式、数据分析能达成的目标以及可用于分析的数据,会显著改变需求。数据技能和意识较低的利益相关者难以提出完美的需求,因此需要通过额外提问来判断是否需运用数据技能帮助他们明确实际需求。
- **数据可用性**:若数据不存在,就无法完成数据分析,但当下无法获取数据不代表不能获取。了解组织内存在哪些数据以及其存储位置是一项有价值的能力,能快速定位数据或知晓谁能做到这一点,对有效进行数据沟通至关重要,因为这能减少寻找所需数据的时间。随着更多数据来自外部第三方或基于互联网的来源,能否整合数据用于分析会影响可满足或推动的需求。缺乏相关知识,利益相关者可能因担心数据不可用或显得幼稚而提出更宽泛的问题。
- **软件功能**:即便具备上述所有要素,软件也必须具备满足既定需求的功能。虽然工具常可通过操作来满足需求,互联网上也有很多针对软件特定功能缺失的解决方案,但在设定需求时,软件功能常被低估。不了解组织内软件功能的利益相关者,即便实现某些功能相对容易,也往往不会提出充分利用其功能的要求。许多数据可视化工具比利益相关者最初认为的更具交互性,这导致他们提出更封闭的需求,即只想要特定答案,不愿进行更具探索性的分析。
这些因素的重叠部分也会给理解真实需求和获取所需数据带来挑战:
|挑战类型|具体情况|应对建议|
| ---- | ---- | ---- |
|知识缺失|有数据和工具,但利益相关者缺乏知识,需多次迭代才能明确需求,他们可能在探索数据过程中学习|寻找有经验的人在早期协助完善需求|
|工具是否合适|有数据且利益相关者知识丰富,但软件功能不足,难以满足需求,引入新工具可能有挑战|管理好利益相关者对时间的预期|
|需要数据|没有数据就无法进行数据沟通,若不知数据位置会很沮丧|与组织内其他数据工作者交流,获取不同的数据来源|
## 3. 需求收集
需求收集是决定分析项目成败的关键任务。明确利益相关者的需求(若为个人项目则是自身需求),就能满足项目需求。需求不一定要非常精确,过于精确可能会错过关键见解;但过于宽泛,回答问题又会有困难。有效的需求收集能让我们回答利益相关者未曾想到的问题,很多情况下,我们分析的是从未被研究过的数据,在整理和分析之前,我们并不知道数据会呈现什么结果。记录需求并与利益相关者分享,有助于确认双方对工作内容的共识。
### 3.1 提出正确的问题
了解利益相关者的真实需求关键在于提出正确的问题。利益相关者对主题和数据的了解程度会极大影响我们能否理解他们的真实需求。若利益相关者熟悉数据解决方案,我们更易全面了解他们的目标;若他们的知识不足,就需额外提问以明确真正需求。
以英国某大学为例,规划团队负责确保大学在下一学年达到招生容量。在英国,学生能否进入大学取决于高中成绩,部分学生可能未达到成绩要求,导致某些课程有空缺。规划经理 Vicky 提出需求:“制作一个仪表盘,展示全校学生数量与可用名额的对比情况。”乍看之下,这个需求合理且可实现,可能只需获取以下汇总数据:
- 有多少学生达到成绩要求并确认入学?
- 有多少学生未达到成绩要求?
- 有多少学生尚
0
0
复制全文
相关推荐









