山东大学机器学习期末计算机学院
时间: 2025-01-09 13:14:42 浏览: 40
### 山东大学计算机学院机器学习期末考试资料
#### 题型分布与重点
山东大学计算机学院的机器学习与模式识别课程在2019-2020学年的第二学期试卷中涵盖了多个部分,具体包括判断题、简答题和综合题。其中:
- **判断题**占总分的24%,用于考察学生对基础知识的理解程度[^1]。
- **简答题**占比最高,达到46%。这部分通常涉及较为深入的概念理解和应用能力测试。
- **综合题**则占据了剩余的30%,旨在评估学生的整体掌握情况以及解决实际问题的能力。
#### 复习建议
对于准备该门课程期末考试的学生来说,可以从以下几个方面着手复习:
- 关注研讨课件后的练习题目,因为这些题目经常出现在正式考卷上[^2]。
- 对于计算类题目,应特别注意决策树构建过程中的评价标准(如熵增益)、误差反向传播机制及其推导、支持向量机(SVM)里的核方法运算等知识点的学习。
- 加强对各类基础公式的记忆并熟练运用它们完成相应类型的解答训练;例如,在处理图像数据时可能涉及到像素级操作或特征提取技术等方面的内容[^3]。
```python
def calculate_entropy(data):
"""
计算给定数据集的信息熵
参数:
data (list): 数据列表
返回:
float: 信息熵值
"""
from math import log2
total = len(data)
label_counts = {}
for item in data:
current_label = item[-1]
if current_label not in label_counts.keys():
label_counts[current_label] = 0
label_counts[current_label] += 1
entropy = 0.0
for key in label_counts:
prob = float(label_counts[key]) / total
entropy -= prob * log2(prob)
return entropy
```
此代码片段展示了如何基于Python实现信息熵的简单计算功能,这有助于理解决策树分裂节点的选择依据之一——最大信息增益原则的应用场景。
阅读全文
相关推荐














