学校信息系统中的用户模式监测:日志文件分析与在线免费校餐项目解析
1. 日志文件分析的优势与局限
日志文件分析为研究人员了解系统及其使用情况提供了有用视角,具有一定技术优势:
- 数据存储与管理便利 :日志文件以预定义格式(如扩展通用日志文件格式)存储在机器可读文件中,便于数据管理和新日志文件的追加。
- 系统支持与可调整性 :基于网络的系统通常启用日志文件,且可轻松根据研究人员的需求进行调整。
- 非反应性 :用户在不知情的情况下被监测,避免了因知晓被监督而产生的异常行为。
然而,日志文件分析也存在伦理和隐私问题。伦理问题可通过事后告知用户并移除不同意的用户来解决;隐私问题则与隐私法相关,例如禁止识别用户,服务提供商有时会截断IP地址或标识符字段,这可能会阻碍日志文件分析。
此外,日志文件分析还存在以下三个主要缺点:
| 缺点 | 描述 |
| — | — |
| 数据组合困难 | 由于隐私法,用户通常只能通过IP地址(和浏览器 - 操作系统字段)或额外的标识符字段来识别,这些标识符无法与性别、年龄、职位、收入或教师授课科目等额外数据结合。即使用户同意组合不同数据源,也可能因他们通常不知道自己的内部用户标识符或IP地址而无法实现。 |
| 重要行为识别困难 | 分析的数据时间跨度约为300天,由于数据量大,重要行为可能不是最常见的行为,因此可能会被忽略。常用的统计方法(如序列模式或聚类分析)旨在寻找常见和频繁的模式,而非罕见或独特的模式,这可能导致可用方法与研究目标不匹配。日志文件的正常大小需要定