Angel深度学习框架中的JSON配置文件详解

宗嫣惠

于 2025-06-06 09:11:19 发布

阅读量287

点赞数 4

本文链接：https://blog.csdn.net/gitblog_00470/article/details/148465768

版权

Angel深度学习框架中的JSON配置文件详解

angel 项目地址: https://gitcode.com/gh_mirrors/ang/angel

引言

在深度学习模型开发过程中，参数配置是一个重要但繁琐的环节。Angel深度学习框架从2.0版本开始引入了JSON配置文件机制，极大地简化了模型参数的配置过程。本文将全面解析Angel框架中JSON配置文件的结构和使用方法，帮助开发者高效地配置和管理深度学习模型。

JSON配置文件概述

Angel的JSON配置文件主要用于以下两个场景：

为已有算法提供参数配置，包括：
- DeepFM
- PNN
- NFM
- Deep and Wide等经典模型
自定义新的神经网络结构，类似于Caffe的prototxt文件

配置文件主要包含五大类参数：

数据相关参数
模型相关参数
训练相关参数
默认优化器和传输函数
网络层定义

数据相关参数详解

数据配置部分定义了模型训练所需的数据特性：

"data": {
    "format": "dummy",
    "indexrange": 148,
    "numfield": 13,
    "validateratio": 0.1,
    "sampleratio": 0.2,
    "useshuffle": true,
    "translabel": "NoTrans",
    "posnegratio": 0.01
}

关键参数说明：

数据格式(format)：支持dense(稠密)、dummy(虚拟)、libsvm三种格式
特征维度(indexrange)：必须指定的参数，表示特征的总维度
域数量(numfield)：特征域的数目，对某些特征交叉算法很重要
验证集比例(validateratio)：划分验证集的比例，注意大数据量时可能OOM
采样比例(sampleratio)：Spark on Angel专用，控制mini-batch采样率
标签转换(translabel)：支持(0,1)到(-1,1)的转换，适用于二分类问题

模型相关参数配置

模型配置部分定义了模型存储和加载的相关参数：

"model": {
    "loadPath": "path_to_your_model_for_loading",
    "savePath": "path_to_your_model_for_saving", 
    "modeltype": "T_DOUBLE_SPARSE_LONGKEY",
    "modelsize": 148
}

重要参数说明：

模型类型(modeltype)：决定参数在参数服务器(PS)上的存储方式，常见类型包括：
- T_DOUBLE_DENSE：双精度稠密存储
- T_FLOAT_SPARSE_LONGKEY：单精度稀疏长键存储等
模型大小(modelsize)：表示有效特征维度，可能与实际特征维度不同

训练参数优化

训练参数控制模型的训练过程：

"train": {
    "epoch": 10,
    "numupdateperepoch": 10,
    "batchsize": 1024,
    "lr": 0.5,
    "decayclass": "StandardDecay",
    "decayalpha": 0.001,
    "decaybeta": 0.9
}

关键训练参数：

学习率(lr)：控制参数更新步长
学习率衰减(decayclass)：支持多种衰减策略
批次大小(batchsize)：Spark on Angel专用，控制mini-batch大小
每轮更新次数(numupdateperepoch)：Angel特有参数，控制参数更新频率

默认优化器与传输函数

优化器配置

Angel支持为不同层配置不同的优化器，配置方式灵活：

"default_optimizer": {
    "type": "Momentum",
    "momentum": 0.9,
    "reg1": 0.0,
    "reg2": 0.0
}

支持简写形式（使用默认参数）和完整形式（自定义参数）。

传输函数配置

大多数传输函数无需参数，少数如Dropout需要额外配置：

"default_transfunc": {
    "type": "Dropout",
    "actiontype": "train",
    "proba": 0.5
}

注意actiontype参数区分训练和预测阶段的不同行为。

网络层定义

Angel中的网络层分为三类：

边缘节点(verge)：输入/输出层
线性节点(linear)：单输入单输出
连接节点(join)：多输入单输出

层定义示例（DeepFM模型）：

"layers": [
    {
      "name": "wide",
      "type": "SimpleInputLayer",
      "outputdim": 1,
      "transfunc": "identity"
    },
    {
      "name": "embedding",
      "type": "Embedding",
      "numfactors": 8,
      "outputdim": 104,
      "optimizer": {
        "type": "momentum",
        "momentum": 0.9,
        "reg2": 0.01
      }
    }
    // 更多层定义...
]

层定义关键点：