HMM代码 - HanLP

最新推荐文章于 2021-09-28 21:48:02 发布

DecafTea

最新推荐文章于 2021-09-28 21:48:02 发布

阅读量526

点赞数

分类专栏： NLP # NER 机器学习基础

本文链接：https://blog.csdn.net/DecafTea/article/details/115350532

版权

本文介绍了一种名为汉LPHMM的隐马尔可夫模型，涉及概率计算（观测序列条件概率）、模型参数学习（通过极大似然估计）和预测（维特比算法应用）。该模型用于处理序列数据，包括初始状态概率、状态转移和观测概率的估计及应用实例。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

HanLP HMM 代码，包括概率计算（计算观测序列的条件概率）、学习（最有可能的模型参数）、预测问题（给定观测序列和模型参数，最有可能的状态序列）。

/*
 * <author>Han He</author>
 * <email>[email protected]</email>
 * <create-date>2018-06-09 7:47 PM</create-date>
 *
 * <copyright file="HiddenMarkovModel.java">
 * Copyright (c) 2018, Han He. All Rights Reserved, http://www.hankcs.com/
 * This source is subject to Han He. Please contact Han He for more information.
 * </copyright>
 */
package com.hankcs.hanlp.model.hmm;

import com.hankcs.hanlp.utility.MathUtility;

import java.io.*;
import java.util.ArrayList;
import java.util.Arrays;
import java.util.Collection;
import java.util.List;

/**
 * @author hankcs
 */
public abstract class HiddenMarkovModel
{
   
    /**
     * 初始状态概率向量
     */
    public float[] start_probability;
    /**
     * 观测概率矩阵
     */
    public float[][] emission_probability;
    /**
     * 状态转移概率矩阵
     */
    public float[][] transition_probability;

    /**
     * 构造隐马模型
     *
     * @param start_probability      初始状态概率向量
     * @param transition_probability 状态转移概率矩阵
     * @param emission_probability   观测概率矩阵
     */
    public HiddenMarkovModel(float[] start_probability, float[][] transition_probability, float[][] emission_probability)
    {
   
        this.start_probability = (float[]) deepCopy(start_probability);
        this.transition_probability = (float[][]) deepCopy(transition_probability);
        this.emission_probability = (float[][]) deepCopy(emission_probability);
    }

    /**
     * 对数概率转为累积分布函数
     *
     * @param log
     * @return
     */
    protected static double[] logToCdf(float[] log)
    {
   
        double[] cdf = new double[log.length];
        cdf[0] = Math.exp(log[0]);
        for (int i = 1; i < cdf.length - 1; i++)
        {
   
            cdf[i] = cdf[i - 1] + Math.exp(log[i]);
        }
        cdf[cdf.length - 1] = 1.0;
        return cdf;
    }

    /**
     * 对数概率转化为累积分布函数
     *
     * @param log
     * @return
     */
    protected static double[][] logToCdf(float[][] log)
    {
   
        double[][] cdf = new double[log.length][log[0].length];
        for (int i = 0; i < log.length; i++)

最低0.47元/天解锁文章