基于循环神经网络的自然语言处理

立即解锁

发布时间: 2025-09-09 00:26:31 阅读量: 6 订阅数: 13

深度学习实战：TensorFlow数学解析

### 基于循环神经网络的自然语言处理 #### 1. 实验结果初步展示在进行MNIST数据提取和训练后，我们得到了如下结果： ```plaintext Extracting MNIST_data/train-images-idx3-ubyte.gz Extracting MNIST_data/train-labels-idx1-ubyte.gz Extracting MNIST_data/t10k-images-idx3-ubyte.gz Extracting MNIST_data/t10k-labels-idx1-ubyte.gz Epoch: 1,step:50, Minibatch Loss= 0.822081, Training Accuracy= 0.69531 Epoch: 1,step:100, Minibatch Loss= 0.760435, Training Accuracy= 0.75781 Epoch: 1,step:150, Minibatch Loss= 0.322639, Training Accuracy= 0.89844 Epoch: 1,step:200, Minibatch Loss= 0.408063, Training Accuracy= 0.85156 Epoch: 1,step:250, Minibatch Loss= 0.212591, Training Accuracy= 0.93750 Epoch: 1,step:300, Minibatch Loss= 0.158679, Training Accuracy= 0.94531 Epoch: 1,step:350, Minibatch Loss= 0.205918, Training Accuracy= 0.92969 Epoch: 1,step:400, Minibatch Loss= 0.131134, Training Accuracy= 0.95312 Epoch: 2,step:50, Minibatch Loss= 0.161183, Training Accuracy= 0.94531 Epoch: 2,step:100, Minibatch Loss= 0.237268, Training Accuracy= 0.91406 Epoch: 2,step:150, Minibatch Loss= 0.130443, Training Accuracy= 0.94531 Epoch: 2,step:200, Minibatch Loss= 0.133215, Training Accuracy= 0.93750 Epoch: 2,step:250, Minibatch Loss= 0.179435, Training Accuracy= 0.95312 Epoch: 2,step:300, Minibatch Loss= 0.108101, Training Accuracy= 0.97656 Epoch: 2,step:350, Minibatch Loss= 0.099574, Training Accuracy= 0.97656 Epoch: 2,step:400, Minibatch Loss= 0.074769, Training Accuracy= 0.98438 Optimization Finished! Testing Accuracy: 0.954102 ``` 从上述输出可以看出，仅仅运行2个周期，在测试数据集上就达到了95%的准确率。 #### 2. 基于LSTM的下一个单词预测和句子完成我们使用来自《爱丽丝梦游仙境》的一小段文本进行模型训练，利用长短期记忆网络（LSTM）从给定词汇表中预测下一个单词。具体步骤如下： 1. **输入输出设定**：选取三个单词的序列作为输入，后续的一个单词作为输出。 2. **模型选择**：采用两层LSTM模型而非单层模型。 3. **数据处理**：从语料库中随机选择输入和输出集，并以大小为1的小批量进行输入。以下是具体的代码实现： ```python # load the required libraries import numpy as np import tensorflow as tf from tensorflow.contrib import rnn import random import collections import time # Parameters learning_rate = 0.001 training_iters = 50000 display_step = 500 n_input = 3 # number of units in RNN cell n_hidden = 512 # Function to read and process the input file def read_data(fname): with open(fname) as f: data = f.readlines() data = [x.strip() for x in data] data = [data[i].lower().split() for i in range(len(data))] data = np.array(data) data = np.reshape(data, [-1, ]) return data # Function to build dictionary and reverse dictionary of words. def build_dataset(train_data): count = collections.Counter(train_data).most_common() dictionary = dict() for word, _ in count: dictionary[word] = len(dictionary) reverse_dictionary = dict(zip(dictionary.values(), dictionary.keys())) return dictionary, reverse_dictionary # Function to one-hot the input vectors def input_one_hot(num): x = np.zeros(vocab_size) x[num] = 1 return x.tolist() # Read the input file and build the required dictionaries train_file = 'alice in wonderland.txt' train_data = read_data(train_file) dictionary, reverse_dictionary = build_dataset(train_data) vocab_size = len(dictionary) # Place holder for Mini-batch input output x = tf.placeholder("float", [None, n_input, vocab_size]) y = tf.placeholder("float", [None, vocab_size]) # RNN output node weights and biases weights = { 'out': tf.Variable(tf.random_normal([n_hidden, vocab_size])) } biases = { 'out': tf.Variable(tf.random_normal([vocab_size])) } # Forward pass for the recurrent neural network def RNN(x, weights, biases): x = tf.unstack(x, n_input, 1) # 2 layered LSTM Definition rnn_cell = rnn.MultiRNNCell([rnn.BasicLSTMCell(n_hidden),rnn.BasicLSTMCell(n_hidden)]) # generate prediction outputs, states = rnn.static_rnn(rnn_cell, x, dtype=tf.float32) # there are n_input outputs but # we only want the last output return ```

最低0.47元/天解锁专栏

买1年送3月

继续阅读点击查看下一篇

400次会员资源下载次数

300万+ 优质博客文章

1000万+ 优质下载资源

1000万+ 优质文库回答

复制全文

基于循环神经网络的自然语言处理

相关推荐

专栏目录

基于循环神经网络的自然语言处理

相关推荐

基于循环神经网络RNN的歌词生成

基于循环神经网络的自然语言情感分类实例

自然语言处理-循环神经网络.pptx

基于循环神经网络的汉语语言模型建模方法.pdf

基于循环神经网络的情绪预测系统_IMDB影评数据集正面负面情感分析_用于构建深度学习模型自动识别和分类用户评论情感倾向以提升自然语言处理应用效果_LSTM神经网络文本分类Tenso.zip

基于深度学习的智能图像识别与自然语言处理系统_图像识别_自然语言处理_计算机视觉_深度学习_卷积神经网络_循环神经网络_注意力机制_多模态融合_数据增强_模型优化_实时推理_云端部.zip

基于循环神经网络的日内预测

基于循环神经网络的文本生成

基于循环神经网络的影评情感分类研究

python基于循环神经网络的情感分类系统

Red Hat Enterprise Linux 8.2 Install Ansible-Tower

西门子S7-1200与V90伺服控制方法介绍

专栏目录

最新推荐

ABP多租户基础设施使用指南

MH50多任务编程实战指南：同时运行多个程序模块的高效策略

【C语言实战指南】：手把手教你从零构建刚度矩阵求解器

应用性能分析与加速指南

机器学习技术要点与应用解析

工程师招聘：从面试到评估的全面指南

点云驱动建模（PDM）技术全解：从原理到落地，掌握未来建模趋势

基于TensorFlow的聊天机器人序列到序列模型实现

机器人学习中的效用景观与图像排序

Salesforce性能与应用架构解析