深度学习课程HW2：seq2seq模型与注意力机制实践

ZIP文件

下载需积分: 0 | 1.72MB | 更新于2024-12-17 | 100 浏览量 | 举报收藏

免费下载

1. 课程内容与主题本次资源包是针对深度学习课程的第二次家庭作业（HW2），作业的主要内容是应用深度学习中的序列到序列（seq2seq）模型，并结合注意力机制（attention）与计划采样（schedule_sampling）技术。 2. 作业文件结构在hw2目录下，包含了以下关键文件： - report.pdf：该文件应该包含了作业的详细报告，包括实验过程、实验结果以及分析讨论等内容。 - seq2seq_model：这个文件夹内应该保存了训练好的seq2seq模型参数，以便加载和使用该模型进行预测或进一步分析。 - hw2_seq2seq.sh：这是一个Shell脚本文件，它可能包含了用于自动从Google驱动器下载数据和模型的命令。 - model_seq2seq.py：这是一个Python脚本文件，用于定义seq2seq模型的结构和训练过程。在hw2/hw2_1目录下，除了上述文件，还应该包含用于测试和训练的数据。具体操作指南可能指示用户将训练特征文件存放到./feature_dirs_training目录中，将字幕文件存放到./captions目录中。另外，在hw2/others目录下，可能存放了不同变种的seq2seq模型实现，包括仅使用seq2seq模型、结合了注意力机制的seq2seq模型和结合了计划采样的seq2seq模型。 3. 技术要求与实现细节 - seq2seq模型：这是一种基于神经网络的模型，广泛用于机器翻译、文本摘要、语音识别等序列到序列的任务。模型由编码器（encoder）和解码器（decoder）组成，编码器读取输入序列并将其编码成一个固定大小的向量表示，然后解码器将这个表示转化为输出序列。 - 注意力机制（attention）：注意力机制允许模型在生成输出时动态地聚焦于输入序列的不同部分，这有助于模型捕捉到长距离依赖信息，改善长序列的处理效果。 - 计划采样（schedule_sampling）：这是一种训练技术，用于改进seq2seq模型的训练过程。通过计划采样，模型在训练时会以一定概率从真实输出中采样而不是仅仅依赖于模型自己的预测，这有助于模型更好地探索输出空间，避免过早地收敛到次优解。 4. 环境与依赖作业需要在Python 3.6环境下完成。Python是当前非常流行的一个编程语言，广泛应用于科学计算、数据分析、人工智能等领域。为了完成作业，学生可能需要安装一些常用的深度学习库和工具包，如TensorFlow、Keras、NumPy等。 5. 模型性能指标布鲁得分数（BLEU Score）是衡量机器翻译质量的一个指标，它通过比较机器翻译结果和一组或多组人工翻译参考答案来计算得分。分数范围从0到1，得分越高表示翻译质量越好。HW2中提到的布鲁得得分为0.6764，这可以作为评估模型性能的一个参考标准。 6. 数据集在hw2资源包中，学生需要从指定位置下载用于训练和测试的序列数据。这些数据应包括训练特征文件和字幕文件。使用这些数据，学生需要构建和训练自己的seq2seq模型，并可能需要进行相应的数据预处理，比如序列编码、填充、标准化等。 7. 提交要求学生需要将完成的作业打包，并按照课程要求提交报告pdf文件和可能的代码文件。在提交之前，学生应当确保所有的代码都能正常运行，并且报告清晰地展示了作业要求的所有部分。通过以上内容的详细分析，可以看出，本次深度学习HW2家庭作业要求学生在给定的数据和模型基础上，深入理解和实践深度学习中的关键概念和技巧，包括模型构建、训练、调优以及性能评估。同时，学生需要掌握使用Python及相关工具库来解决实际问题的能力，这也正是当前IT行业中对数据分析、机器学习专业人才的基本要求。

资源目录

收起资源包目录

深度学习课程HW2：seq2seq模型与注意力机制实践（107个子文件）

.gitkeep 0B

utils_data_processing_1.py 4KB

idx2word.pkl 12KB

loss_total.npy 368B

.gitkeep 0B

bleu_eval.py 4KB

.gitkeep 0B

loss_record.txt 0B

utils_data_processing_1.py 4KB

seq_to_seq_test.py 6KB

training_label.json 1.38MB

seq_to_seq_test.py 7KB

generated_video_caption.txt 4KB

utils_data_processing_1-checkpoint.py 4KB

.gitkeep 0B

model_google_drive 166B

score_results.txt 129B

generated_video_caption.txt 4KB

model_seq2seq.py 6KB

score_results.txt 1KB

testing_label.json 96KB

train.csv 136KB

hw2_seq2seq.sh 872B

train.csv 136KB

loss_total.npy 368B

utils_data_sampling_1.cpython-36.pyc 3KB

idx2word.pkl 12KB

model_google_drive 166B

utils_data_sampling_1.py 4KB

train.csv 136KB

.gitkeep 0B

loss.txt 0B

model_seq2seq.py 7KB

loss.txt 0B

model_google_drive 166B

bleu_eval.py 4KB

word2idx.pkl 12KB

pythonProject1.iml 284B

bleu_eval.py 4KB

report.pdf 355KB

hw2_seq2seq.sh 872B

idx2word.pkl 12KB

score_results.txt 44B

utils_data_sampling_1.cpython-36.pyc 3KB

hw2_seq2seq.sh 871B

utils_data_sampling_1.py 4KB

loss_record.txt 16KB

README.md 830B

generated_video_caption-checkpoint.txt 0B

.gitkeep 0B

utils_data_processing_1.cpython-36.pyc 5KB

training_label.json 1.38MB

generated_video_caption.txt 4KB

utils_data_processing_1.py 4KB

idx2word.pkl 12KB

loss.txt 0B

score_results-checkpoint.txt 43B

test2-checkpoint.py 4KB

model_seq2seq.py 7KB

utils_data_sampling_1.py 4KB

bleu_eval-checkpoint.py 4KB

loss_record.txt 19KB

utils_data_processing_1.py 4KB

.gitkeep 0B

test.csv 9KB

loss_record.txt 26KB

generated_video_caption.txt 4KB

score_results.txt 127B

test3-checkpoint.py 462B

model_google_drive 166B

.gitignore 47B

testing_label.json 96KB

seq_to_seq_test-checkpoint.py 6KB

train.csv 136KB

hw2_seq2seq.sh 872B

.gitkeep 0B

test.csv 9KB

seq_to_seq_test.py 7KB

model_seq2seq.py 8KB

bleu_eval.py 4KB

training_label.json 1.38MB

seq_to_seq_model-checkpoint.py 7KB

testing_label.json 96KB

loss_total.npy 368B

loss_total.npy 728B

test.csv 9KB

loss_record-checkpoint.txt 42KB

word2idx.pkl 12KB

utils_data_processing_1.cpython-36.pyc 5KB

seq_to_seq_test.py 6KB

.gitkeep 0B

test.csv 9KB

.gitkeep 0B

word2idx.pkl 12KB

testing_label.json 96KB

utils_data_sampling_1.py 4KB

.gitkeep 0B

training_label.json 1.38MB

共 107 条

普通网友

粉丝: 36

深度学习课程HW2：seq2seq模型与注意力机制实践

李宏毅教授ML-2022Spring-HW1-SampleCode-TrainingData

deep_learning_HW2:HW2用于深度学习

deep_learning_hw

dll_hw_2_deeplearning

数字手势数据集（Coursera - Deep Learning）

DL_HW1_deeplearning_

AI-4710-Hw-1

基于CMU 10-714 Deep Learning Systems课程实现的深度学习框架needle源码.zip

吴恩达深度学习deeplearning第五课第一周课后测验及编程作业（含答案）

吴恩达深度学习deeplearning第五课第三周课后测验及编程作业（含答案）

最新资源