PyTorch预训练Bert模型

数学编程

于 2020-11-17 00:47:34 发布

阅读量2.4k

点赞数 4

CC 4.0 BY-SA版权

分类专栏：机器学习算法文章标签：深度学习 python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_42060232/article/details/109733908

本文介绍了如何在Google Colab上利用Huggingface的transformers框架，借助GPU加速训练BERT-base模型。通过datasets模块下载IMDB数据，使用AutoModelForSequenceClassification和AutoTokenizer进行模型和tokenizer的创建，设定训练参数并进行模型训练和评估。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

本文介绍以下内容：

使用transformers框架做预训练的bert-base模型；
开发平台使用Google的Colab平台，白嫖GPU加速；
使用datasets模块下载IMDB影评数据作为训练数据。

transformers模块简介

transformers框架为Huggingface开源的深度学习框架，支持几乎所有的Transformer架构的预训练模型。使用非常的方便，本文基于此框架，尝试一下预训练模型的使用，简单易用。

本来打算预训练bert-large模型，发现colab上GPU显存不够用，只能使用base版本了。打开colab，并且设置好GPU加速，接下来开始介绍代码。

代码实现

首先安装数据下载模块和transformers包。

!pip install datasets
!pip install transformers

使用datasets下载IMDB数据，返回DatasetDict类型的数据.返回的数据是文本类型，需要进行编码。下面会使用tokenizer进行编码。

from datasets import load_dataset

imdb = load_dataset('imdb')
print(imdb['train'][:3

最低0.47元/天解锁文章

200万优质内容无限畅学

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。