Embedding Layer可视化

### 使用TensorFlow和Pytorch实现Embedding Layer的可视化 #### TensorFlow中的嵌入层可视化在TensorFlow中，可以利用`tf.keras.layers.Embedding`创建嵌入层并将其权重保存下来用于后续可视化。通过TensorBoard插件Projector模块能够加载这些权重文件并将它们映射到二维空间以便观察。以下是具体操作过程以及代码示例： ```python import tensorflow as tf from tensorflow import keras import numpy as np # 创建简单的模型结构来演示 Embedding 层 vocab_size = 10000 # 假设字典大小为1万词 embedding_dim = 64 # 每个单词向量维度设置成64维 input_length = 20 # 输入序列长度固定为20 model = keras.Sequential([ keras.layers.Embedding(input_dim=vocab_size, output_dim=embedding_dim, input_length=input_length)]) # 构造一些虚拟数据作为输入 data = np.random.randint(0, vocab_size, size=(32,input_length)) embeddings = model(data) print(f'Embedding shape: {embeddings.shape}') # 提取 Embedding 权重矩阵供 Tensorboard projector 加载 weights = model.layers[0].get_weights()[0] with open("vecs.tsv", "w+", encoding="utf-8") as f_vecs: with open("meta.tsv", "w+", encoding="utf-8") as f_meta: for i in range(vocab_size): vec = weights[i] meta_word = str(i) # 这里简单用索引来代表词汇表里的词语 f_meta.write(meta_word + "\n") f_vecs.write("\t".join([str(x) for x in vec]) + "\n") # 配置好上述两个tsv文件之后，在命令行启动 tensorboard 并指定logdir路径即可查看效果。 ``` 以上脚本会生成两份TSV格式的数据文件——一个是包含所有词汇对应向量表示(`vecs.tsv`)；另一个则是对应的元信息比如词汇本身或者类别标签等(`meta.tsv`)。接着按照官方文档指引配置好项目参数后就可以借助TensorBoard工具直观展现高维特征分布情况了[^1]。 #### PyTorch中的嵌入层可视化对于PyTorch框架而言，则可通过调用其内置API `torch.nn.Embedding` 实现相同功能。同样地，我们需要先定义网络架构再提取出相应的权值部分进而完成绘图工作流程如下所示: ```python import torch import torch.nn as nn import matplotlib.pyplot as plt from sklearn.manifold import TSNE class SimpleModel(nn.Module): def __init__(self, num_embeddings, embedding_dim): super(SimpleModel, self).__init__() self.embedding_layer = nn.Embedding(num_embeddings=num_embeddings, embedding_dim=embedding_dim) def forward(self, inputs): return self.embedding_layer(inputs) num_embeddings = 500 # 字典规模设定为五百项 embedding_dim = 3 # 向量化后的维度定为三维方便作图展示 dummy_input = torch.LongTensor([[i % num_embeddings for _ in range(1)]for i in range(10)]) net = SimpleModel(num_embeddings=num_embeddings, embedding_dim=embedding_dim) output = net(dummy_input).detach().numpy() # 应用 t-SNE 方法降维处理原始高维数据至平面坐标系上呈现出来 X_embedded = TSNE(n_components=2).fit_transform(output.reshape(-1, embedding_dim)) plt.scatter(X_embedded[:, 0], X_embedded[:, 1]) plt.show() ``` 此段程序首先建立了一个简易版神经网络类对象SimpleModel继承自nn.Module基类，并在其内部初始化了一组随机赋初值过的嵌入表格。随后模拟了一些整数型编号形式的样本送入该模型得到相应输出结果。最后采用sklearn库里面的manifold子包下的TSNE算法把所得低维表达进一步压缩投影到了笛卡尔直角平面上并通过matplotlib渲染图形界面予以表现[^3]。另外值得注意的是如果想批量预览多幅图像则可考虑运用torchvision.utils.make_grid辅助函数快速拼接排列多个小型画布单元格形成统一整体布局样式[^2]。

阅读全文

Embedding Layer可视化

相关推荐

Python-使用attention机制实现和可视化一个自定义RNN层

局部线性嵌入(Locally Linear Embedding，LLE)(Python)

entity-embedding-rossmann-master_python_

CAFFE环境下CNN可视化实现指南

使用TensorBoard可视化深度学习训练过程

TensorBoard高级应用：PyTorch数据可视化专家指南

embedding编码的输出是什么类型，给出可视化的示例

MLM可视化

加入模型可视化

transfoemer模型结构可视化

轴承故障cnn可视化

图像分类可视化python

模型可视化有哪些

电信号高维特征可视化

行人重识别结果可视化

t_sne可视化特征

unet模型可视化特征分析

少样本故障诊断特征可视化

Spark SQL处理decimal类型空指针异常（spark.sql.hive.convertMetastoreParquet）

基于YOLOv5s的道路裂缝检测：数据集构建与模型训练

大家在看

appserv2.5.10_64位

Mapnik是用于开发地图绘制应用程序的开源工具包-C/C++开发

HCIE-Storage实验手册06---Oracle主备容灾方案实验手册.docx

Jtopo demo

动态供应链环境下的供应商分类评价研究

最新推荐

【地球科学与遥感】基于Google Earth Engine的哨兵2号数据分析：研究区域NDVI、LST及城市热岛效应评估系统设计

Typora下载问题解决：资源安装包实测可用

网络嗅探器实战进阶：掌握高效数据捕获与准确分析的6大策略

system verilog task中用宏定义传参

Java开发的Help GUI 1.1源码：可视化组件库详解

网络嗅探器全攻略：从入门到精通的15大技巧与实践案例

RTL8720DN-VA1-CG后面的VA1-CG是什么意思

CCPD2019车牌数据集：10000张带YOLO标签图片

【精准温度测量与HP303B校准】：掌握这些高级技巧，提升测量准确性

那如果我加上turbulenceProperties，是不是这么写FoamFile { version 2.0; format ascii; class dictionary; object turbulenceProperties; } // * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * // simulationType laminar;