GLM-4-9B开源模型：超越Llama-3-8B的多模态能力

ZIP文件

26.13MB | 更新于2024-11-13 | 15 浏览量 | 举报收藏

立即下载

该模型在语义、数学、推理、代码和知识等多方面的数据集测评中都表现出色，超越了Llama-3-8B。GLM-4-9B有两个版本，一个是普通的GLM-4-9B，另一个是人类偏好对齐的版本GLM-4-9B-Chat。此外，还有多模态模型GLM-4V-9B，其采用了与CogVLM2相似的架构设计，能够处理高达1120 x 1120分辨率的输入，通过降采样技术有效减少了token的开销。GLM-4V-9B没有引入额外的视觉专家模块，而是采用了直接混合文本和图片数据的方式进行训练，在保持文本性能的同时提升多模态能力。该模型使用Pytorch框架进行训练和部署。" 知识点: 1. 预训练模型：预训练模型是一种机器学习模型，它在大规模的数据集上进行训练，以学习数据的通用特征和模式。这些模型可以用于各种任务，如分类、回归、序列预测等。 2. GLM-4系列：GLM-4系列是由智谱AI推出的一系列预训练模型。在这个系列中，GLM-4-9B是最新的一代模型。 3. 语义、数学、推理、代码和知识：这些是GLM-4-9B模型在数据集测评中表现优异的几个方面。语义指的是模型理解和生成语言的能力，数学指的是模型解决数学问题的能力，推理指的是模型进行逻辑推理的能力，代码指的是模型理解和生成代码的能力，知识指的是模型存储和使用知识的能力。 4. Llama-3-8B：Llama-3-8B是GLM-4-9B的一个竞争对手，但是GLM-4-9B在各个方面的性能都超越了Llama-3-8B。 5. 多模态模型GLM-4V-9B：多模态模型是一种可以处理和理解多种类型输入（如文本、图片、声音等）的模型。GLM-4V-9B是GLM-4系列中的一个多模态模型，它能够处理高达1120 x 1120分辨率的输入，并且通过降采样技术有效减少了token的开销。 6. 降采样技术：降采样技术是一种减少数据量的方法，它可以减少模型的计算开销和内存消耗。 7. 直接混合文本和图片数据的方式进行训练：这是一种训练方法，它将文本和图片数据直接混合在一起进行训练，而不是将它们分开处理。这种方法可以提高模型的多模态能力。 8. Pytorch：Pytorch是一个开源的机器学习库，用于Python编程语言，由Facebook的人工智能研究实验室开发。它广泛用于计算机视觉和自然语言处理等领域。GLM-4-9B和GLM-4V-9B都是使用Pytorch进行训练和部署的。

资源目录

收起资源包目录

GLM-4-9B开源模型：超越Llama-3-8B的多模态能力（99个子文件）

multi-mode.png 416KB

.gitignore 2KB

finetune.py 16KB

doc_reader.png 1.1MB

README_en.md 5KB

main.py 12KB

pre-rebase.sample 5KB

config.ts 201B

wechat.jpg 151KB

Dockerfile 83B

README_en.md 11KB

trans_batch_demo.py 3KB

hf.py 2KB

pre-push.sample 1KB

pre-receive.sample 544B

tool_registry.py 5KB

push-to-checkout.sample 3KB

browser.ts 23KB

utils.py 742B

README.md 6KB

package-lock.json 138KB

lora.yaml 1KB

weather.png 1013KB

requirements.txt 358B

Contributors.md 19B

result.png 25KB

interface.py 223B

README_en.md 4KB

ds_zero_2.json 728B

vllm.py 2KB

README.md 4KB

applypatch-msg.sample 478B

packed-refs 268B

web_plot_1.png 936KB

browser.py 2KB

exclude 240B

README.md 11KB

README_en.md 16KB

vlm.png 684KB

longbench.png 164KB

tsconfig.json 297B

train.sh 237B

WECHAT.md 221B

config.py 118B

inference.py 4KB

demo.png 615KB

train_dp.sh 315B

trans_stress_test.py 5KB

config 288B

package.json 597B

sft.yaml 997B

icon.png 54KB

README_zh.md 16KB

python.py 7KB

HEAD 201B

openai_api_server.py 17KB

prepare-commit-msg.sample 1KB

update.sample 4KB

requirements.txt 96B

ds_zero_3.json 771B

eval_needle.jpeg 452KB

gen_messages_data.py 1KB

transformers.jpg 33KB

post-update.sample 189B

client.py 3KB

pack-cdb36237fae9d88f2ad2a2923bc52cab6dac0d7a.idx 5KB

HEAD 201B

requirements.txt 186B

LICENSE 11KB

.gitignore 3KB

fsmonitor-watchman.sample 5KB

cogview.png 1.87MB

pnpm-lock.yaml 47KB

quick_start.py 1KB

types.ts 506B

model.properties 485B

description 73B

.gitignore 25B

pack-cdb36237fae9d88f2ad2a2923bc52cab6dac0d7a.pack 18.05MB

tool.png 603KB

commit-msg.sample 896B

cogview.py 747B

conversation.py 7KB

pre-merge-commit.sample 416B

trans_web_demo.py 6KB

vllm_cli_demo.py 4KB

web_plot_2.png 851KB

trans_cli_vision_demo.py 4KB

index 7KB

ptuning_v2.yaml 1KB

pre-commit.sample 2KB

server.ts 1KB

trans_cli_demo.py 4KB

README.md 11KB

pre-applypatch.sample 424B

HEAD 41B

HEAD 32B

openai_api_request.py 3KB

utils.ts 1KB

共 99 条

技术瘾君子1573

粉丝: 2w+

GLM-4-9B开源模型：超越Llama-3-8B的多模态能力

仅使用Python基础从头开始构建大型语言模型；从零开始逐步构建GLM4-Lama3-RWKV6，深入了解大型模型的原理.zip

glm-4-9b-chat-1m模型代码文件

glm4-9b-1m和glm4-9b-chat模型有什么区别

glm4-9b模型数据下载

langchain调用glm4-9b

RAG配置GLM4-9B

glm4-9b数据集下载

glm4-9b模型训练时报错：KeyError: 'messages'

glm4-9b模型训练时报错：An error occurred while generating the dataset

glm-deprecated-master.zip

最新资源