自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(485)
  • 资源 (15)
  • 收藏
  • 关注

原创 Re-TASK:从能力、技能和知识视角重新审视LLM任务

Re-Task:延续CoT的分解任务,进一步生成能力项以加强回应

2025-07-31 17:25:58 396

原创 OriGene:一种可自进化的虚拟疾病生物学家,实现治疗靶点发现自动化

OriGene:自进化Agent用于靶点发现

2025-07-30 17:04:47 790

原创 人类语言驱动物理机制建模的AIVC

基于规则建模虚拟细胞

2025-07-30 14:44:01 575

原创 构建特定领域的大模型

构建领域特定大模型的概述

2025-07-29 17:30:10 927

原创 CellFlow:Flow matching建模cell状态变化

流匹配建模细胞扰动响应

2025-07-24 17:57:55 745

原创 DPO详解

DPO详解

2025-07-20 17:00:20 607

原创 MiniMind(3)训练

MiniMind(3)训练

2025-07-20 15:46:43 750

原创 Arc虚拟细胞挑战入门指南

Arc虚拟细胞挑战入门指南

2025-07-19 10:49:25 950

原创 SymAgent(神经符号自学习Agent)

神经符号自学习Agent

2025-07-18 21:49:41 775

原创 Agent AI(3):Agent分类

Agent AI(3)

2025-07-18 17:07:27 693

原创 Agent AI(2):Agent范式

Agent AI(2)

2025-07-11 00:21:24 830

原创 Agent AI(1):多模态交互智能中的背景和动机

Agent AI(1)

2025-07-09 17:46:30 817

原创 MiniMind(2)模型架构

MiniMind(2)模型架构

2025-07-02 16:38:06 830

原创 KV Cache

KV Cache

2025-06-30 20:11:14 397

原创 State:SE编码单个细胞,ST学习细胞集合上的扰动

STATE:预测扰动响应

2025-06-30 16:28:35 773

原创 三种强化学习方法:PPO,DPO,GRPO

PPO,DPO,GRPO

2025-06-25 15:48:32 939

原创 MiniMind(1)Tokenizer与训练数据

minimind part1:tokenizer与训练数据

2025-06-13 14:13:09 865

原创 Biomni:通用生物医学AI Agent

Biomni:生物医学AI Agent

2025-06-11 16:51:04 1236

原创 Cell-o1:强化学习训练LLM解决单细胞推理问题

Cell-o1

2025-06-07 17:27:26 1109

原创 GEARS以及与基础模型结合

GEARS预测扰动响应

2025-05-30 16:21:21 1159

原创 C2S-Scale方法解读

C2S-Scale方法解读

2025-05-18 15:19:01 785

原创 C2S-Scale:Cell2Sentence v2

C2S-Scale

2025-05-14 21:20:10 1133

原创 scGPT-spatial:持续预训练scGPT用于空间转录组

scGPT-spatial

2025-04-30 16:10:03 1125

原创 scGPT方法解读

scGPT方法解读

2025-04-30 14:40:18 1567

原创 DeepSeek-R1技术报告(中文版)

DeepSeek技术报告(中文版)

2025-04-28 13:00:18 1349

原创 ICLR2025 | CAX:基于JAX加速的元胞自动机

JAX加速元胞自动机

2025-04-26 14:09:49 926

原创 联邦元学习实现个性化物联网的框架

联邦元学习Cedar

2025-04-22 19:33:06 964

原创 TABULA:联邦学习和表格建模构建scRNA-seq上的隐私保护基础模型

单细胞联邦学习

2025-04-17 20:58:44 1032

原创 AAAI2025Oral | DUSTED-简洁高效的空间组学数据去噪

AAAI2025Oral | DUSTED-简洁高效的空间组学数据去噪

2025-04-12 13:43:56 840

原创 SCimilarity:对人类相似细胞进行可扩展搜索的细胞图谱基础模型

细胞搜索

2025-04-08 16:39:34 1096

原创 CellHint:人类细胞图谱自动细胞类型协调与整合

cellhint:细胞类型协调与数据整合

2025-04-08 13:23:11 1035

原创 Aliee,Bengio and Theis:细胞数据上的因果机器学习

因果学习与单细胞

2025-04-02 22:11:32 1004

原创 TextGrad:案例

TextGrad案例

2025-03-28 21:39:47 793

原创 TextGrad:文本梯度优化生成式AI

TextGrad

2025-03-28 14:04:29 999

原创 未来基于参考映射的单细胞数据分析

参考映射的展望

2025-03-26 19:22:01 1019

原创 scNET:整合scRNA-seq和PPI用于学习基因和细胞的embedding

scNET

2025-03-24 23:05:27 1141

原创 Evo2:跨所有生命领域的基因组建模与设计

Evo 2

2025-03-20 22:12:53 1389

原创 Nature | TabPFN:表格基础模型用于小规模数据分析

TabPFN

2025-03-14 20:41:50 2388

原创 DrBioRight2.0:用于癌症蛋白组分析的生物学聊天机器人

DrBioRight

2025-03-13 20:56:22 816

原创 推理LLMs发展综述:从GPT到DeepSeek

推理LLMs发展综述:从GPT到DeepSeek

2025-03-10 18:54:53 1308 4

红楼梦人物图谱csv文件

红楼梦人物图谱csv文件

2023-08-30

nltk_data.rar

nltk的分词工具,将其解压,放置到当前虚拟环境(假设环境名为TORCH),则目录结构为"TORCH/nltk_data/tokenizers/punkt"

2021-01-22

随机森林评估特征重要性wine.rar

基于 UCI 葡萄酒数据,使用随机森林进行特征重要性分析,这些数据是对意大利同一地区种植的三种不同品种葡萄酒的化学分析结果,分析确定了三种葡萄酒中13种成分的含量,数据的第一列是葡萄酒的类别

2021-02-02

fasterRCNN口罩检测

使用fasterrcnn实现口罩检测,fasterrcnn基于keras搭建,训练需要口罩数据集,数据集必须是VOC格式,预测需要权重文件,权重文件已经存在

2020-05-26

基于朴素贝叶斯的垃圾邮件过滤data.rar

邮件数据包括训练集train(正常邮件normal,垃圾邮件spam),测试集test,中文停用词文件cn_stopwords.txt

2021-01-31

机器翻译nmt.zip

轻量级机器翻译数据集,en-cn为英文与中文,en-fr为英文与法文

2021-01-22

LR预测CTR数据集data.zip

数据集是电商领域数据集,共计200万的样本记录。原始特征均为ID类特征; 字段说明: userid 用户ID itemid 商品ID categoryid 商品类目ID action 用户行为类型 timestamp 时间戳

2021-01-25

glove.6B.100d.txt.zip

glove.6B是斯坦福大学训练的词向量包(862MB),glove.6B.100d是100维词向量,TEXT.build_vocab可以根据我自己的词汇表内的词匹配到glove内的词,组建成为需要的词向量;后面如果想使用这个新词向量,可以通过TEXT.vocab.vectors返回

2020-11-29

决策树预测用户流失data.csv

基于某信息公司的用户数据,使用决策树预测用户是否会流失,字段Churn代表客户是否流失,取值:['Yes', 'No'],其余字段为特征

2021-02-01

MNIST与FashionMNIST数据集

数据集包括了MNIST和FashionMNIST,有原始数据集raw和经过torchvision.datasets处理过的processed目录

2020-11-29

hymenoptera_data.zip

hymenoptera_data数据集,这个数据集包括两类图片, bees 和 ants, 这些数据都被处理成了可以使用"torchvision.datasets.ImageFolder"来读取的格式。

2020-12-02

google.csv

机器学习第六课,使用线性回归预测未来30天 Google 股票的收盘价走势,表格中的列代表每天的股票指数,如:Open 开盘价、High 最高价、Low 最低价、Volume 成交量。Adj. Open、Adj. High、Adj. Low、Adj. Close、Adj. Volume 代表调整后的数据

2021-01-15

mackey_glass_t17.npy

Mackey-Glass (MG)序列的部分内容,shape为(10000,),这个时间序列是混乱的,没有明确的周期。 级数不收敛也不发散,轨迹对初始条件高度敏感。 这个基准问题用于神经网络和模糊建模研究。

2021-07-12

olivetti_py3.pkz

人脸图像数据集 olivetti_py3.pkz,该数据集一共有 400 张人脸图片,每张图片的大小是:64x64,每张图片作为一个样本,一共有 400 个样本,每个样本的特征维度是:64x64 = 4096;400 张图片一共包含 40 个不同的人,每个人有 10 张人脸图片

2021-02-13

Kaggle交易预测.rar

基于 Kaggle 竞赛数据,原始数据文件较大,故本数据集只选用了 train.csv 中的 5 万条样本作为模型训练集(train.csv.gzip),1 万条样本作为模型测试集(test.csv.gzip)

2021-02-17

TextSet.zip

该文件用于词向量训练,Skip-Gram训练,主要是texttrain.txt文件,训练细节见白景屹的Pytorch笔记本-第四课.词向量:https://blog.csdn.net/qq_40943760/category_10532835.html

2020-11-09

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除