大数据
讲述数据获取、存储、管理、分析的方方面面,关注软件、实践、生态,挖掘最新的前沿技术,同时也思考大数据与AI和云计算的深度结合。
- 全部
- DataOps
- 数据集成
- DataMesh
- 数据编织
- 数据湖仓
- 在离线混部
- 实时计算
- 其他

Snowflake 上的智能体 RAG | 技术实践
原生工作流以及统一的语义层融合在一起,以流畅、安全、智能的数据云形式交付。我对其最近推出的强大功能印象深刻,特别是它们如何简化复杂的能力,使其更适合企业级应用。

从 RDBMS 到 Snowflake 的复制 | 技术实践
传统方法存在发生内存不足错误和资源利用低效的风险

情境丰富型 AI 智能体的一键式解决方案:Snowflake Intelligence 与 Cortex 知识扩展 | 技术趋势
这些强大的 AI 创新,其价值取决于所能获取的信息。

Snowflake 中的数据概况:在清理之前发现数据中的混乱 | 技术实践
分析工程并不是关于完美的数据,而是将不可靠的输入转化为值得信赖的内容

Snowflake AI+ 数据 2025 年十大预测(下) | 技术趋势
AI 正在证明其存在的长久价值

Snowflake AI+ 数据 2025 年十大预测(上) | 技术趋势
有了 Snowflake,可以让人们在同一个平台把人工智能利用起来

GenAI 退烧后,这家企业正在用 “数据平台” 重构 AI2B 的底层逻辑
当 GenAI 从 C 端热闹走向 B 端落地,企业级 AI 的重点,是不是该变了?

【AI 技术周 - 第三期】从被动存储到主动决策:AI 如何驱动数据库与大数据智能进化
AI 与大数据正以前所未有的深度融合,重塑着千行百业。如何让数据真正“开口说话”?如何构建高效、稳定且经济的 Data+AI 平台?这不仅是技术挑战,更是决定企业未来竞争力的核心命题。

在 Snowflake 上搭建 Spark Connect 引擎:技术细节深度拆解 | 技术实践
实现了客户端接口与 Spark 执行引擎的解耦

实时大规模变更数据捕获:Openflow 数据库复制架构的技术解析 | 技术趋势
传统的变更数据捕获(CDC)实施方案面临复杂的工程挑战

企业将智能体 AI 工作负载投入生产的三条成熟路径 | 技术趋势
没有数据战略,就没有 AI 战略

长安福特引入阿里云 ClickHouse 构建 CDP 平台,降本 40% 实现精准营销
解决了业务高峰期的资源瓶颈问题,且成本较自建集群降低 40%

Google Spanner 再出新招:单库同时处理事务和分析,效果如何?
Google 为 Spanner 推出列式引擎,实现单库同时处理 OLTP 与 OLAP,性能最高提升 200 倍。

直击调参痛点!负载压缩加速调参落地
直击调参痛点!负载压缩加速调参落地

提升事务处理效率新招:“热点感知”+“组锁模式”!
提升事务处理效率新招:“热点感知”+“组锁模式”!

隔离级别事务 bug 捕获率 91.4%!WSS 成利器,串行比对判错超直接
隔离级别事务 bug 捕获率 91.4%!WSS 成利器,串行比对判错超直接

颠覆认知:大模型训练过程的本质就是数据压缩!
颠覆认知:大模型训练过程的本质就是数据压缩!

戳中智能查询生成痛点!真实性 + 覆盖性不足催生新需求,大模型入场仍有挑战
戳中智能查询生成痛点!真实性 + 覆盖性不足催生新需求,大模型入场仍有挑战

以数生智,以智驭数:GenAI 新常态下的企业数据之道 | 矩阵起源产品发布会重磅启幕
一场真正面向未来的智能变革,从真正掌控数据开始。


面向 GenAI 的数据智能底座白皮书
在 GenAI 时代,数据不再只是用来查询和分析的资产,而是构建企业专属 AI 应用的基础。只有构建统一、多模态、AI-Ready 的数据底座,企业才能真正释放 AI 的潜力,实现智能体的持续进化与业务的高效增长。

企业落地 NL2SQL,需要的是「AI-ready Data」和「小模型」
当 NL2SQL 从 Demo 走向生产,关键不在“更大的模型”,而是“更干净的数据底座 + 更小的专用模型 + 更可控的工程化流程”。

圆桌研讨:《共话数据库发展新路径:人才、产业与技术研讨》| 腾讯云数据库 DBTalk
围绕人才培养、产学研合作、未来数据库发展方向三个方向展开讨论。

数据库事务一致性验证问题: 前沿技术与发展趋势探讨
事务是数据库系统中的核心概念,是支撑在线交易顺利进行的关键技术。事务 ACID 特性中的“隔离性”要求并发事务互不干扰,以防止上层业务产生数据异常。

SIGMOD 25’TXSQL 内核热点更新优化
TXSQL 实现了高达 7 倍的性能提升,同步场景下性能提升更明显

查询生成与查询优化技术: 人工智能赋能视角
首先,探讨基于大模型技术的查询生成技术。其次,探讨基于深度学习的前沿查询优化技术。最后,对未来发展趋势进行展望与讨论。

面向数据库参数调优的负载压缩
生成推荐参数配置。评估参数配置性能。调整优化模型。

跨域数据的压缩技术: 从数据库存储到大语言模型优化
通过对跨域数据压缩技术的系统介绍,分析新应用对于压缩技术带来的新挑战,并对压缩技术的发展进行展望。

Netflix 如何重新定义视频、音频和文本的数据工程
Netflix 推出了一个新的工程专业化领域——媒体机器学习数据工程(Media ML Data Engineering),以及一个旨在大规模处理视频、音频、文本和图像资产的媒体数据湖。早期成果包括在标准化媒体上训练的更丰富的机器学习模型、更快的评估周期,以及对创意工作流程的更深入洞察。

货拉拉大数据存储实践与 AI 时代的应对
上的灾备、迁移实践经验。时代的到来,给存储领域带来了新的挑战,我们将探讨这些挑战,并展示货拉拉如何联合腾讯云打造创新的解决方案。

ClickHouse 内部的全文搜索:快速、原生、列式架构
我们在 ClickHouse 中彻底重构了全文搜索功能,性能更高、更轻量,并且与列式数据库架构深度融合。