
大数据系列
大数据系列
大隐隐于野
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
Flink 剖析
Flink 剖析1.概述 在如今数据爆炸的时代,企业的数据量与日俱增,大数据产品层出不穷。今天给大家分享一款产品——Apache Flink,目前,已是 Apache 顶级项目之一。那么,接下来,笔者为大家介绍Flink 的相关内容。Apache Flink2.内容2.1 What's Flink Apache Flink 是一个面向分布式数据流处理和批量数据处理的开...原创 2019-12-30 15:05:13 · 222 阅读 · 0 评论 -
今日头条技术架构分析
今日头条技术架构分析一、产品背景 1、文章抓取与分析 2、用户建模 3、新用户的“冷启动” 4、推荐系统 5、数据存储 6、消息推送 二、今日头条系统架构 三、头条微服务架构 四、今日头条的虚拟化PaaS平台规划 五、总结《Java 2019 超神之路》 《Dubbo 实现原理与源码解析 —— 精品合集》 《Spring 实现原理与源码解析 —— 精品合...原创 2019-12-30 16:17:54 · 838 阅读 · 0 评论 -
Apache kafka 工作原理介绍
Apache kafka 工作原理介绍消息队列消息队列技术是分布式应用间交换信息的一种技术。消息队列可驻留在内存或磁盘上, 队列存储消息直到它们被应用程序读走。通过消息队列,应用程序可独立地执行--它们不需要知道彼此的位置、或在继续执行前不需要等待接收程序接收此消息。在分布式计算环境中,为了集成分布式应用,开发者需要对异构网络环境下的分布式应用提供有效的通信手段。为了管理需要共享...转载 2019-11-18 12:09:50 · 307 阅读 · 0 评论 -
Kafka C++客户端库librdkafka详解
1.前言librdkafka提供的异步的生产接口,异步的消费接口和同步的消息接口,没有同步的生产接口。2.缩略语 缩略语 缩略语全称 示例或说明 rd RapidDevelopment rd.h rk RdKafka ...原创 2020-03-13 13:29:22 · 11630 阅读 · 0 评论 -
librdkafka配置参数详解
全局配置参数Property C/P Range Default Description builtin.features * gzip, snappy, ssl, sasl, regex, lz4, sasl_gssapi, sasl_plain, sasl_scram, plugins 标示该librdkafka的支持的内建特性。应用...原创 2020-02-26 09:37:38 · 3817 阅读 · 1 评论 -
Kafka深度解析
介绍Kafka背景,使用消息系统的优势,常用消息系统对比,Kafka架构介绍,Kafka实现语义分析,Replication及Leader Election机制剖析,Consumer Group Rebalance实现原理介绍,以及Benchmark测试。原创文章,转载请务必将下面这段话置于文章开头处(保留超链接)。本文转发自技术世界,原文链接 http://www.jasongj.com...转载 2019-11-18 15:39:24 · 347 阅读 · 0 评论 -
kafka消费者对应partition关系
1.kafka消费组基本概念kafka消费topic是以group为单位来的,一个group消费一个topic。一个group能容纳多个consumer。consumer消费是以分区(partition)来的,一个consumer可以消费一个或多个partition,一个partition只能被一个consumer消费。(如果一个consumer group中的consumer个数多于topi...原创 2020-03-25 10:46:56 · 4460 阅读 · 1 评论 -
一文读懂 Apache Kudu
前言Apache Kudu是由Cloudera开源的存储引擎,可以同时提供低延迟的随机读写和高效的数据分析能力。Kudu支持水平扩展,使用Raft协议进行一致性保证,并且与Cloudera Impala和Apache Spark等当前流行的大数据查询和分析工具结合紧密。本文将为您介绍Kudu的一些基本概念和架构以及在企业中的应用,使您对Kudu有一个较为全面的了解。一、为什么需要Ku...原创 2020-02-26 20:25:11 · 410 阅读 · 0 评论 -
Kudu - 一个融合低延迟写入和高性能分析的存储系统
Kudu - 一个融合低延迟写入和高性能分析的存储系统Mon, May 8, 2017 唐刘Kudu 是一个基于 Raft 的分布式存储系统,它致力于融合低延迟写入和高性能分析这两种场景,并且能很好的嵌入到 Hadoop 生态系统里面,跟其他系统譬如 Cloudera Impala,Apache Spark 等对接。Kudu 很类似 TiDB。最开始,TiDB 是为了 OLTP ...原创 2020-02-26 19:24:17 · 523 阅读 · 0 评论 -
如何评价kudu存储引擎?
如何评价kudu存储引擎?据说Cloudera秘密开发了3年,兼顾数据更新实时性和分析速度的存储引擎,目前和impala配合的比较不错。国内目前小米在用这个东西。http://getkudu.io只说下我了解的部分,如有错误欢迎指出……Kudu最初由Cloudera开发,但现在已经开始作为Apache的项目孵化。Kudu - ASF JIRA定位是OLAP数据库,说白了就是可...原创 2020-02-26 18:15:17 · 628 阅读 · 1 评论 -
Apache Kudu 加速对频繁更新数据的分析
今天解读的内容是来自 Hadoop Summit San 2016 关于 Apache Kudu 的一个介绍:Apache Kudu & Apache Spark SQL for Fast Analystics on Fast Data(视频见文章末尾)。Apache Kudu 加速对频繁更新数据的分析_腾讯视频视频Kudu Overview上图是 Hadoop 生态体...原创 2020-02-26 20:21:56 · 355 阅读 · 0 评论 -
Kudu设计原理初探
如何在一个系统中融合OLTP型随机读写能力与OLAP型分析能力,Kudu提供了优秀的设计思路。本文主要从Kudu的设计论文着手,结合与HBase的对比分析,来初步揭示Kudu的设计原理,部分设计在最新的Kudu版本中可能已经过时,但最初的设计思想依然值得借鉴。1Kudu的设计初衷在介绍Kudu是什么之前,还是先简单的说一下现存系统针对结构化数据存储与查询的一些痛点问题,结构化数据的存储,...原创 2020-02-26 16:49:11 · 502 阅读 · 0 评论 -
zookeeper单机模式的安装和使用
1、分布式常见问题容易出现死锁容易活锁,处于活锁的线程都是非阻塞的,而且每个线程都抢不到资源,会造成cpu的耗费集群的管理问题,比如某台的宕机需要能够检测到集群配置文件的统一管理问题集群中信息更新通知问题,某一台机器发布一个信息,能够让整个集群的机器都知道管理集群的选举问题,管理集群的机器本身也是一个集群(例如zookeeper集群),其中有一台为主(选举得到),其他为从。分布式锁...原创 2019-08-17 23:08:10 · 350 阅读 · 0 评论 -
MySQL与Java数据类型对应关系
MySQL与Java数据类型对应关系类型名称显示长度数据库类型JAVA类型JDBC类型索引(int)VARCHARL+NVARCHARjava.lang.String12CHARNCHARjava.lang.String1BLOBL+NBLOBjava.lang.byte[]-4TEXT65535VARCHARjava.l...转载 2018-11-28 11:14:26 · 2557 阅读 · 0 评论