
大数据
文章平均质量分 61
Tyler93
Do the best when you know the better!
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
数据结构之Bitmap
随着大数据技术日趋成熟,去重分析在企业日常分析中的使用频率愈来愈高,如何在大数据场景下快速地进行去重分析一直是一大难点,说到去重那么 Bitmap 一定会被提到,本文主要先介绍bitmap的原理,后续在其他章节中会继续介绍其在企业中是如何使用的。.原创 2021-07-31 13:12:07 · 5192 阅读 · 2 评论 -
PYthon+Django
参考资料:https://www.cnblogs.com/whiteHome/p/4954991.htmlhttps://www.cnblogs.com/sss4/p/7070942.html介绍django model 的一些常用查询方式一、ORM简介 对象关系映射(Object Relational Mapping,简称ORM)模式是一种为了解决面向对象与关系...原创 2018-08-28 10:43:50 · 296 阅读 · 0 评论 -
HUE
11、配置和使用HUE 一、Demo:启动和使用HUE 1、启动:hadoop:start-all.sh hbase: start-hbase.sh hbase-daemon.sh start thrift hive: hive --service metastore hiveserver2 HUE: bin/supervisor (/root/training/hue/build/e...转载 2018-08-28 10:42:45 · 929 阅读 · 0 评论 -
Mapreduce 类型传递错误
一、Mapreduce 类型传递错误 以下是部分源码(由map传递value数据类型到reduce去接受)publicclass Order2User { publicstaticclass OrderMapperextends Mapper{ String name =null; @Override protec原创 2018-01-20 15:35:34 · 348 阅读 · 0 评论 -
hive常见语法错误分组聚合
一、hive常见语法错误 图 1.1当我们在用hive进行数据表的操作时 我们会用得到group by函数那么如图1.1所示假如按照 name 和 month 进行分组SELECT tl.name ,tl.month,max(tl.amount) ASmonth_amount,sum(tr.amount)原创 2018-01-20 15:33:58 · 1523 阅读 · 1 评论 -
Akka
从几个方面来讲解一下actor模型必须要解决的几个问题:一、 消息系统设计,或者叫线程间通信怎么做?可以把要通信的线程想象成两个人,这两人没法直接说话,都是通过邮件交流。假设有两个人:勤奋的学生和睿智的老师。学生每天早上都会给老师发送邮件,而聪明的老师都会回复一句名言。这里需要解释: 1、学生发送邮件。一旦发送成功,邮件不能再修改。这天然就具备了不可变性,即使一不小心,发了句老师原创 2018-01-20 15:25:59 · 298 阅读 · 0 评论 -
IOException:Timedout 300000ms waiting for namespace table to be assigned
删除hdfs 的hbase3目录和zk的hbase节点:重启hbase服务 IOException:Timedout 300000ms waiting for namespace table to be assigned原因:长时间无法分配namespace表报错如图查看已经分配的表:只有meta观察meta表:发现只有一条数据解决:如果hbase能启动第一原创 2018-01-21 21:24:55 · 4173 阅读 · 1 评论 -
Mapreduce console日志程序跑到INFO run..job就不走了
.如果console日志程序跑到INFOrun..job就不走了查看日志发现connectionreset peer原因是因为:hdfs,yarn有机器没有开机slaves查找列表start.sh命令集体启动服务因为机器没起也不会报错;但是服务也就在其他机器上起不来,所以job跑的时候需要的数据块又恰巧在那些机器上提交job的机器就要去请求那些机器,连接不到所以报错原创 2018-01-21 21:10:35 · 319 阅读 · 0 评论 -
利用zookeeper开发简单的框架
服务端:public class OlioProvider { ZooKeeper zk = null; public void connectZK() throws Exception { zk = new ZooKeeper("cts01:2181,cts02:2181", 2000,null); } public void registServerInfo() t原创 2018-01-11 23:47:27 · 536 阅读 · 0 评论 -
Zookeeper入门
zookeeper1. zookeeper是什么?zookeeper是一个用于开发分布式系统时,进行分布式协调问题处理的基础中间件;它所提供的功能主要有3个: 1)可以为客户端提供注册信息的功能 2)可以为客户端提供查询信息的功能 3)可以为客户端提供数据监听并通知的功能 2. zookeeper是如何工作的?2.1 数据存储形式zook原创 2018-01-11 23:42:05 · 263 阅读 · 0 评论 -
分布式读写文件常见的错误
思路:客户端循环读写本地到的文件发送到服务端,然后服务端进行读写 然后将文件写到本地的磁盘中去,这样做 需要服务端 用for循环做 不能用while 循环 因为while循环会等待客户端关闭之后才能一次性的将文件写到本地!具体见下面文档。原创 2017-11-25 13:37:58 · 826 阅读 · 0 评论 -
linux 操作jdk 及基础入门
1、什么是linuxlinux就是一种操作系统;补充:操作系统是OS(operating system),就是一种软件,这种软件能够管理计算机的硬件,并提供访问这些硬件(cpu+内存+磁盘+显卡+网卡+声卡+显示器....)的软件接口,以便于应用程序开发者不用关注底层的硬件驱动细节; linux跟windows的区别?功能相似,但底层的实现机制完全不同;对上层软件提供的访原创 2017-12-22 22:26:40 · 447 阅读 · 0 评论 -
关于排序的泛型表达
详细代码请参考 以上链接原创 2017-10-29 20:44:38 · 392 阅读 · 0 评论