
大数据
ErnestW
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
WIN10系统安装虚拟机以及CentOS7
WIN10系统安装虚拟机(VM)下载虚拟机文件此处需要下载vm11以上的版本,当前使用的是14版本。官网地址:https://www.vmware.com/products/workstation-pro/workstation-pro-evaluation.html注意:不要不要安装低版本的虚拟机本人刚开始安装了VM9,可以安装成功。并且安装使用没有问题,但是无法使用桥接的方式连接网络...转载 2019-03-31 15:25:27 · 4345 阅读 · 1 评论 -
Elasticsearch技术解析与实战---安装配置
1、安装javaElasticsearch需要Java 7或者更高版本。java -version 验证java版本2、安装Elasticsearch下载路径:https://www.elastic.co/cn/downloads/past-releases/elasticsearch-2-3-03、配置1、elasticsearch.yml配置说明在E:\安装包\elasticse...转载 2019-04-09 22:28:17 · 208 阅读 · 0 评论 -
Elasticsearch技术解析与实战---基础知识Elasticsearch术语就概念
1、索引词(term)能够被索引的精确值。2、文本(text)通常文本会被分析成一个个索引词,存在Elasticsearch的索引库中。3、分析(analysis)分析是将文本转换为索引词的过程,分析的结果依赖于分词器。4、集群(cluster)集群由一个或多个节点组成,对外提供服务,对外提供索引和搜索功能。在所有节点中,一个集群有一个唯一的名称默认为Elasticsearch。5...转载 2019-04-09 22:28:34 · 312 阅读 · 0 评论 -
Elasticsearch技术解析与实战----Lucene简介
1、Lucene倒排索引倒排索引来源与根据属性的值来查找记录。这种索引表的每一项都包括一个属性值和具有该属性值的各记录的地址。由于不是由记录来确定属性值,而是由属性值来确定记录的位置,因而称为倒排索引。过程:1、取得关键字比如:[tom][live][shanghai]。其中:in,once,too等词没有实际意义,的、是等词也没有具体含义,可以过滤掉。2、建立倒排索引文章号对应文章...转载 2019-04-09 22:28:47 · 229 阅读 · 0 评论 -
hadoop从零开始教程第二篇(hadoop shell命令操作)
去原创 2019-04-14 21:45:13 · 642 阅读 · 1 评论 -
Hadoop从零开始教程第一篇(在linux上安装hadoop集群centos7+hadopp3.2)
Hadoop简介Hadoop是Apache旗下的一套开源分布式计算平台。应用范围:利用服务器集群,根据用户的自定义业务逻辑,对海量数据进行分布式处理。核心组件:HDFS(分布式文件系统)高容错性、高伸缩性等允许用户将Hadoop部署在低廉的硬件上YARN(运算资源调度系统)MAPREDUCE(分布式运算编程框架)允许用户在不了解分布式系统细节情况下开发并行应用程序。准备Linux...原创 2019-04-14 21:48:14 · 705 阅读 · 0 评论 -
hadoop从零开始教程第三篇(HDFS原理)
1、概述1.HDFS集群分为两大角色:NameNode、DataNode (Secondary Namenode)2.NameNode负责管理整个文件系统的元数据3.DataNode 负责管理用户的文件数据块4.文件会按照固定的大小(blocksize)切成若干块后分布式存储在若干台datanode上5.每一个文件块可以有多个副本,并存放在不同的datanode上6.Datanode...原创 2019-04-27 19:18:39 · 226 阅读 · 0 评论