自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

chftig

学习经验分享记录

  • 博客(9)
  • 资源 (2)
  • 收藏
  • 关注

原创 01.聚类分析-Kmeans的简单实现

Kmeans实例实现代码软件环境:scala2.10.4+spark1.6.3import org.apache.log4j.{Level, Logger}import org.apache.spark.mllib.clustering.{KMeans, KMeansModel}import org.apache.spark.mllib.linalg.Vectorsimport org.ap...

2018-02-27 10:58:02 667

原创 一个日志实时处理方案

主要功能 *日志实时写入ES,实现实时查询 *日志实时写入HDFS,用于日志分析 *日志异常实时预警使用的主要组件 rsyslog、flume、kafka、hive、zookeeper、storm、presto、sqoop本案例也是第一次尝试,基本实现了自己需要的功能,中间可能有许多不是很合理的地方。大致架构思路如下:

2017-07-31 14:45:46 1976

原创 Kettle调度实现

本文介绍使用shell调用kettle job实现数据调度功能。主要功能:1、通过crontab定时调度shell2、使用shell调用kettle job 可以快速配置需要调度的JOB3、调度异常发送邮件预警shell调度kettle job的脚本实现基本步骤为 1、创建extract文件夹,用于存放脚本&JOB配置文件 2、创建extract_log文件夹,用于存放调度log 3

2017-07-31 14:05:42 4889 2

原创 sqoop运用

介绍下从通过sqoop将数据定时转移至mysql的使用方法过程:把存储在hive表的日志数据汇总成天、时、分数据,然后把三份数据同步至mysql前提:hive表已创建好、mysql表已创建好将可执行sqoop语句封装成shell脚本1、汇总脚本etl.sh#!/bin/bash. ~/.bash_profiletoday=$(date -d '-0 day' '+%Y%m%d')yetoda

2017-07-31 11:27:25 649

原创 Flume基本使用

Flume的核心组件为source、channle、sink:组件描述source可以对接数据源,可以是mysql、file、tcp等 channle为数据传输通道,可指定为内存、文件等 sink为数据输出,可以是file、mysql、es、hdfs、hive、kafka等等功能描述-1由于soucre和sink均有多样性,因此可以根据需求非常灵活的组织自己需要的数据流转模式,可以跨越各种限制功

2017-07-31 11:14:03 506

原创 Hadoop环境搭建

包含hadoop、hive、hbase、zookeeper、storm、spark、Kafka、flume、sqoop一、服务器基本配置服务器系统版本:CentOS release 6.4 (Final) JDK版本:java version “1.7.0_60*二、 集群信息三、 各组件版本信息四、安装步骤4.1 环境基本配置addusr hadusr #创建用户passwd h

2017-07-29 16:23:23 595

原创 03、用Tensorflow训练一个线性回归

目标:根据给定的线性回归公式,训练构建模型,获取与给定公式参数相差最小的参数值代码:#######################################################################给出一个线性代数,通过给出的值训练自己模型,得出接近给出线性代数的参数#################################################

2017-07-29 16:14:52 311

转载 02、Tensroflow简单例子

实现乘法计算 实例代码#ex1.pycoding:utf-8import tensorflow as tf#定义两个变量a = tf.placeholder("float")b = tf.placeholder("float")#创建一个OP,mul为乘法函数y = tf.mul(a,b)#建立会话sess = tf.Session()#启动会话 输入数据 计算节点 打印数据prin

2017-07-29 15:58:02 636

原创 01、Tensorflow环境安装

基础环境:cnetos7+python2.7.6+ Cuda 7.0+ CUDNN 6.5 #一定要用centos7系统,低版本的由于glib版本低,会导致各种问题出现1、支持PGU(若不开启GPU运算可略过此步):a、Cuda 7.0 下载地址:https://developer.nvidia.com/cuda-toolkit-70 下载 run文件,安装时第一个选项选择N,否则安装会出问题

2017-07-29 15:39:14 318

修改MySQl乱码的问题

通过在修改MySQL中的配置文件,可以解决繁琐的乱码问题

2010-05-21

DW建设方案

校验描述了传统数据仓库建设方案,以及数据同步掉不策略。

2017-07-31

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除