
大数据
文章平均质量分 81
大数据技术
源图客
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
大数据集群资源
密码:hadoop。原创 2025-07-08 22:57:10 · 159 阅读 · 0 评论 -
Apache Nutch介绍与部署编译
Apache Nutch是一个开源的Java搜索引擎框架,提供Web爬虫和全文搜索功能,支持构建内网或全网搜索引擎。其特色包括高效抓取数十亿网页、快速索引和高质量搜索。安装需配置Java、MySQL、Ant环境,并修改Nutch配置文件连接数据库。主要步骤包括上传解压软件包、设置环境变量、创建MySQL数据库表,最后通过Ant编译生成运行环境。编译过程可能耗时较长,失败时可清理后重新尝试。原创 2025-07-07 10:16:32 · 1053 阅读 · 0 评论 -
Apache Hudi 1.0.0源码编译
源码编译原创 2025-01-03 22:27:17 · 768 阅读 · 0 评论 -
Apache Doris介绍
Apache Doris 是一款基于 MPP 架构的高性能、实时的分析型,以高效、简单、统一的特点被人们所熟知,仅需亚秒级响应时间即可返回海量数据下查询结果,不仅可以支持高并发的点查询场景,也能支持高吞吐的复杂分析场景。基于此,Apache Doris 能够较好的满足加速等使用场景,用户可以在此之上构建大屏看板、用户行为分析、AB 实验平台、日志检索分析、用户画像分析、订单分析等应用。原创 2024-12-27 15:09:08 · 1300 阅读 · 0 评论 -
DataSphereStudio介绍
DataSphere Studio(简称 DSS)是微众银行自研的数据应用开发管理集成框架。基于插拔式的集成框架设计,及计算中间件,可轻松接入上层各种数据应用系统,让数据开发变得简洁又易用。在统一的 UI 下,DataSphere Studio 以工作流式的图形化拖拽开发体验,将满足从数据交换、脱敏清洗、分析挖掘、质量检测、可视化展现、定时调度到数据输出应用等,数据应用开发全流程场景需求。借助于。原创 2024-12-26 11:44:47 · 1696 阅读 · 0 评论 -
大数据专业技能及岗位解读
查询分析:Hive、Impala、Pig、Presto、Phoenix、SparkSQL、Drill、FlinkSQL、Kudu、 Kylin、Druid、ClickHouse。操作系统:CentOS、Alma、Rocky、Ubuntu、openEuler、openKylin、TencentOS、OpenCloudOS。可视化:Tableau、Kibana、Superset、Grafana、Plotly、Metabase、FineBI、PowerBI。原创 2024-12-24 17:33:33 · 1492 阅读 · 0 评论 -
Apache Celeborn详解与部署应用
Apache Celeborn 源于自研的 EMR Remote Shuffle Service,旨在解决中间数据遇到的及问题。原创 2024-10-26 12:06:36 · 2079 阅读 · 0 评论 -
Apache Linkis介绍与部署
Apache Linkis 计算中间件项目,是由微众银行大数据平台团队在2019年7月进行开源,并于2021年8月正式捐献给全球顶级开源社区 Apache 软件基金会(ASF),成为 ASF 孵化项目。Apache 软件基金会(ASF)孵化器于2022年12月03日,通过了 Apache Linkis 计算中间件项目的孵化毕业投票。2023年01月18日,Apache 软件基金会官方宣布 Apache Linkis 顺利毕业,成为 Apache 顶级项目(TLP)。原创 2024-10-17 09:15:39 · 1720 阅读 · 0 评论 -
Apache Livy介绍与部署
Apache Livy 是一个为 Apache Spark 提供的强大而灵活的 RESTful 接口,旨在让开发者无论在何处,都能轻松地与 Spark 进行交互。这个开源项目支持执行代码片段或程序,并且可以在本地 Spark 环境或 Apache Hadoop YARN 集群中运行。应用场景总的来说,Apache Livy 是一个强大、开放且易于使用的工具,对于那些希望在 Spark 上构建更高效、更灵活的数据处理系统的开发者而言,它是一个理想的选择。原创 2024-10-16 11:14:01 · 1680 阅读 · 0 评论 -
华为大数据平台-FusionInsight介绍
FusionInsight HD是华为开发的完全开放的大数据计算平台,基于开源社区软件进行功能增强,提供实时消息服务、实时事件处理,可运行在任意标准的X86服务器或华为TaiShan服务器上。原创 2024-08-01 17:01:41 · 2155 阅读 · 0 评论 -
讯飞大数据平台-Odeon(奏乐堂)介绍
Odeon架构原创 2024-08-01 16:36:32 · 202 阅读 · 0 评论