java中的数据处理框架-Joinery的初次使用(类似于python中的pandas)

最新推荐文章于 2025-04-01 11:52:28 发布

原创最新推荐文章于 2025-04-01 11:52:28 发布 · 1.6w 阅读

·

13

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

博主因习惯Python中pandas，在Java里找到类似的Joinery框架。介绍了Meaven配置，若处理csv需添加依赖，还进行了简单演示。同时分享了相关资料，包括Maven配置、DataFrame手册及GitHub源码地址。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

前言

由于用惯了python中的pandas，在写java代码时也想找找类似的框架，便发现了Joinery。

Meaven配置

	<dependency>
	  <groupId>joinery</groupId>
	  <artifactId>joinery-dataframe</artifactId>
	  <version>1.9</version>
	</dependency>

如果需要处理csv的话，还得添加一个依赖

<dependency>
	    <groupId>org.apache.poi</groupId>
	    <artifactId>poi</artifactId>
	    <version>3.17</version>
	</dependency>

简单演示

import java.io.IOException;
import java.util.Arrays;
import java.util.Set;
import joinery.DataFrame;

public class Demo {
	public static void main(String[] args) {
		 //创建
		 DataFrame<Object> df = new DataFrame<>("name", "value");
		 //添加数据
		 df.append(Arrays.asList("alpha", 1));
		 df.append(Arrays.asList("bravo", 2));
		 //行数
		 System.out.println(df.length());
		 //空表判断
		 System.out.println(df.isEmpty());
		 //多列合并成一列进行输出
		 System.out.println(df.flatten());
		 //计算常用统计量
		 System.out.println(df.mean().col("value"));
		 System.out.println(df.median().col("value"));
		 System.out.println(df.max().col("value"));
		 System.out.println(df.min().col("value"));
		 System.out.println(df.var().col("value"));
		 // 以下演示如何获取每一格的数据
		 Set<Object> indexs = df.index();
		 Set<Object> columns = df.columns();
		 for(Object index:indexs){
			for(Object column:columns){
				System.out.print(df.get(index, column));
				System.out.print("\t");
			}
			System.out.println();
		 }
		 //保存为csv文件
		 try {
			df.writeCsv("./test.csv");
		} catch (IOException e) {
			e.printStackTrace();
		}
	}
}

运行结果如下
在这里插入图片描述
保存文件如下

相关资料

首先是Maven，里面可以选择更多版本的配置
https://mvnrepository.com/artifact/joinery/joinery-dataframe
然后是DataFrame的手册，可以在里面查找更多的方法，其实都和pandas的差不多。
http://cardillo.github.io/joinery/v1.9/api/reference/joinery/DataFrame.html
接着是GitHub地址，有兴趣的可以研究研究源码
https://github.com/cardillo/joinery

喜欢coding的谢同学

博客等级

码龄7年

289
原创

384
点赞

2093
收藏

359
粉丝

关注

私信

热门文章

分类专栏

展开全部收起

上一篇：: 数学建模入门-python实现两个母体常用参数检验

下一篇：: 封装一个简单的HBaseUtil

最新评论

数学建模入门-python实现简单的马尔可夫链
m0_59250772: 您好！打扰您了！我是一名大四数学系的学生，然后我选择的论文和马尔可夫有关，看到您文章写到用python来计算转移概率和转移矩阵，所以想问下您！有这方面相关的书籍推荐吗？我自己网络上能查到的信息很少且没用。谢谢您了！
python爬取豆瓣短评，提取出现最多的词语
2401_83608760: 有完整的源码吗
LeetCode数据库排名类汇总
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)提升标题与正文的相关性；(2)增加除了各种控件外，文章正文的字数；(3)使用更多的站内链接。
大数据分析入门10分钟快速了解SQL
普通网友: 每当我阅读你的编程博客文章时，我总能感受到你的专业水平和耐心解答的精神。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
大数据分析入门之10分钟掌握GROUP BY语法
普通网友: 优质好文，支持支持。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】

最新文章

目录

展开全部

收起

评论 5

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。