自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(503)
  • 资源 (3094)
  • 收藏
  • 关注

原创 基于akka与scala实现一个简单rpc框架

RPC,即 Remote Procedure Call(远程过程调用),说得通俗一点就是:调用远程计算机上的服务,就像调用本地服务一样。RPC 可基于 HTTP 或 TCP 协议,Web Service 就是基于 HTTP 协议的 RPC,它具有良好的跨平台性,但其性能却不如基于 TCP 协议的 RPC。会两方面会直接影响 RPC 的性能,一是传输方式,二是序列化。

2025-06-20 10:14:52 65

原创 基于Python实现看图说话和微表情识别

Flickr8k Dataset:该数据集已经成为研究基于句子的图片描述的基准,该数据集包括了 8052 张图片,每张图片包括了 5 句相关的描述性句子,示例如下:图 1 数据集的示例。

2025-06-20 10:14:07 203

原创 基于JSP+MySQL实现(Web)在线食品交易平台

项目圆满完成了外面系统预期实现的所有功能。浏览菜单搜索(按热度搜索/按食品种类搜索)编辑个人资料,包括:顾客的头像,顾客的名字,顾客的联系电话,顾客希望送餐的地址 ,顾客登录的密码,顾客用以找回密码的密保问题和密保答案购买商品查看历史订单编辑个人资料,包括店家名字,店家联系电话,店家登入密码,店家用以找回密码的密保问题和密保答案店家开店编辑店铺资料,包括:店铺的图片,店铺的名字,店铺联系电话,店铺实际地址,店铺的介绍,

2025-06-19 10:35:56 415

原创 基于Android+MySQL的邮件检索

主线程启动子线程用于查询数据库,子线程连接腾讯云服务器上部署的MySQL数据库,并发送相应的SQL语句,服务器返回查询结果后,子线程通过Handler给UI界面传递信息,并在UI上将结果展示给用户。6、连接数据库时出现【Accessdeniedforuser'root'@服务器ip】的问题,应该权限出错,尝试解决未果,直接在服务器中修改配置文件,把MySQL的拦截关掉了,所有用户直接无密码登录,有风险,暂未解决。该函数遍历所有邮件,截取有用信息,存成一个DATA类的示例,最后返回一个List。

2025-06-19 10:35:06 402

原创 基于C++实现(控制台)机械提取词频

试想,对于文档字符串中的字符“一”,从这个字符开始,它只用匹配“一”开头的所有词就行了,而在上述算法中它和非“一”开头的词进行了大量无用的匹配。程序开始,我们不止给分词词典建立字典树,同样给停止词典建立一个字典树,在统计完词频输出结果时,如果对应词条可以与停止词典字典树中的词条匹配,那么就忽略这一词条。,而词典中的词大多为 2~4 字,最多不超过 10 字,且其后节点分支的数量级一般在 100 左右,这里可以近似将从某个字符开始在字典树中匹配的时间复杂度视为。我选择了百度的停止词典,在本项目中的位置是。

2025-06-18 11:25:57 211

原创 基于Python实现函数绘图语言解释器

这个是相对容易发现的,还有比较隐秘的在于,两个相交的曲线,或者两个重叠的曲线,他们属于不同的 for 语句,这里似乎可以节省不少。首先表示原子操作,原子操作被分为 5 类,表示为元组 (Operation.TYPE, arg1, arg2, ...) ,第一个元素是操作类型,可以是设置 origin、设置 rot、设置 scale、设置背景颜色、设置绘图颜色和绘点,根据操作类型不同,后面给出 1 - 3 个参数,参数都是整数或浮点数,比如点的坐标,缩放的值等。记号流是词法分析器的输出和语法分析器的输入。

2025-06-18 11:25:17 334

原创 基于Python实现支持向量机的物体识别

评估的过程主要是通过改变以及组合该方法的”组件“,包括使用多种关键点检测器(keypoint detector,如 Harris-Laplace detector 以及 Laplacian detector),不同级别的几何不变性(geometric invariance,如尺度不变性 S、尺度旋转不变性 SR、仿射不变性 A),不同的特征描述符(如 SPIN、RIFT、SIFT),不同的向量机核(如常用的线性核、多项式核、RBF 核、文章提出的$ \chi^{2}$ 核和 EMD 核)。

2025-06-17 10:30:09 615

原创 基于Python实现自然语言处理(主题层次的情感分类)

该项目作业的具体任务是来自于 BDCI2018-汽车行业用户观点主题及情感识别的题目。数据是网络中公开的用户对汽车相关内容的评价文本。此任务是对每条文本内容(即用户评论)进行分析,确定该条评论中讨论的主题以及每个主题的情感信息,以此获知用户对所讨论主题的偏好。其中主题一共分为 10 类:动力、价格、内饰、配置、安全性、外观、操控、油耗、空间、舒适性。情感分为 3 类:中立、正向、负向,分别用数字 0、1、-1 表示。

2025-06-17 10:11:55 657

原创 基于 Python 实现特征选择的遗传算法

特征选择在概念上十分简单,即对原有特征进行删选优化。特征选择就是从原始特征中挑选出一些最有代表性、分类性能最好的特征进行分类。特征选择要解决两个问题:如何确定选择的标准,如可分离性判据;如何构建快速寻优算法。特征选择根据是否直接考虑分类器性能可以分为两种方法:Filter 方法:根据独立于分类器的指标 J 来评价所选择的特征子集 S,在所有可能的特征子集中搜索出使得 J 最大的特征子集作为最优特征子集。不考虑所使用的学习算法。

2025-06-16 11:18:48 898

原创 基于 Matlab 和 Truetime 的网络控制系统仿真

在 Regulator Node 中的 TrueTime Kernel 中,模拟了控制器从网络中接收 y(k),并生成 u(k),将 u(k)发送到网络中的过 程。运用 LMI 工具箱对 P>0 进行求解,得到当丢包率大于等于 0.96 时,系统不满足均方稳定(MSS),当丢包率小于等于 0.95 时,系统是均方稳定的。这一部分简要重述该网络控制系统的数学模型。

2025-06-16 11:18:03 932

原创 基于JavaScript 实现拼图游戏

游戏区为一个 3*3 网格,每个格中填充一张图片块,其中一个块为空白。否则会显示错误提示。Steps 记录步数,minute、second 为 HTML 页面上显示的时间,timer 是计时器,每 1 秒执行 updateTime 函数,更新页面上的时间:(判断秒数进位分钟,个位数的分、秒显示为两位)Random 为游戏中缺少的图片块(0-8)编号,empty 为游戏中网格当前为空白的块(0-8)编号,pictures 是一个数组,下标为图片块编号,值为图片块当前的位置编号,如果图片块缺少,值为-1。

2025-06-14 09:32:51 592

原创 TEC-5H 模型计算机电路设计与仿真

本次实验基于 Proteus 平台,结合了上学期计算机组成原理所学的相关知识,实现了 TEC-5 模型计算机的所有功能,并在此基础上修改了部分数据通路和微地址和二进制代码格式,加入了立即数寻址、移位等原先不具有的功能。TEC-5H 是一个八位的模型计算机,支持八条 TEC-5 原生指令和五条额外添加的指令。由运算器模块、存储器模块、时钟信号产生模块和微程序控制器等模块组成,具体在第三部分 TEC-5H 模型计算机和第四部分微程序控制器描述。

2025-06-14 09:31:58 679

原创 利用 FPGA 设计五段流水 CPU

计算机组成原理是计算机专业的核心基础课。该课程力图以“培养学生现代计算机系统设计能力”为目标,贯彻“强调软/硬件关联与协同、以 CPU 设计为核心/层次化系统设计的组织思路,有效地增强对学生的计算机系统设计与实现能力的培养”。课程设计是完成该课程并进行了多个单元实验后,综合利用所学的理论知识,并结合在单元实验中所积累的计算机部件设计和调试方法,设计出一台具有一定规模的指令系统的简单计算机系统。

2025-06-13 10:47:35 616

原创 基于C#+SQLServer2016实现(控制台)小型机票订票系统

a. 航班表b. 旅客表c. 机票表d. 订单表e. 机票订票系统的数据关系图:在上述关系中,机票表中 tiket_flight 为航班表中 flight_id 的外键,删除航班表中特定航班时机票表中特定航班的所有机票被删除(级联删除)。订单表中 order_traveller 为旅客表中 traveller_id 的外键,当删除旅客信息时,订单表中所有该旅客的订单被删除。

2025-06-13 10:46:28 1037

原创 基于C语言实现(控制台)图书管理系统

项目符合标准 C 语言的代码定义我们小组做了图书管理系统的设计,该图书管理系统可供学生、管理员以及游客使用,可以对书籍进行查看、借阅等相关操作。

2025-06-12 10:44:35 835

原创 基于JavaScript实现(二叉排序树)社会关系网

输入一组关键值,建立相应的二叉排序树,完成结点的查找和删除操作。要求:(1) 可以实现删除根节点、叶子节点以及其他任意节点的功能;(2) 可以随时显示操作的结果。自学包括 html,CSS,Javascript 的语言,明显感受到和 C++ 相比,这些语言在 可视化方面更加便捷。原本的计划是用 C++ 结合 Qt 编写程序,因为大一以来一直在学习 C++,对 于 python,Java,HTML 等则不太熟悉。

2025-06-12 10:43:48 562

原创 基于 HTML5 的画图工具

由于计算机图形学设备的不断更新和图形软件功能的不断扩充,也由于计算机硬件功 能的不断增强和系统软件的不断完善,计算机图形学的应用极大地提高了人们理解数据、 观察或想象图形的能力。[3]通过 HTML 实现计算机图形学中基本图形的扫描转换和图形变 换的算法,更加深刻地理解了算法地原理与含义,优化了目前画图软件的功能。

2025-06-11 11:22:43 425

原创 基于C++实现(控制台)小学算数自测系统

该功能目的在于保护用户的信息以及设置改系统的针对性,用户进入改系统以后,需要选择角色,如果老师选择了学生,或者学生选择了老师,会分别在输入了错误的账号密码和错误的密钥以后回到最初界面,学生只能进行登陆,老师可以进行登陆,也可以在输入密钥正确以后进行注册。该函数的功能:老师选择修改某个学生的信息。用户首先选择自测模块,选择好了以后将进行难度选择,并进行题量的自定义,在做题过程中,如果正确,将会提示正确并进入下一题,如果错误会显示正确答案,并提醒用户是否要保存到错题集当中,在用户输入指令后进入下一题。

2025-06-11 11:21:55 413

原创 基于C++实现(控制台)微软 CryptoAPI 的密码系统

用于获取句柄到一个特定的密钥容器的特定内加密服务提供商。HCRYPTPROV *phProv, //指向 CSP 句柄的指针LPCSTR szContainer, //密钥容器名称LPCSTR szProvider, //以空值结尾的字符串,其中包含要使用的 CSP 的名称DWORD dwProvType, //指定要获取的提供程序的类型 DWORD dwFlags //标志值。

2025-06-10 11:06:55 559

原创 基于HTML+CSS+JavaScript实现静态高校智慧学习平台

高校智慧学习平台主要是为在校学生提供一个开源的专业技术课程的学生平台,该平台主要包括以下模块:1、注册页面:为新用户提供注册的入口;2、导航条:主要包括主页、慕课网、图书等子项目;3、轮播图:展示教学产品和职前规划等内容;4、阶段成长:主要跟踪学习的过程;5、资源课程的介绍;6、联系方式和合作伙伴;7、注销等功能。

2025-06-10 11:05:32 806

原创 基于Java+MySQL实现(GUI)客户管理系统

本项目为了方便维护客户信息为了方便维护客户信息,对客户进行统一管理,可以把所有客户信息录入系统,进行维护和统计功能。可通过文件的方式保存相关录入数据,对系统资料进行磁盘文件保存。旨在实现客户电子化管理,它主要包括客户界面、客户信息的增加界面、客户信息的修改界面、显示全部客户的信息、删除一条用户信息、按照用户的编号查询用户信息、按照用户的姓名查询用户信息、按照用户的地址查询用户信心、退出系统界面。

2025-06-09 10:23:01 865

原创 基于ASP.NET+ SQL Server实现(Web)医院信息管理系统

由登录界面进入母版页衍生出来的子页面,点击菜单栏按钮进行页面跳转,GridView 控件通过业务逻辑层获取数据访问层的数据并显示出来,并实现了数据库的增删查改操作。利用表单输入,并将数据插入数据库中,通过返回数据集并绑定 GridView,在页面中显示数据表的数据集。本系统登录后进入系统主界面,按返回键还是可以回到登录界面,修改颜色界面只能修改当前界面的样式,切换界面之后效果消失,暂时没有很好的解决办法。成功完成医院信息管理系统设计,实现了导医服务、医生服务、药房管理、门诊统计、系统设置和单据打印的功能。

2025-06-09 10:22:09 1046

原创 基于Java(Spring boot+Hibernate)+VUE+MySQL实现(Web)员工信息管理系统

开发语言:Java数据库:MySQL开发主要工具:Eclipse开发环境:Windows 7。

2025-06-07 09:52:20 337

原创 基于Java+VUE+MariaDB实现(Web)仿小米商城

Hibernate 是一个 ORM 框架,而 JPA 则是一种 ORM 规范,JPA 和 Hibernate 的关系就像 JDBC 与 JDBC 驱动的关系,即 JPA 制定了 ORM 规范,而 Hibernate 是这些规范的实现(事实上,是先有 Hibernate 后有 JPA,JPA 规范的起草者也是 Hibernate 的作者),因此从功能上来说,JPA 相当于 Hibernate 的一个子集。客户端采用 vue 框架,实现商品的查找,购物车的显示,商品加入购物车等操作。

2025-06-07 09:51:32 507

原创 基于Java实现生产者与消费者算法模拟

生产者和消费者的个数都为 3,此时将轮流抢占,由于周期未成大于 1 的整数比例关系,所以依然是生产与消费轮流进行,每次当消费者完成 take 操作之后都将快速输出对应的当前队列 item,并将其加入到当前对象的 sum 中去,传回 sum 参数和对应的 id 参数,将每次更新的结果都输出到 Excel 表格中,然后使用 python 处理数据,由于随机设置了结束的时间和次数,所以数据点的个数也与上一次测试不尽相同,得出折线图如图 7-4 所示。当消费者消费数据很慢时,生产者就会阻塞很长的时间。

2025-06-06 10:36:11 949

原创 基于 JavaSE 实现(GUI)的 小型ATM 银行模拟系统

该软件主要是利用 JavaSE 的 I/O 流进行文件读写设计开发一个小型的银行模拟系统,菜单面板具有七大功能:开户、存款、取款、挂失、查询、改密、转账,其实还有一些工具类功能:实时日期显示、MD5 加密(暂未实现),操作界面要符合用户的一般习惯。由于 JavaSwing 原生的样式不是很美观,所以加入了 UI,引用了一个开源的 UI 依赖库。运行程序,首先进入菜单。

2025-06-06 10:35:18 749

原创 基于Java(SpringBoot、Mybatis、SpringMvc)+MySQL实现(Web)小二结账系统

1)用户信息管理:注册,登录,注销2)订单管理:添加/查看订单3)用户反馈4)商家对菜品管理:上架/下架,更改菜品,显示菜品列表5)评论管理:回复用户评论6)用户管理:删除用户7)管理员管理:修改信息商家点击用户管理模块下用户列表。点击要删除的用户,确认删除,刷新页面。用户信息被删除。点击所需要查看的模块包括,显示菜品列表,菜品上架/下架,修改菜品。显示用户的评论,并选择回复商家查看订单1.点击管理员管理的修改密码功能2.修改新的密码3.重新登录。

2025-06-05 09:31:13 1067

原创 基于Java(Jsp+servelet+Javabean)+MySQL实现图书管理系统

2)图书的借阅:借阅图书时,需要判断该读者现已借阅的图书数量,若超过 3 本,则暂时不能借书;4)借阅处罚管理:输入用户 id,可以查看用户的借阅违规处罚情况,用户缴纳罚款后,可点击“缴纳罚款”,撤销对该生的处罚,恢复其正常借阅和归还权利;1)图书的查询:图书的查询可以通过搜索图书 id、书名、作者名、出版社来实现,显示结果中需要包括书籍信息以及是否被借阅的情况;3)修改图书信息:通过点击“修改信息”,打开修改图书信息页面,修改相应信息后(书名、作者、出版社、其他信息),点击保存;

2025-06-05 09:30:12 829

原创 基于C++实现(WinForm) LAN 的即时通信软件

设计一个基于 LAN 的即时通信软件,实现在局域网下可靠的、稳定的即时通信功能以及其从属的附加功能。public://主对话框指针public://消息接收响应public:protected:void CMySocket::OnReceive(int n)//消息响应处理if(dlg->online)//在线才进行响应mes trans;if(!}//获取服务器消息CString txt1=trans.from,txt2="在线用户";

2025-06-04 11:06:28 287

原创 基于C++实现(控制台)学生管理系统

通过这次课设真实的体会到了企业软件开发的不易,自己也变得严谨了起来。从对代码格式的要求再到对特殊数据的判定自己也成长了不少。在这次课设中也学到了不少的东西,用 Markdown 写文档自己也算学到了很多。更重要的是对自己代码的严格要求,以企业的标准要求自己,这样才能更适应以后的工作。

2025-06-04 11:05:38 358

原创 基于C++实现文件的哈夫曼编码与解码

同时,体会到通过算法减少文本空间,降低计算机磁盘负荷的妙处,我们需要优秀的算法来提升计算机性能。在实际的压缩算法中虽然很少听到哈夫曼编码,但其实它并没有被淘汰,而是作为核心的算法,结合了其他的压缩算法,实现对文件(文本,PPT,图片,电影等)的压缩,给日常生活带来极大便利。字符针对性的进行了哈夫曼编码,若想实现中文及各种支持语言的编码,可在此代码基础上,进行优化。通过编写利用哈夫曼算法实现的文件编码解码小工具,可加深对哈夫曼算法的理解,以及编码的熟练度。这里我准备了一首小诗,写入文件,并将其命名为。

2025-06-03 10:12:36 826

原创 基于Java实现(控制台)毕业生管理系统

进入此界面后会询问1)所添加的账号个数2)所添加毕业生的学号(其中要校验学号的合法性)3)所添加毕业生的姓名、在校时所在的学院、姓名等信息;进入此页面后会询问1)所编辑的毕业生账号(此处校验是否存在)2)所要编辑的信息(此处展示原信息,请用户确认是否编辑);进入页面后,先校验是否登记过就业信息,若已登记过,则显示就业信息,否则,跳转至登记(编辑)就业信息页面;进入此界面后会询问1)所删除的账号个数2)所删除的毕业生的学号(需校验);进入此页面后可1)按就业状态查看就业信息2)按性别查看就业信息;

2025-06-03 10:11:46 576

原创 基于Java+MySQL 实现(Web)企业信息展示系统

在登录注册中,游客用户可以通过注册功能使自己成为注册用户,在注册时,游客用户要填写自身相关的信息,其中用户 ID 为用户的唯一标识,也是用户登录系统的登录账号,注册功能只能生成一般用户的账号。登录功能是为注册用户提供的功能,用户通过登录功能,来对个人信息进行查看和维护。并且在登录注册页面中,添加了忘记密码的功能,用户可以通过该功能,填写自己的用户 ID、注册邮箱,发送到服务器,服务器校验后,会向用户注册邮箱中发送一个随机的 6 位数字的密码。

2025-05-30 11:29:18 679

原创 基于Java(SSH框架)+MySQL 实现(Web)公司通用门户(CMS)网站

显示公司的信息,包括公司介绍,公司大事件,企业文化,福利待遇等。本系统为公司门户网站系统,其中分为前门展示模块与后台管理模块。其中前台展示模块,是公司与广大消费者用户信息交互的桥梁,前台的信息展示中的公司信息,新闻信息,产品信息,视频信息均由后台发布,由后台进行管理,后台的操作影响到前台的显示。同时前台支持用户留言,获得用户信息的反馈,实现用户和企业的沟通。用户通过在前台注册成为企业会员,可以获取公司企业的信息动态,用户浏览和注册简单易用,并且使用无刷新验证和提交技术,提高用户体验。

2025-05-30 11:28:33 735

原创 基于Java+MySQL 实现(Web)交友网站

该系统后端全部使用java语言,使用eclipse 开发工具,前端使用vue,使用sublime开发工具。在数据存储方面,使用Mysql作为数据库。本论文通过对婚恋网站的现状和发展进行分析,设计并开发出了一个婚恋交友网站,实现了javamail的应用。通过本次项目,对软件工程有了更深层次的认知,对java的设计理念有了更好的理解,对于学术沉淀起了很大的作用。

2025-05-28 10:34:00 894

原创 基于 Java 实现校园快递代拿系统

前段时间在做课程设计的时候,有一个需求是【用户支付后系统自动分配配送员,且保证订单能平均配分】,而我使用了RocketMQ + Redis实现了这个功能,所以本篇就来简单聊一聊我为什么这么做?这么做的好/坏处在哪?PS:"保证订单能平均分配"中的。

2025-05-28 10:26:11 409

原创 基于 Java(MyBatis框架) 的学生选课管理系统

主要存在的问题就是对 MyBatis 并不是很熟练,环境配置还存在很大问题。还存在很多 bug,还有一些功能还没完善。准备假期再重新系统的学习一遍 Java,争取把漏补上。

2025-05-26 10:21:46 829

原创 基于 Java实现的百度地图(eCharts)学生籍贯统计

echarts 对象:在标签式引入的方式中,有 echarts 对象,所有图表的初始化、事件的绑定...等等都通过 echarts 这个对象来处理。):· 准备一个 DOM:这是存放 echarts 图表的 DOM,切记在此需要指定 DOM 的 width 和 height 属性(即官网所说的”具备大小的 DOM“),否则图表不会显示的。

2025-05-26 10:20:57 630

原创 基于Java+MySQL 实现(Web)网络考试系统

在我们以往的考试经历中,我们可以看到,每次考试都需要经过出试卷、印试卷、发卷、做卷、收卷、阅卷、统计等过程,这几个过程有着很强的先后次序,不能顺序颠倒。这些过程中,又以出卷、阅卷和统计最为复杂,当一次考试涉及的人数众多时,老师需要批阅非常多的卷子,重复的批阅卷子浪费了大量的时间,此外,不仅效率底下,同时大量的阅卷工作也让老师疲于应付,最后导致阅卷的准确率下降。即便阅卷完成之后,工作还没结束,还需要对这些卷子进行分数登记、成绩统计以及对各个题目进行错误率统计,这些工作消耗时间非常多,因此效率也是非常低的。此外

2025-05-24 09:24:07 1072

原创 基于Java+MySQL实现(Web)图书借阅管理系统

(1) 读者登录,注册,修改密码(2) 基本资料查看,修改(3) 图书查询(复杂查询),仿京东商城以图片卡片形式分页展示,可点击每本书的评价数进行评价,点击卡片查看详细图书信息以及借阅(4) 个性化推荐图书:根据读者的兴趣爱好,每本书对应读者的浏览量,每本书的借阅量,每本书的评论数进行多重排序,展示在读者面前(5) 历史记录浏览,查询(6) 基于 Elasticsearch 搜索引擎的全文检索。

2025-05-24 09:18:05 951

2015-2025空气污染情况数据集(3000 行 24 列)CSV

此数据集包含来自中国五个主要城市(北京、上海、广州、成都和深圳)的合成但真实的空气污染数据。它从 2015 年到 2025 年,提供有关空气质量、气象条件和污染水平的宝贵信息。该数据集由 3000 行 24 列组成,涵盖了各种空气污染物、天气状况和地理细节。 该数据集专为数据分析、机器学习模型和空气质量预测应用程序而设计。

2025-05-30

哪吒之魔童闹海海报数据集JPG

数据文件:以JPG格式存储,包含海报图片、票房破亿时间戳、对应票房数值(如“80亿”)、海报文案(如“我在陈塘关很想你”)、主题关键句(如“好久不见,新年快乐”)等字段。

2025-05-30

探索和预测社交行为和性格类型数据集( 2,900 行和 8 列)CSV

深入研究外向与内向人格特质数据集,这是一个丰富的行为和社会数据集合,旨在探索人类性格的范围。该数据集捕获了外向和内向的关键指标,使其成为心理学家、数据科学家和研究社交行为、性格预测或数据预处理技术的研究人员的宝贵资源。 外向和内向等人格特征塑造了个人与社会环境的互动方式。此数据集提供了对独处时间、社交活动参加和社交媒体参与等行为的见解,从而支持在心理学、社会学、营销和机器学习中的应用。无论您是预测性格类型还是分析社交模式,此数据集都是您发现迷人见解的门户。 数据集详细信息:数据集包含 2,900 行和 8 列。

2025-05-30

2006-2025 国内宏观经济数据集(21项)CSV

该数据集记录了国内生产总值(GDP)的相关数据,数据覆盖时间从2006年1月起至今,数据按月度进行统计。 包含:居民消费价格指数CP1、国内生产总值 GDP、制造业采购经理指数 PMI、消费者信心指数、业品出厂价格指数 PP1、海关进出口增减情况 HGJCK、财政收入 czsr、社会消费品零售总额、全社会用电分类情况表、社会融资规模增量统计、LPR品种数据、年度外汇储备数据、M2货币供应年率、外汇贷款数据、大宗商品价格、本外币存款、存款准备金率、央行货币当局资产负债、货币供应量、央行黄金和外汇储备、中国GDP年率。

2025-05-30

电动汽车数据集(10600条记录,22特征)XLSX

包含特征:电动汽车品牌、电动汽车产地、电动汽车产量、电动汽车销量、电动汽车运行公里数、电动汽车生产日期、拥有者会员级别、电动汽车原价、电动汽车售价、电动汽车利润、电动汽车过户状态、电动汽车厂商、电池容量(kWh)、续航里程(NEDC/CLTC)、充电效率(快充/慢充)、驱动形式(前驱/后驱/四驱)、市场份额、用户年龄、用户性别、用户职业、用户使用习惯(日均里程/充电频率)、电动汽车智能化水平(自动驾驶等级/OTA频率)。

2025-05-30

中医药材数据集(1500条记录,25特征)XLSX

包含字段:药材编号、中药名称、功效分类、性质、味道、归经、主要功效、适应症、用量_克、价格_元每克、价格等级、产地、采收季节、保质期_月、质量等级、库存量_公斤、年销量_公斤、供应商名称、供应商评分、炮制方法、毒性等级、批次号、检验报告号、录入日期、更新日期。

2025-05-30

房屋成交信息数据集(30199条记录,9特征)XLSX

包含字段:小区、户型、面积(㎡)、朝向、楼层、总楼层、城区、商圈、单价(元/㎡)、

2025-05-30

受欢迎的街头食品分类数据集(20类,3675张图像)JPG+CSV

此数据集旨在支持机器学习模型的开发和评估,用于对来自世界各地的流行街头食品图像进行分类。它包含高质量的标记图像数据,这些数据代表了不同地区和文化中常见的各种街头食品类别。 数据集内容 图像:在各种环境中捕获的单个街头食品的彩色图像,包括小贩摊位、市场、美食节和街头厨房。 统计数据:每个类的统计数据、它们包含的图像数量、类型和 etc 图像以类文件夹的形式popular_street_food 有关数据集的信息,请参见 dataset_stats.csv 食品: 玉米 饼、披萨片、汉堡、热狗、沙威玛、三明治、咖喱香肠、炸鱼薯条、帕尼·普里、Bánh Mì、阿雷帕斯、油条条、饼干、肉馅卷饼、烤肉串 (Shish Kebab)、泰式炒河粉、冰淇淋、可丽饼、布丁、咖喱角

2025-05-26

(1905-2024)喜马拉雅探险记录数据集(11,000+ 次)CSV

1905 年至 2024 年喜马拉雅山 11,000+ 次探险记录 表格和功能: 死亡 peak_id:峰的 ID peak_name:峰值名称 name: 登山家姓名 yr_season: 年份和季节 is_o2_used:如果使用了氧气 峰 host_contries: 可以攀登的国家 first_asc_yr: 上升的第一年 探险 peak_id:峰的 ID peak_name:峰值名称 nationality: 探险队的主要国籍(主要国籍) year: 探险年 season: 探险季节 host_cntr: 开始上升的国家 other_cntrs: 参加考察的国家(成员国籍) sponsor: 探险赞助商 leaders: 探险队的队长/队长 rte_1_name:第一个路由名称(类似于具有相同前缀的其余要素) team_asc_1:团队为某个路线名称上升的次数(类似于具有相同前缀的其余要素) is_disputed:成功有争议或未经验证 is_claim: 探险队声称登顶,然而,没有任何证据(可能是谎言) is_commercial_rte:如果探险是商业性的 is_standard_rte:如果路线是标准的(S Col-SE Ridge/N Col-NE Ridge/N Col) other_smts: 其他登顶的山峰 approach: 到达山上的主要探险中途点 bc_arrived: 到达大本营的日期 bc_left: 从大本营出发的日期 total_days: 探险队花费的总天数 exp_result: 探险的结果 is_traverse:如果已进行遍历 (?) is_ski_snowboard: 如果使用双板/单板滑雪进行下降 is_parapente:如果下降是使用 parapente 进行的 term_note: 峰会终止详情/结果 summ

2025-05-26

电动汽车销量(2010-2024)数据集(3799条记录,8特征)CSV

该数据集提供了 2010 年至 2024 年全球电动汽车 (EV) 市场的快照。它包括有关电动汽车销量、库存和市场份额的历史数据,按车辆模式(例如汽车)、动力总成类型(BEV、PHEV)和指标(例如库存份额、销售份额)分类。这些数据有助于了解电动汽车的初始采用趋势。 区 - 收集数据的地理区域(例如,澳大利亚) 类别 - 数据性质(例如,历史、预测) 参数 - 指标类型(例如,电动汽车销量、电动汽车股票份额) 模式- 运输方式(例如,汽车) 动力总成 - 电动汽车类型:BEV(电池电动汽车)、PHEV(插电式混合动力电动汽车)、电动汽车 年份 - 数据点的年份(例如,2011 年、2012 年) 单位 - 测量单位(例如, Vehicles, percent) value- 实际记录值

2025-05-26

葡萄酒评论数据集(130k 条评论)CSV+JSON

130k 条葡萄酒评论,包括品种、位置、酒庄、价格和描述 此数据集包含三个文件: winemag-data-130k-v2.csv包含 10 列和 130k 行葡萄酒评论。 winemag-data_first150k.csv包含 10 列和 150k 行葡萄酒评论。 winemag-data-130k-v2.json 包含 6919 个葡萄酒评论节点。

2025-05-14

流行运动鞋分类数据集( 5k 张图像,10列)JPG+CSV

包含超过 5k 张流行运动鞋的图像。 分类 Nike Air Force 1 低帮 Nike Air Force 1 Mid Nike Air Force 1 高 耐克 Air Max 1 耐克 Air Max 90 耐克 Air Max 95 耐克 Air Max 97 耐克 Air Max Plus (Tn) 耐克 Air Max 270 耐克 Air Vapormax Plus Nike Air Vapormax Flyknit 耐克 Dunk Low 耐克 Dunk High Nike Blazer Mid '77 运动鞋 耐克 Cortez Nike Air Jordan 1 高帮 Nike Air Jordan 1 低帮 耐克 Air Jordan 3 耐克 Air Jordan 4 耐克 Air Jordan 11 阿迪达斯 Stan Smith 阿迪达斯 Superstar 阿迪达斯桑巴 阿迪达斯 Gazelle 阿迪达斯 Forum Low 阿迪达斯 Forum High 阿迪达斯 Ultraboost 阿迪达斯 NMD R1 Yeezy Boost 350 V2 Yeezy 700 Wave Runner Yeezy 滑梯 匡威查克泰勒全明星高中 匡威 Chuck Taylor 全明星低 匡威卡盘 70 高 匡威卡盘 70 Low 匡威一星 Vans Old Skool Vans Sk8-Hi Vans 正宗 Vans Slip-On Checkerboard 新百伦 574 新百伦 990 新百伦 992 新百伦 327 新百伦 550 Puma Suede Classic Reebok Classic 皮革 锐步 Club C 85 亚瑟士 Gel-Lyte III 所罗门 XT-6

2025-05-14

假新闻检测数据集(20,000 篇新闻文章,7列)CSV

该数据集旨在使用机器学习和自然语言处理 (NLP) 技术练习假新闻检测。它包括 20,000 篇新闻文章的丰富集合,这些文章经过精心生成,以模拟真实世界的数据场景。每条记录都包含有关文章的元数据和一个标签,指示新闻是真实的还是假的。 该数据集还特意在某些字段中包含大约 5% 的缺失值,以模拟在实际项目中处理不完整数据的挑战。 列描述 title 总结文章的简短标题(约 6 个字)。 text 新闻文章的正文(平均 200-300 字)。 date 文章的发布日期,在过去 3 年中随机选择。 source 发布文章的媒体来源(例如,BBC、CNN、半岛电视台)。可能包含缺失值 (~5%)。 author 作者的全名。一些条目缺失 (~5%) 以模拟真实世界的不完整数据。 category 文章的一般类别(例如,Politics, Health, Sports, Technology)。 label 目标标签:真实或虚假新闻。

2025-05-14

鸟类迁徙数据集( 10,000 条合成记录)CSV

该数据集包含 10,000 条合成记录,用于模拟全球不同地区各种鸟类的迁徙行为。每个条目代表一只用跟踪设备标记的鸟,并包括飞行距离、速度、高度、天气状况、标记信息和迁徙结果等详细信息。 这些数据完全是使用基于鸟类学研究的已知范围的随机但真实的值合成生成的。它非常适合练习数据分析和可视化技术,而没有隐私问题或实际数据访问限制。由于数据集是人工的,因此可以自由用于教育、投资组合项目、演示仪表板、机器学习管道或商业智能培训。 此数据集包含 40 多列,支持多种分析类型。分析师可以探索诸如“某些物种是否会以更大的群体迁移”、“天气如何影响筑巢成功”或“哪些条件导致迁徙中断”等问题。用户还可以执行起点和终点位置的地理空间映射,按行为对鸟类进行聚类,或根据迁移月份和环境因素构建时间序列模型。

2025-05-14

1992 年至 2015 年在美国发生的野火的空间数据库 SQLite

此数据出版物包含 1992 年至 2015 年在美国发生的野火的空间数据库。这是最初为支持国家消防计划分析 (FPA) 系统而生成的出版物的第三次更新。野火记录是从联邦、州和地方消防组织的报告系统中获得的。此数据出版物中包含的记录需要以下核心数据元素:发现日期、最终火灾规模和至少与公共土地测量系统 (PLSS) 部分(1 平方英里网格)一样精确的点位置。在可能的情况下,对数据进行转换以符合国家野火协调小组 (NWCG) 的数据标准。执行了基本的错误检查,并尽可能地识别并删除了冗余记录。由此产生的产品称为火灾计划分析火灾发生数据库 (FPA FOD),包括 188 万条地理参考野火记录,代表 24 年期间总共烧毁了 1.4 亿英亩的土地。 字段说明见压缩文件。

2025-05-14

基于物联网的高级智能温室数据集(14 个变量的 30,000 条记录)CSV

关于 Dataset 高级物联网农业数据集捕获了提克里特大学农业实验室在两种温室设置(支持物联网与传统)下生长的植物的详细生理和形态测量。它由 Mohammed Ismail Lifta (2023-2024) 在 Wisam Dawood Abdullah 教授的监督下编译,包括跨越 14 个变量的 30,000 条记录量化叶绿素水平、生长速率、生物量(湿/干重)、根指标等,以及最终的分类类标签。 列 描述 类型 随机 样品批次 ID(例如 R1、R2、R3) 字符串 ACHP 平均叶绿素含量(光合色素) 浮 PHR 株高生长率 浮 AWWGV 营养生长的平均湿重 浮 阿拉普 每株植物的平均叶面积 浮 ANPL 每株植物的平均叶数 浮 ARD 平均根直径 浮 ADWR (英语) 根的平均干重 浮 PDMVG 营养生长中的干物质百分比 浮 ARL 平均根长 浮 AWWR 系列 根的平均湿重 浮 ADWV 营养部分的平均干重 浮 PDMRG 公司 根系生长中的干物质百分比 浮 类 实验组标签(SA、SB、SC、TA、TB、TC) 分类

2025-05-14

国际象棋游戏数据集( 20,000 个游戏,16特征)CSV.7z

国际象棋游戏数据集( 20,000 个游戏,16特征)CSV.7z

2025-05-14

作物推荐数据集(2200条记录,8特征)CSV

该数据集的结构是根据几个农业气候参数预测最适合种植的作物。它通常用于精准农业和机器学习应用程序,旨在为农民、农业顾问和政策制定者提供支持。 功能(输入): N – 土壤中的氮含量(以 mg/kg 为单位) P – 土壤中的磷含量(以 mg/kg 为单位) K – 土壤中的钾含量(以 mg/kg 为单位) 温度 – 平均温度(以 °C 为单位) 湿度 – 平均相对湿度(以 % ph 为单位) – 土壤 pH 值 降雨量 – 降雨量(以毫米 为单位) 标签(输出): label – 最适合给定条件的作物(例如,水稻、玉米、棉花等)

2025-05-14

用于真实世界行人异常检测和定位的 UCSD 数据集(50 个训练视频样本和 48 个测试视频样本)TIF

UCSD 异常检测数据集是通过安装在高处的固定相机获取的,可以俯瞰人行道。人行道上的人群密度是可变的,从稀疏到非常拥挤不等。在正常设置中,视频仅包含行人。异常事件是由于以下任一原因造成的: 非行人实体在人行道 中的流通 异常的行人运动模式 常见的异常情况包括骑自行车的人、溜冰的人、小推车的人,以及穿过人行道或周围草地的人。还记录了一些坐轮椅的人的情况。所有异常都是自然发生的,即它们不是为了组装数据集而暂存的。数据被分成 2 个子集,每个子集对应一个不同的场景。从每个场景中录制的视频片段被分成大约 200 帧的各种剪辑。 Peds1:一群人走向和离开摄像机的剪辑,以及一定量的透视失真。包含 34 个训练视频样本和 36 个测试视频样本。 Peds2:行人运动平行于摄像机平面的场景。包含 16 个训练视频样本和 12 个测试视频样本。 对于每个剪辑,ground truth annotation 包括每帧的二进制标志,指示该帧是否存在异常。此外,Peds1 的 10 个剪辑和 Peds2 的 12 个剪辑的子集都提供了手动生成的像素级二进制掩码,用于识别包含异常的区域。这是为了能够评估算法定位异常的能力的性能。

2025-05-06

眼睛图像数据集(8类,3997个图像)CSV+JPG

该数据集由眼睛图像以及一个包含图像名称和相应疾病标签的 CSV 文件组成。它专为使用深度学习和计算机视觉技术的疾病分类任务而设计。该数据集包含从不同个体捕获的眼睛图像。随附的 CSV 文件包括图像文件名和疾病标签。其他列提供相关的元数据或医疗属性。 Image Name(图像名称) 疾病标签: N:正常(无疾病) D:糖尿病视网膜病变 G:青光眼 C:白内障 A: 年龄相关性黄斑变性 H:高血压性视网膜病变 M:近视 O: 其他眼部疾病 其他列可能包括患者详细信息(如果可用)、图像捕获条件或严重性级别。

2025-05-06

石头剪刀布手势检测数据集(7521 张增强图像)JPG

7521 张增强的 640 × 640 张 TensorFlow 对象检测格式的图像

2025-06-14

眼睛检测数据集( 2000 张注释良好的图像)JPG

此数据集包含人脸图像,特别关注眼睛区域。该数据集包含近 2000 张注释良好的图像,用于训练对象检测模型,如 RCNN、YOLO 等,用于跟踪和检测眼球内的感兴趣区域。此数据集可用于构建白内障检测模型、眼动跟踪模型等。使用此数据集使用和构建项目时,享受乐趣!! --** 注意 **--- 数据集中包含的标注格式为:class_id、x_center、y_center、宽度、高度。'YOLOv8 标准'

2025-06-14

车牌识别数据集(10125 张车牌的真实图像)JPG

此数据集的制作不仅具有规模性,而且具有重要性。它详细、多样,可立即用于实际应用。 10,125 张车牌的真实图像 每张图像都包含高质量的边界框注释 支持以多种行业标准格式(YOLO、COCO、Pascal VOC 等)导出 准备好与 TensorFlow、PyTorch、YOLOv5、YOLOv8 和其他流行的 ML 框架集成 包含不同光照、天气和环境条件下的图像,确保在真实场景中实现稳健的模型性能

2025-06-14

2010-2024 电动汽车销量(8特征,3799条记录)数据集 CSV

该数据集提供了 2010 年至 2024 年全球电动汽车 (EV) 市场的快照。它包括有关电动汽车销量、库存和市场份额的历史数据,按车辆模式(例如汽车)、动力总成类型(BEV、PHEV)和指标(例如库存份额、销售份额)分类。这些数据有助于了解电动汽车的初始采用趋势。 非常适合时间序列分析、市场份额研究或构建 EV 趋势的可视化。 地区 - 收集数据的地理区域(例如,澳大利亚) 类别 - 数据性质(例如,历史、预测) 参数 - 指标类型(例如,电动汽车销量、电动汽车股票份额) 模式- 运输方式(例如,汽车) 动力总成 - 电动汽车类型:BEV(电池电动汽车)、PHEV(插电式混合动力电动汽车)、电动汽车 年份 - 数据点的年份(例如,2011 年、2012 年) 单位 - 测量单位(例如, Vehicles, percent) value- 实际记录值

2025-06-14

信用卡欺诈检测数据集(31特征,284808条记录)CSV

该数据集包含欧洲持卡人在 2013 年 9 月通过信用卡进行的交易。 此数据集显示了两天内发生的交易,其中 284,807 笔交易中有 492 笔欺诈。数据集高度不平衡,正类(欺诈)占所有交易的 0.172%。 它仅包含作为 PCA 转换结果的数值输入变量。遗憾的是,由于机密性问题,我们无法提供有关数据的原始特征和更多背景信息。功能 V1、V2、...V28 是使用 PCA 获得的主成分,唯一未使用 PCA 转换的特征是 'Time' 和 'Amount'。特征 'Time' 包含数据集中每个事务与第一个事务之间经过的秒数。功能 'Amount' 是交易金额,此功能可用于依赖于成本的学习。特征 'Class' 是响应变量,在欺诈的情况下取值 1,否则取值 0。 鉴于类别不平衡比率,我们建议使用精度-召回率曲线下面积 (AUPRC) 来测量准确性。混淆矩阵准确性对于不平衡分类没有意义。

2025-06-14

2001-2022 年房地产销售数据集(14特征,1048576条记录)CSV

此数据集提供有关房产销售的详细信息,包括各种房产特征和销售统计数据。该数据跨越多年,包括有关城镇、房产类型、销售金额、评估价值的信息以及评估员的其他评论。以下是关键列的概述: 1-序列号:每个属性记录的唯一标识符。 2 列表年份:房产挂牌出售的年份。 3-Date Recorded:数据集中记录房产销售的日期。 4-Town:住宿所在的城镇或城市。 5-地址:住宿的街道地址。 6-评估价值:出于税收目的分配给财产的价值。 7-销售金额: 房产的最终销售价格。 8-销售比率: 销售金额与评估价值的比率,可能表明销售价格与评估价值的接近程度。 9-Property Type(9 属性类型):属性的类型(例如,Residential(住宅)、Commercial(商业)。 10-住宅类型:特定类型的住宅物业,例如单户住宅。 11-非使用代码:表示不得用于典型用途(例如空地)的房产的代码。 12-评估员备注:评估员对房产的附加评论。 13-OPM 评论:物业管理办公室的评论。 14-位置:属性的地理坐标(纬度和经度)。 标签和类别: 价格范围:几列根据房产的销售额、评估价值等将房产分为不同的价格范围。 时间段:数据还按时间段(例如,不同的月份或年份)分组,并包含每个时间范围内的属性计数。 位置:某些行包含指示属性确切位置(经度和纬度)的坐标。

2025-06-14

2024全球空气质量(6 个城市,52000 条记录)数据集 CSV

空气污染每年导致大约 700 万人过早死亡 (WHO)。此数据集使研究人员和数据科学家能够: 分析全球污染差异 调查空气质量对健康的影响 开发环境监测预测模型 记录 52,000+ 每日测量 时间范围 2024 年 1 月至 12 月 GMT 时区 城市 6 个全球分布地点 污染物 一氧化碳、二氧化碳、一氧化碳、一氧化硫、一氧化硫、一氧化碳、一氧化碳、二氧化硫、PM2.5、PM10 指数 欧洲 AQI 组合数据集 (Air_Quality.csv) 所有具有标识符的城市City 完成 2024 年每日记录 特定于城市的文件(例如London_Air_Quality.csv) 没有列的相同指标City 非常适合局部分析

2025-06-14

路面合成数据集(10特征,1048576条记录)CSV

该数据集收集了各种道路的检查数据,包括路面状况、交通量和环境因素。 区段 ID 路段的唯一标识符 PCI (PCI公司 路面状况指数(0 = 最差,100 = 最好) 道路类型 道路类型(主要、次要、Barangay) AADT 年平均每日流量 沥青类型 沥青混合料分类(例如,密实、开放级、SMA) 上次维护 上次重大维护年份 平均降雨量 该地区的年平均降雨量 (mm) 车辙 车辙深度 (mm) IRI 国际粗糙度指数 (m/km) 需要维护 目标标签:1 表示需要紧急维护,否则为 0

2025-06-14

二手车价格预测(12特征,10,000 个真实的二手车记录)数据集 CSV

该数据集包含 10,000 个真实的二手车条目,这些条目具有各种特征,例如里程、发动机尺寸、前车主数量、燃料类型等。它专为回归任务而设计,其目标是预测汽车的美元转售价格。 它非常适合: 练习回归模型 探索特征重要性 构建交互式仪表板 用于实际定价预测的训练 ML 模型

2025-06-14

脑肿瘤分类数据集(4类,5000张图像)JPG

这个存储库包含了从两个公开可用的数据集中衍生出来的脑肿瘤MRI图像的策划和增强版本。该数据集适用于脑肿瘤分割和分类任务,包括肿瘤类型检测(例如,神经胶质瘤、脑膜瘤、垂体瘤)。 标签映射 标签类名称 0 无肿瘤 1 神经胶质瘤 2 脑膜瘤 3 垂体 数据集结构 每个条目包括: • MRI 图像 • 分割掩码:与图像 对齐的二进制或多类掩码 • 分类标签:基于肿瘤类型 对于分割任务,使用 images/ 和 masks/。 有关分类任务,请参阅 labels/。 数据集统计 类别 计数 • 总图像数 ~5,000 • 无肿瘤 ~1,200 • 胶质瘤 ~1,300 • 脑膜瘤 ~1,250 • 垂体 ~1,250 带分割掩码 ~2,700 训练/验证拆分 • 训练:80% • 验证:20%

2025-06-14

COVID-19 再感染和健康数据集(26特征,3000+记录)CSV

该数据集模拟了丹麦的 COVID-19 患者记录,重点关注初始感染、再感染、疫苗接种、长期 COVID 以及关键人口统计数据和临床结果。它包括 3,000 条合成记录和 26 个相关特征,专为现实的探索性分析、流行病学建模和教育目的而设计。 这些数据是完全合成的,模拟了大流行期间(2020-2024 年)看到的真实世界模式,并且可供公众安全使用。它可以应用于机器学习、生存分析、风险因素探索等。

2025-06-07

石头剪刀布手势检测数据集(7521 张增强图像)JPG

7521 张增强的 640 × 640 张 TensorFlow 对象检测格式的图像

2025-06-07

(2024–2025)炸玉米饼销售数据集(13特征,1000条记录)CSV

此数据集包含在 2024 年 1 月 1 日至 2025 年 5 月 25 日之间生成的 1000 条合成炸玉米饼配送订单记录。它模拟了美国多个城市餐厅的真实数据,包括订购时间、交货时间、炸玉米饼详细信息、定价、提示等。 设计用于: 探索性数据分析 (EDA) 机器学习模型训练 时间序列分析 价格预测和交货优化研究 数据集干净,没有重复项,并且包括适用于监督学习和回归/分类任务的数值和分类变量。

2025-06-07

眼睛检测数据集(2000 张注释良好的图像)JPG

此数据集包含人脸图像,特别关注眼睛区域。该数据集包含近 2000 张注释良好的图像,用于训练对象检测模型,如 RCNN、YOLO 等,用于跟踪和检测眼球内的感兴趣区域。此数据集可用于构建白内障检测模型、眼动跟踪模型等。 数据集分为 Train、Test 和 Validation 集,并相应地选择图像,以便为您尝试构建的模型提供最佳结果。但是,您可以根据需要自由进行更改。

2025-06-07

各省癌症患者记录数据集(20特征,10000+记录)CSV

数据包括肿瘤特征、治疗类型、生存状态和生活方式因素,例如吸烟和饮酒。它反映了现实的癌症流行病学,肺癌、胃癌和肝癌的发生率更高,并考虑了治疗和结果的地区差异。主要特点包括: 地理分布于中国主要省份,比例代表制。 癌症类型、分期和肿瘤大小与中国的流行病学趋势一致。 治疗方法(例如,手术、化疗、免疫疗法)和会话计数。 合并症、基因突变数据(故意缺失 5-10% 的值)。 生存结果和长达 60 个月的随访时间。 该数据集适用于机器学习模型、公共卫生研究、预测分析和学术研究,尤其是在癌症结果预测、治疗效果评估和获得高级护理的公平性方面。

2025-06-07

(2010-2024)电动汽车销量数据集(8特征,3799条记录)CSV

该数据集提供了 2010 年至 2024 年全球电动汽车 (EV) 市场的快照。它包括有关电动汽车销量、库存和市场份额的历史数据,按车辆模式(例如汽车)、动力总成类型(BEV、PHEV)和指标(例如库存份额、销售份额)分类。这些数据有助于了解电动汽车的初始采用趋势。 非常适合时间序列分析、市场份额研究或构建 EV 趋势的可视化。

2025-06-07

葡萄酒评论数据集(3文件,130k+记录)CSV

130k 条葡萄酒评论,包括品种、位置、酒庄、价格和描述 此数据集包含三个文件: winemag-data-130k-v2.csv包含 10 列和 130k 行葡萄酒评论。 winemag-data_first150k.csv包含 10 列和 150k 行葡萄酒评论。 winemag-data-130k-v2.json 包含 6919 个葡萄酒评论节点。 单击数据选项卡可查看单个文件描述、列级元数据和摘要统计信息。

2025-06-07

中国宜居城市数据集(15特征,221记录)CSV

包含字段:省份、城市、行政级别、区域、人均可支配收入(万元)、房价收入比、教育满意度(10分制)、医疗资源指数、PM2.5年均值、公园绿地面积(㎡/人)、养老保险覆盖率(%)、每万人警力数、通勤时间(分钟)、幸福指数、status

2025-06-07

学生习惯与学习成绩数据集(16特征,1,000 条综合学生记录)CSV

这是一个模拟数据集,探索生活习惯如何影响学生的学习成绩。它拥有 1,000 条综合学生记录和 15+ 功能,包括学习时间、睡眠模式、社交媒体使用、饮食质量、心理健康和期末考试成绩,非常适合 ML 项目、回归分析、聚类和数据可视化。使用逼真的模式创建,用于教育实践。 有没有想过 Netflix、睡眠或 TikTok 滚动对您的成绩有多大影响?该数据集模拟了 1000 名学生的日常习惯(从学习时间到心理健康),并将其与期末考试成绩进行比较。这就像通过生活方式的镜头窥探你的 GPA。非常适合 EDA、ML 练习,或者只是在假装高效的同时与数据共鸣。

2025-06-07

2025全球AI就业市场和薪资趋势数据集(19特征,50+个国家,15000+记录 )CSV

该数据集提供了对人工智能就业市场的广泛分析,从全球主要招聘平台收集了超过 15,000 个真实的职位发布。它包括详细的薪资信息、工作要求、公司洞察和地理趋势。 主要特点: 来自 50+ 个国家/地区的 15,000+ 个职位列表 多种货币的工资数据(标准化为美元) 经验级别分类(入门级、中级、高级、高级) 公司规模影响分析 远程工作趋势和模式 技能需求分析 地域薪资变化 显示市场演变的时间序列数据

2025-06-07

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除