Frank牛蛙-CSDN博客

原创 API，URL，Token，XML，JSON是干嘛的

XMLJSON结构基于标签的层次结构键值对的形式可读性对于复杂数据结构，可能较难快速理解更加直观，适合快速浏览数据大小通常比JSON更大（因为有更多的标签）相对较小，节省带宽使用场景文档存储、旧版系统Web应用、API响应简单来说，如果你想要一种更加直观且轻便的方式来传递数据，JSON通常是更好的选择；而如果你需要处理非常复杂的数据结构或者需要跨平台的文档存储解决方案，XML也可能是一个不错的选择。不过，在当今的Web开发中，JSON因其简洁和高效的特点被更频繁地使用。

2025-02-27 17:40:54 1665 1

原创 Python实战项目：广东省PM2.5分析案例（环境科学专业）

该图揭示了广东省PM2.5浓度呈现“冬高夏低、春秋过渡”的典型季风气候区特征，同时通过月份波动可定位污染防控关键窗口期（如11-12月）。需结合气象数据与污染源解析，进一步区分自然因素与人为排放的贡献权重。该折线子图通过中位数、平均值和最大值多维度揭示了PM2.5浓度的分布特性、极端事件及长期演变规律。未来需结合污染源解析、气象数据及政策节点深化归因分析，并校验数据单位与质量以确保结论可靠性。重点防控冬季峰值污染及突发性极端事件，强化常态治理与应急响应的协同性。

2025-02-17 10:50:32 1018

原创 R语言应用KNN、朴素贝叶斯、SVM实现手写数字识别

本文基于MNIST数据集，使用R语言中的K近邻（KNN）、朴素贝叶斯和支持向量机（SVM）算法实现手写数字分类任务，并对比了三者的性能差异。以下是实验的核心内容与结论。模型实现与评估包括KNN\SVM\贝叶斯实验表明，SVM在此任务中表现最优，其高准确率得益于RBF核处理高维数据和非线性模式的能力。KNN虽表现良好，但计算复杂度随数据量增长；朴素贝叶斯因强独立性假设受限，适合特征间相关性较低的场景。实际应用中，SVM可作为手写数字识别的首选模型，尤其在追求精度时。未来可进一步优化超参数（如SVM的核参数、

2025-02-05 11:47:51 817 2

原创数据科学入门必知：6种概率分布的原理、应用与可视化（附Python代码）

这篇文章介绍数据科学中六种关键概率分布：正态分布、二项式分布、泊松分布、均匀分布、卡方分布和Beta分布。每种分布都详细讲解了其原理、应用场景及数学公式，并附有Python代码示例帮助读者实践。正态分布用于描述对称数据，卡方分布用于检验差异，Beta分布则适用于建模概率的不确定性。文章还探讨了这些分布在异常检测、A/B测试、用户行为分析等实际问题中的应用。通过丰富的图表和代码，读者不仅能理解理论知识，还能动手实现，为深入学习数据科学打下坚实基础。总计提供了从基础概念到具体应用的全面指南，适合初学者快速入门。

2025-01-28 20:33:59 1094

原创使用FineBI进行数据分析（入门级）

哔哩哔哩，简称B站，现为中国年轻世代高度聚集的文化社区和视频平台，该网站于2009年6月26日创建，2018年3月28日在美国纳斯达克上市。早期B站是一个ACG（动画、漫画、游戏）内容创作与分享的视频网站。经过十多年的发展，围绕用户、创作者和内容，构建了一个源源不断生产优质内容的生态系统，目前已经覆盖7000多个兴趣圈层的多元文化社区，被QuestMobile研究院评选为“Z世代偏爱APP”和“Z世代偏爱泛娱乐APP“两。

2025-01-17 18:44:42 1054

原创操作系统期末重点复习

操作系统期末复习选择判断简答应用

2025-01-17 18:36:18 1089 1

原创机器学习——期末复习重点题归纳

机器学习期末复习

2024-11-15 20:42:26 1622 1

原创 1.每日SQL----2024/11/7

计算用户次日留存率,即用户第二天继续登录的概率。

2024-11-07 15:14:10 666 2

原创大数据之路读书笔记 Day8 数据存储

大数据之路读书笔记 Day8 数据存储

2024-07-20 22:33:57 1132 1

原创【MySQL 的 ONLY_FULL_GROUP_BY 模式】

MySQL 的 ONLY_FULL_GROUP_BY 模式

2024-07-19 21:33:34 4749

原创大数据之路读书笔记 Day7 实时技术简介及流式技术架构

大数据之路读书笔记 Day7 实时技术简介及流式技术架构关键词：架构、storm、去重指标、数据倾斜

2024-07-18 22:32:13 938

原创大数据之路读书笔记 Day6 离线数据开发之数据开发平台

大数据之路读书笔记 Day6 离线数据开发之数据开发平台

2024-07-15 14:25:58 1097

原创大数据之路读书笔记 Day5 数据同步遇到的问题与解决方案

大数据之路读书笔记 Day5 数据同步遇到的问题与解决方案

2024-07-14 23:06:55 2701 1

原创【面试数据岗必知必会——sql中的行转列、列转行与json函数】

【面试数据岗必知必会——sql中的行转列、列转行与json函数】

2024-07-10 12:07:18 1403

原创面试数据岗必知必会——元数据与开窗函数

面试数据岗必知必会——元数据与开窗函数

2024-07-08 22:31:07 1031

原创大数据之路读书笔记 Day4 数据同步

大数据之路读书笔记 Day4 数据同步

2024-07-07 22:53:37 1194

原创【计算机组成原理实验】——实验 MIPS 指令系统和 MIPS 体系结构

了解和熟悉指令级模拟器。熟练掌握 MIPSsim 模拟器的操作和使用方法。熟悉 MIPS 指令系统及其特点，加深对 MIPS 指令操作语义的理解。熟悉 MIPS 体系结构。

2024-07-07 00:31:23 1640

原创银行信用卡风险大数据分析与挖掘2024

银行信用卡风险大数据分析与挖掘

2024-07-06 21:22:50 2538 2

原创【计算机组成原理实验】——运算器组成实验

计算机组成原理实验运算器组成实验TEC4

2024-06-30 09:51:57 1356

原创基准测试程序的认知与分析 —— SPEC基准测试程序集的深入探索

SPEC基准测试程序集

2024-06-30 09:28:37 1567

原创大数据之路读书笔记 Day3

允许开发者根据自身需求定义新的事件或指标，比如特定的用户操作、业务流程中的特定步骤等。自定义埋点类就是指开发者自己定义的一系列数据采集点，用于收集特定业务场景下的数据。自定义埋点类的使用，意味着开发者可以更灵活地监控和分析特定的业务逻辑或用户行为，而不仅仅是通用的预设事件。

2024-06-28 22:01:52 1486

原创【数据挖掘】部分题目汇总

实现过程包括：计算数据的协方差矩阵，找到协方差矩阵的特征向量和特征值，选择最重要的特征向量形成新的特征空间，将数据投影到新的特征空间。因为初始PR值均为1，且每个页面仅有一个出链，所以迭代一次后：PR(A)=PR(B)=PR©=(1-0.85)+0.85*(1/1+1/1)=0.15+0.85*1=1。第二组{(3,5), (5,8)}的中心变为{(4,6.5)}。根据PageRank公式，PR(A) = (1-d) + d*(PR(B)/1 + PR（C)/1)，同理计算B和C的PR值。

2024-06-28 10:00:00 1150

原创大数据之路读书笔记 Day2

浏览器日志采集

2024-06-27 11:03:54 1178

原创大数据之路读书笔记 Day1

大数据之路阿里巴巴大数据体系图

2024-06-26 10:43:21 1388

原创【计算机组成原理】部分题目汇总

计算机组成原理部分试题

2024-06-23 16:21:17 1558

原创【计算机网络仿真实验-实验3.1、3.2】交换路由综合实验

交换路由综合实验

2024-06-20 12:04:48 2429

原创【计算机网络仿真实验-实验2.7】单臂路由

单臂路由

2024-06-16 10:24:34 795

原创【计算机网络仿真实验-实验2.6】带交换机的RIP路由协议

带交换机的动态路由协议

2024-06-15 23:02:23 624

原创【计算机网络仿真实验-实验2.4、2.5】静态路由、动态路由(RIP)

静态路由，动态路由

2024-06-14 18:53:09 927

原创【数据库】数据库完整性：让数据更靠谱的秘密武器

数据库完整性

2024-06-14 15:30:31 848

原创【数据挖掘-思考】分类和聚类

数据挖掘中分花生和芝麻是聚类问题还是分类问题

2024-06-14 14:30:54 1427

原创【计算机网络仿真实验-实验2.2、2.3】跨交换机VLAN，链路聚合

计算机网络仿真实验-实验2.2、2.3，跨交换机vlan，链路聚合

2024-06-12 21:42:20 789

原创【计算机网络仿真实验-实验2.1】交换机基本配置

计算机网络仿真实验-实验2.1 交换机基本配置

2024-06-11 10:17:56 697

原创【计算机网络仿真实验——实验准备】下载使用思科模拟器、实验内容介绍

计算机网络实验准备，思科模拟器下载及使用方法，实验内容包含

2024-06-09 15:00:00 1326

原创【数据结构实验】哈夫曼树和哈夫曼代码

数据结构实验--哈夫曼树和哈夫曼编码

2024-06-02 10:56:16 837

原创【C/C++项目】——高精度计算pi值

C++高精度计算pi值

2024-06-01 12:06:06 1868

原创【C++每日一题】每日格言问题——对字符串流、文件流的操作

C++每日一题，涉及文件流操作，字符串流操作

2024-05-31 20:48:34 661

原创【数据结构实验】病毒检测问题——字符串模式匹配BF算法

数据结构实验中的病毒检测问题，掌握字符串模式匹配算法模式，BF算法

2024-05-30 20:31:47 1708

原创【数据结构实验】迷宫问题——线性表

经典迷宫问题，数据结构中线性表的掌握

2024-05-29 21:24:04 869

原创【python项目】中国五大城市PM2.5 数据分析（含数据集及完整代码）

通过分析PM2.5数据掌握使用python中几个重要的库，pandas、numpy、matplotlib,同时掌握分析识图

2024-05-28 20:22:56 2067 2

Python实战项目：广东省PM2.5分析案例（环境科学专业）

绑定文章，包含广东省2014-2023年的空气质量表，以及用python生成的散点图、折线图等，excel表还包括自主统计的广东省PM2.5一览表和三座具体城市：东莞、江门和清远的excel统计表和生成图像

2025-02-17

SQL语言教学ppt,全英版本

这份文件是关于结构化查询语言(SQL)的基础知识，特别是数据操作语言(DML)部分的教学材料。内容包括数据库管理系统(DBMS)组件、SQL命令和嵌入式Web应用程序的概览。重点讲解了单表和多表的数据操作，如SELECT、INSERT、UPDATE和DELETE语句，以及聚合函数、别名使用、处理NULL值的方法。此外，还介绍了子查询、集合比较、分组与排序结果等高级主题，并讨论了如何利用SQL进行有效的数据检索和更新操作。同时提及了视图与临时表的区别以及公用表表达式(CTE)的使用。

2025-02-14

R工作空间-手写数字识别数据集

一个R工作空间，打开后按照资源绑定的文章中所写的代码load,可以加载所需要的数据集

2025-02-05

使用FineBI进行数据分析（入门级）

本资源包包含了一系列关于B站（哔哩哔哩）UP主的粉丝数据Excel文件，主要方便大家学习如何利用FineBI平台对这些数据进行深入分析。通过本资源，用户可以学习到如何连接多源数据、加工和可视化数据，从而实现数据驱动业务决策。数据概述：数据覆盖了7000多个兴趣圈层的多元文化社区，聚焦于中国年轻一代高度聚集的文化社区和视频平台。文件包括总粉丝排行、充电排行、创作人气排行、掉粉排行和涨粉排行等，帮助理解不同领域UP主的受欢迎程度及其粉丝分布情况。分析目的：利用FineBI的多源数据连接和自助数据加工能力，确保数据的真实、准确、完整。通过FineBI的自助分析与简便易上手的可视化组件，制作对应仪表板，实现数据驱动业务。分析并展示B站粉丝数量最多的区域、播放量前10的UP主、男女UP主对比及UP主投稿与涨粉量之间的关系等，以了解运营策略。适用人群：适合希望提高自身数据分析技能的UP主、内容创作者，以及对社交媒体数据分析感兴趣的个人或团队。

2025-01-17

操作系统期末重点复习含实验报告和参考教材课后题答案

本资源包含操作系统课程的五个实验的详细实验报告，每个实验报告都详细记录了实验目的、实验环境、实验步骤、实验结果以及分析讨论。此外，还包含了《计算机操作系统（第四版）》一书的课后答案完整版，由汤小丹等人编著，为学生提供了课后习题的详细解答，有助于加深对操作系统概念和原理的理解。这些资料对于准备期末考试的学生来说是非常宝贵的复习资料，可以帮助他们更好地掌握操作系统的核心知识点。

2025-01-01

【python项目】中国五大城市PM2.5 数据分析（含数据集及完整代码）

报告聚焦于中国五个主要城市——北京、上海、广州、成都和沈阳的PM2.5（细颗粒物）浓度数据分析。作者利用Python语言处理和分析了近年每日的PM2.5观测数据，旨在揭示各城市空气质量状况及其地理、气候和经济特征之间的关联。报告详细内容包括：数据预处理：清洗数据、处理缺失值，并计算日均PM2.5浓度。数据可视化：通过图表展示各城市PM2.5浓度的季节性变化、不同监测点的数据对比、中美数据源的差异与一致性，以及与其他城市数据的比较。代码实现：展示了部分Python代码，用于数据读取、处理和绘图，完整代码见附件。报告还探讨了不同数据源的差异，分析了可能的成因，如观测方法、设备差异、观测点位置、数据处理方式和潜在的政治社会因素。适合人群：对中国城市空气质量感兴趣的环境保护者、研究人员和学生。使用Python进行数据分析的学习者和从业者，特别是关注环境科学领域。对PM2.5监测和数据分析有兴趣的政策制定者和政府官员。需要了解中国主要城市PM2.5污染情况的公共卫生专家和城市规划师。

2024-11-24

PM2.5 数据集包含上海、成都、广州、北京、沈阳五地的PM2.5观测，csv文件

这是一份关于五个城市的PM2.5监测数据文件，以CSV格式存储。数据涵盖了广州、北京、沈阳等地的空气质量情况，旨在帮助研究人员和数据分析人员更好地理解城市空气污染状况。使用人群适合对环境科学、大气污染研究感兴趣的科研工作者、学生及环保组织成员使用。数据内容包含五个主要城市的PM2.5浓度数据时间跨度较长，覆盖多年数据 CSV格式方便导入各种数据分析软件进行进一步处理和分析

2024-11-24

【python项目】中国五大城市PM2.5 数据分析（含数据集及完整代码）

2024-07-14

银行信用卡风险大数据分析与挖掘2024

概述本PDF文档详尽地介绍了银行信用卡风险管理和大数据分析的最新方法和技术。它涵盖了信用卡客户信用等级影响因素的深度分析以及欺诈检测的关键策略。文档中利用了Excel数据挖掘功能，通过对信用卡客户信用记录的细致研究，提炼出影响客户信用等级的关键变量，如居住类型、年龄和教育程度等，进而构建决策树模型，以预测客户的风险等级。主要内容信用卡客户信用等级影响因素分析与挖掘数据预处理步骤，包括异常值的识别和处理，以及关键特征的重新标记和分类。决策树模型的构建，用于预测客户信用等级，重点分析了居住类型、年龄和教育程度对信用等级的影响。挖掘结论分析与建议，基于模型结果提出针对不同客户群体的管理策略。欺诈人口属性分析与挖掘关键影响因素分析，如日均消费金额、卡类别、客户号和额度，以及它们与欺诈行为的相关性。类别检测，区分不同交易模式的客户群体，识别潜在的欺诈风险。异常值处理，确保模型的准确性不受异常数据点的影响。

2024-07-11

信用卡风险分析挖掘实验数据源 - 2024年版

内容概要此数据集收集了多个客户关于信用卡申请的信息，包括个人基本信息、财务状况、信用历史以及审批结果。每一条记录代表一位客户，数据涵盖了性别、年龄、婚姻状态、户籍所在地、教育程度、居住类型、职业类别、工作年限、个人收入、保险缴纳情况、是否拥有车辆、信用评分、信用等级、银行授予的信用额度，以及最终的信用卡审批结果。这些数据对于理解和预测信用卡申请人的风险等级非常有用，是进行信用风险分析、数据挖掘和机器学习实验的理想资料。适合人群 - 数据分析师和数据科学家 - 金融行业从业者，尤其是信贷和风险管理领域的专业人员 - 计算机科学、统计学、经济学专业的学生和研究人员 - 对数据驱动决策感兴趣的企业管理者 - 任何希望学习或增强信用卡风险分析技能的人能学到什么 - 如何处理和分析大规模客户数据 - 了解影响信用评分的关键因素 - 实践数据预处理技术，如数据清洗、特征工程 - 应用统计分析和机器学习模型预测信用风险 - 掌握如何根据模型输出制定信贷政策和审批策略

2024-07-11

计算机网络实验汇总及期末作业、复习资料.zip

包含计网实验软件（思科模拟器）、实验一到三报告、wireshark实验、课后习题解答等；实验报告内容包含中继、桥接、静态路由、动态路由、单臂路由、交换机、交换路由综合实验等，并均附实验拓扑图、可以用思科模拟器打开的实验文件，非常全面，配合专栏文章食用更加

2024-06-20

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

Python实战项目：广东省PM2.5分析案例（环境科学专业）

SQL语言教学ppt,全英版本

R工作空间-手写数字识别数据集

使用FineBI进行数据分析（入门级）

操作系统 期末重点复习 含实验报告和参考教材课后题答案

【python项目】中国五大城市PM2.5 数据分析（含数据集及完整代码）

PM2.5 数据集 包含上海、成都、广州、北京、沈阳五地的PM2.5观测，csv文件

【python项目】中国五大城市PM2.5 数据分析（含数据集及完整代码）

银行信用卡风险大数据分析与挖掘2024

信用卡风险分析挖掘实验数据源 - 2024年版

计算机网络实验汇总及期末作业、复习资料.zip

空空如也

操作系统期末重点复习含实验报告和参考教材课后题答案

PM2.5 数据集包含上海、成都、广州、北京、沈阳五地的PM2.5观测，csv文件