如何在Jupyter Notebook中加载Seaborn库中自带的数据
时间: 2024-10-26 19:03:19 浏览: 120
在Jupyter Notebook中加载Seaborn库中的内置数据集,首先你需要确保已经安装了Seaborn库和pandas库,因为Seaborn基于pandas提供数据可视化功能。如果你还没有安装,可以使用pip进行安装:
```bash
pip install seaborn pandas
```
一旦安装完成,你可以通过以下步骤加载一个数据集,比如著名的鸢尾花数据集"Iris":
1. 导入所需的库:
```python
import seaborn as sns
import pandas as pd
```
2. 调用`sns.get_dataset_names()`查看可用的数据集名称:
```python
iris_datasets = sns.get_dataset_names()
print(iris_datasets)
```
3. 使用`pd.read_csv()`或`sns.load_dataset()`加载数据集。例如,要加载Iris数据集:
```python
iris_data = sns.load_dataset("iris")
# 或者如果你想要从csv文件加载
# iris_data = pd.read_csv(sns.get_dataset_path('iris'))
```
现在,`iris_data`变量就包含了Iris数据集,你可以开始分析和可视化数据了。
相关问题
jupyter notebook SimHei
### 如何在 Jupyter Notebook 中应用 SimHei 字体
要在 Jupyter Notebook 中成功应用 SimHei 字体,需完成以下几个方面的配置:
#### 下载并安装字体文件
首先需要获取 SimHei 字体文件。可以通过以下链接下载字体文件[^2]:
```plaintext
https://us-logger1.oss-cn-beijing.aliyuncs.com/SimHei.ttf
```
或者通过百度网盘中的资源进行下载[^1]。
将下载到的 `SimHei.ttf` 文件保存至本地计算机,并将其复制到系统的字体目录下。对于 macOS 用户来说,通常可以双击 `.ttf` 文件并通过系统自带工具完成安装。
---
#### 修改 Matplotlib 的默认字体设置
为了使 SimHei 成为 Matplotlib 图形绘制时使用的默认字体,在 Python 命令行中运行如下代码片段即可实现这一目标[^4]:
```python
import matplotlib.pyplot as plt
plt.rcParams['font.sans-serif'] = ['SimHei']
plt.rcParams['axes.unicode_minus'] = False # 解决负号 '-' 显示为方块的问题
```
上述代码的作用在于指定绘图时所采用的无衬线字体族为黑体 (SimHei),同时关闭 Unicode 负号的支持以避免可能出现的显示异常情况。
---
#### 设置全局样式表(可选)
如果希望永久更改整个项目的字体风格而无需每次重新定义参数,则可以在个人用户的主目录下的隐藏文件夹 `.jupyter` 找到名为 `jupyter_notebook_config.py` 的配置文档位置信息[^3] 。接着打开该文件并将下面的内容追加进去:
```python
c.NotebookApp.mathjax_url = 'https://cdn.jsdelivr.net/npm/mathjax@2/MathJax.js?config=TeX-MML-AM_CHTML'
from IPython.display import set_matplotlib_formats
set_matplotlib_formats('retina')
%matplotlib inline
import matplotlib.pyplot as plt
plt.style.use(['seaborn-whitegrid', 'ggplot'])
plt.rc('font', family='SimHei')
plt.rc('axes', unicode_minus=False)
```
此方法能够确保无论何时启动新的会话都会自动加载这些自定义选项。
---
#### 测试效果
最后一步是在实际环境中验证调整后的成果是否生效。创建一个新的单元格执行简单的图表展示脚本作为测试依据之一:
```python
import numpy as np
import pandas as pd
import seaborn as sns
sns.set(font="SimHei", font_scale=1)
data = {'城市': ["北京","上海","广州"],'人口(百万)': [2171,2424,1500]}
df = pd.DataFrame(data=data,index=None)
print(df)
sns.barplot(x='城市', y='人口(百万)', data=df).set_title("中国主要城市的常住人口统计")
```
以上示例利用 Seaborn 库生成柱状图来直观呈现数据的同时也设置了标题栏文字属性以便观察最终渲染出来的视觉表现形式是否正常包含了中文字符以及对应的字体外观特征。
---
阅读全文
相关推荐

















