deepseek智能数据分析
时间: 2025-03-01 15:04:39 浏览: 58
### 使用DeepSeek进行智能数据分析
#### DeepSeek简介
DeepSeek 是由杭州深度求索人工智能基础技术研究有限公司(DeepSeek AI公司)开发的一款AI工具产品。这款工具不仅是一个搜索引擎,更是一个集成了深度学习、自然语言处理、数据挖掘与知识图谱的智能分析系统[^1]。
#### 特点概述
DeepSeek 的特点在于其能够通过强大的自然语言处理能力为用户提供高效的信息搜索和解答服务。该系统的另一大优势是对海量数据进行深入分析的能力,从而提取出有价值的信息并提供精准的决策支持。
#### 数据分析实例
为了展示如何利用DeepSeek进行数据分析,考虑一个实际案例:上传了一个包含1.6万个药物评价的数据集给DeepSeek R1来寻找有意义的数据特征[^2]。这表明DeepSeek可以接受大规模数据集,并从中识别重要模式或趋势。
#### Python脚本实现贡献度分析
下面给出一段Python代码示例,展示了怎样借助DeepSeek来进行特定类型的贡献度分析——即基于帕累托法则的应用场景之一:
```python
import pandas as pd
import matplotlib.pyplot as plt
from matplotlib.ticker import FuncFormatter
plt.rcParams['font.sans-serif']=['SimHei']
plt.rcParams['axes.unicode_minus']=False
def read_excel(file_path):
df = pd.read_excel(file_path)
print(f"成功加载文件 {file_path}")
return df
def plot_contribution(df, output_dir):
fig, ax1 = plt.subplots(figsize=(10, 7))
names = df.iloc[:, 0].values.tolist()
values = df.iloc[:, 4].values
bars = ax1.bar(names[:10], values[:10])
ax1.set_title('Poe平台前50个bots月活用户贡献度分析')
ax1.tick_params(axis='x', rotation=90)
cumsum_values = [sum(values[:i]) / sum(values) for i in range(1, len(values)+1)]
ax2 = ax1.twinx()
line, = ax2.plot(names, cumsum_values, 'r-', label="累积比例", lw=2)
ax2.yaxis.set_major_formatter(FuncFormatter(lambda y, _: f'{int(y*100)}%'))
ax2.set_ylim([0, 1])
for idx, (name, value) in enumerate(zip(names, cumsum_values)):
ax2.text(idx, value, f"{value:.2f}", ha='center')
save_path = rf"{output_dir}\poetop50bots贡献度.png"
plt.savefig(save_path)
print(f"已保存图像至 {save_path}")
if __name__ == "__main__":
file_path = r"F:\AI自媒体内容\AI行业数据分析\poetop50bots中文翻译.xlsx"
data_frame = read_excel(file_path)
out_folder = "F:\\AI自媒体内容\\AI行业数据分析"
plot_contribution(data_frame, out_folder)
```
这段程序实现了从指定路径读取Excel文档中的表格信息,接着创建了一张柱状图用来表示不同项目的相对规模以及一条红线代表这些项目按照一定顺序排列后的累计百分比变化情况。最后会把生成的结果图形存储下来以便后续查看[^4]。
阅读全文
相关推荐


















