python爬取股票后，清洗jQuery格式信息的函数

最新推荐文章于 2024-05-30 10:09:44 发布

原创最新推荐文章于 2024-05-30 10:09:44 发布

· 218 阅读

1 ·

版权

文章标签：

#python #jquery #开发语言

知识积累专栏收录该内容

5 篇文章

订阅专栏

该文章描述了一个Python函数，用于从股票相关的网页数据中提取并清洗JSON格式的信息。函数首先使用正则表达式匹配中括号内的内容，然后将多个JSON结构体存储到数组，再将数组中的每个JSON转换为字典，便于进一步的数据处理和提取。作者旨在避免重复工作，提供了一个可复用的代码片段。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

1.从股票相关的网站爬下来的格式不太适合处理，比如：
真正需要的是红框里面的内容
在这里插入图片描述
这时写了一个函数，把红框里面的内容逐步转换成方便提取对应数据的字典形式。可以在此基础上逐步完善。自己做个记录方便后面写时直接使用，不再重复造轮子

在这里插入图片描述
import re
import json

def wash(string):
# 清洗第一步：匹配中括号中的内容jQuery112400"data":{“total”:5430,“diff”:[{“f1”:2,“f2”:50.36,“f3:2}]}});
pattern = r”[([^]]+)]"
matches = re.findall(pattern, string)
# 清洗第二步，将多个json结构体存放到数组
str_clear = re.sub(r’},‘, “};”, matches[0]).split(’;')
# 清洗第三步，将数组里面每一个json结构体转换成字典样子
for i in str_clear:
str2dic = json.loads(i)
print(str2dic)
print(str2dic.get(‘f14’))