python爬取股票后,清洗jQuery格式信息的函数

该文章描述了一个Python函数,用于从股票相关的网页数据中提取并清洗JSON格式的信息。函数首先使用正则表达式匹配中括号内的内容,然后将多个JSON结构体存储到数组,再将数组中的每个JSON转换为字典,便于进一步的数据处理和提取。作者旨在避免重复工作,提供了一个可复用的代码片段。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1.从股票相关的网站爬下来的格式不太适合处理,比如:
真正需要的是红框里面的内容
在这里插入图片描述
这时写了一个函数,把红框里面的内容逐步转换成方便提取对应数据的字典形式。可以在此基础上逐步完善。自己做个记录方便后面写时直接使用,不再重复造轮子

在这里插入图片描述
import re
import json

def wash(string):
# 清洗第一步:匹配中括号中的内容jQuery112400"data":{“total”:5430,“diff”:[{“f1”:2,“f2”:50.36,“f3:2}]}});
pattern = r”[([^]]+)]"
matches = re.findall(pattern, string)
# 清洗第二步,将多个json结构体存放到数组
str_clear = re.sub(r’},‘, “};”, matches[0]).split(’;')
# 清洗第三步,将数组里面每一个json结构体转换成字典样子
for i in str_clear:
str2dic = json.loads(i)
print(str2dic)
print(str2dic.get(‘f14’))

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值