Python
lytcreate.
唯有热爱,可抵万难。
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
Redis实现锁功能
利用Redis的NX特性实现接口防重写入锁。当频繁调用含写入操作的接口时,通过Redis.set()的NX参数设置互斥锁,仅当key不存在时才能设置成功并执行后续操作,有效避免重复写入问题。设置60秒过期时间防止死锁,确保锁最终释放。该方法简单高效地解决了高并发场景下的数据一致性问题。原创 2025-08-04 14:57:11 · 191 阅读 · 0 评论 -
解决Django迁移sqlite数据库报错db.utils.NotSupportedError: deterministic=True requires SQLite 3.8.3 or higher
摘要:在Django4项目中执行makemigrations时出现SQLite版本不兼容错误,报错显示需要SQLite3.8.3以上版本支持deterministic=True功能。解决方法:1)安装pysqlite3和pysqlite3-binary包;2)修改Django的sqlite3/base.py文件,将原sqlite3导入替换为pysqlite3的导入(注释原from sqlite3 import...,改为from pysqlite3 import...)。该修改路径需根据实际Python环境原创 2025-07-06 16:59:08 · 395 阅读 · 0 评论 -
Dify使用上传的文件进行对话功能的实现
摘要:本文介绍了dify平台的两种文件处理方式。1) 配置工作流的三个要点:必须包含文档提取器节点、大模型需引入提取内容变量text、需启用文件上传功能并设置文件类型。2) 代码实现部分展示了一个Python示例,通过API实现CSV文件上传(使用requests库)和对话提问功能,包含获取文件ID和与机器人交互两个主要函数。代码演示了完整的请求过程,包括设置API密钥、用户ID、文件处理及流式响应接收。原创 2025-06-10 11:43:47 · 1921 阅读 · 0 评论 -
sqlalchemy在pandas中常用连接数据库的方法
摘要:本文介绍了使用Python将数据批量导入MySQL数据库的方法。首先通过SQLAlchemy创建数据库连接引擎,处理不同驱动版本的兼容性问题。然后使用pandas读取CSV数据,通过分批处理策略(每批5000条记录)将数据高效入库,避免内存溢出。代码示例展示了完整的实现流程,包括数据库配置、连接建立和数据分批插入功能,适用于大规模数据迁移场景。原创 2025-06-09 09:32:17 · 181 阅读 · 0 评论 -
Python实现markdown文件转word
这是一个Markdown转Word文档的Python脚本。主要功能包括:1. 读取Markdown文件并转换为HTML;2. 使用BeautifulSoup解析HTML内容;3. 通过python-docx库创建Word文档;4. 支持转换标题、段落、列表、代码块、表格和图片等常见元素。脚本自动处理格式转换,包括文本样式(粗体/斜体)、代码字体、列表编号等。用户可以直接运行脚本或将文件路径作为参数传入实现格式转换。原创 2025-06-05 09:32:41 · 762 阅读 · 0 评论 -
Python绘制新冠疫情的知识图谱
本文介绍了如何使用Python中的pyvis和networkx库构建和可视化一个关于COVID-19的紧密连接图。首先,通过networkx创建了一个图结构,并定义了核心节点“SARS-CoV-2”及其相关节点(如“ACE2受体”、“飞沫传播”等)。接着,修复了连接矩阵中的关系字段,确保所有节点和边的关系信息一致。然后,添加了环形连接部分,进一步丰富了图的结构。最后,使用pyvis进行可视化配置,生成了一个交互式的HTML文件,用户可以通过拉伸、旋转等操作查看图的物理效果。该图展示了COVID-19相关的关原创 2025-05-22 17:57:28 · 317 阅读 · 0 评论 -
Python绘制3D图表
本文介绍了如何使用Python中的NetworkX和Plotly库创建一个3D知识地图,展示2008年北京申奥的相关信息。首先,通过NetworkX创建了一个有向图,并添加了节点和边,节点包括“北京申奥”、“绿色奥运”、“科技奥运”等,边表示它们之间的关系。接着,使用Spring布局生成3D坐标,并提取节点和边的坐标信息。然后,利用Plotly的Scatter3d和Scatter3d分别绘制节点和边的3D散点图和线图。最后,通过设置布局和标注,生成并展示了一个交互式的3D知识地图,直观地呈现了北京申奥的核心原创 2025-05-22 17:08:01 · 336 阅读 · 0 评论 -
Python生成物理引擎的简单知识图谱
本文介绍了如何使用Python中的pyvis和networkx库创建并可视化2008年北京奥运会的相关数据。首先,通过networkx创建有向图,添加节点(如“2008北京奥运会”、“IOC”、“北京”等)和边(如“北京”与“2008北京奥运会”之间的关系“主办”)。接着,使用pyvis配置可视化参数,包括节点样式、物理布局等,并生成HTML文件。最后,在Jupyter Notebook中内联显示或提示用户打开生成的HTML文件查看可视化结果。该过程展示了如何将复杂的关系网络以图形化的方式呈现。原创 2025-05-22 16:57:43 · 315 阅读 · 0 评论 -
MCPSPCE - 纯中文的MCP server和client空间站
MCP现在正如火如荼,想要获取一些最新的Server或者client进行测试或研究,但是要么github网络不畅,要么英文生僻难懂,有咩有一个集中了大量MCP server和client的一个平台,全部是中文的,可以查看中文的文档,也可以获取克隆地址或者直接下载代码包呢?当然!MCPSPACE应运而生!原创 2025-04-17 16:13:11 · 1056 阅读 · 0 评论 -
python创建MCP server项目
【代码】python创建MCP server项目。原创 2025-04-16 15:39:32 · 908 阅读 · 0 评论 -
一个简单的Python文件MCP服务器
1.list_tools 这个是给AI展示有哪些工具可以调用的,具体工具的功能是什么,可以在这里面配置具体工具call_tools的入参数据类型,确保执行的健壮性。2.call_tool 这个是具体的实现方法,定义的名称与list_tools要一致,里面是一些具体的实现方法。3.main 这个是用来启动整个服务器的,主要是对标准数据输入输出流进行适配。原创 2025-04-15 17:54:39 · 472 阅读 · 0 评论 -
cherrystudio使用MCP服务读取文件
回到对话页面, 顶部的模型选择阿里云的模型,必须带扳手图标才可以,我这里用的qwen-max,然后再将对话输入框下面的MCP服务器(命令行图标)的刚才创建的文件服务选择上,就可以开始对话了!点击后面的安装即可,但是会出现安装后还是有问题,所以建议从上面的网盘链接下载文件,然后将bun,uv,uvx.exe手动放置到下面的目录即可!还是在设置 - 模型服务 - 找到阿里云百炼,右边填写API秘钥,点击检查看秘钥是否正确,然后一定要点击右上角的开关将他打开。我这里用的是阿里云的百炼模型,也就是通义千问那块的。原创 2025-04-08 15:59:31 · 1471 阅读 · 0 评论 -
Kafka的安装与使用(windows下python使用等)
参数控制了是从第一个开始获取还是从接入的时候再算起,移除参数就代表从接入开始获取message里面的数据,如果是 earliest 就会从第一个开始获取,即使已经处理了!那么,如果是消费者掉线,生产者在掉线期间新增了若干条数据,如何让消费者上线后从没有处理的数据开始处理呢?:如果kafka没有正常关闭,可能下一次启动就会报错,可以删除data,log和logs目录里面的内容之后,再从启动zookeeper开始往下走。如果文件后缀是gz,解压后没有文件夹,此时需要先将文件后缀修改为tgz,然后再解压。原创 2025-03-31 18:29:03 · 1256 阅读 · 0 评论 -
pyexcelerate在写入Excel时为何效率高?
xlsxxlwtopenpyxlPyExcelerate 是一个专注于高效生成 Excel 文件(特别是.xlsx。原创 2025-03-31 10:16:05 · 977 阅读 · 0 评论 -
Python实现图片文字识别-OCR
PaddleOCR是由百度飞桨(PaddlePaddle)团队开发的OCR工具库,它包含超轻量级的中文OCR模型,支持多种语言和复杂情况下的文字识别。使用:已知我的图片是 img.png。原创 2025-03-28 16:59:45 · 810 阅读 · 0 评论 -
如何设计系统以应对大量用户同时访问(高并发处理)?
通过以上多个层面的设计和优化,可以使系统具备较强的高并发处理能力,应对大量用户的同时访问。原创 2025-03-26 15:46:10 · 1149 阅读 · 0 评论 -
poetry设置指定的安装源
【代码】poetry设置指定的安装源。原创 2025-03-18 16:45:23 · 900 阅读 · 0 评论 -
GIL详解:GIL是什么,为什么要有GIL
GIL是CPython为了线程安全的内存管理和开发便利性做出的权衡。尽管它限制了多线程的并行能力,但在Python生态中仍有不可替代的价值——尤其是在IO密集型任务和快速开发场景中。CPU密集型:用多进程或C扩展(如Cython释放GIL)。IO密集型:用多线程(利用GIL释放)或协程(完全无锁)。(注:GIL是CPython特有的机制,其他语言如Java、C++的线程模型无此限制,但需开发者手动处理锁或使用原子操作。原创 2025-03-13 18:08:22 · 1281 阅读 · 0 评论 -
在协程当中,有三个任务,第一个任务开始执行,遇到await,开始执行第二个任务,在此期间,事件循环调度不断检查协程的状态,发现await的操作已完成,那么他会继续完成await的后续操作呢,还是开始第
事件循环会优先恢复等待操作已完成的协程的执行,以保证协程的执行逻辑连贯。只有当所有等待的协程都在等待某个操作完成时,事件循环才会继续调度其他可执行的协程。这种调度机制确保了异步编程的高效性和逻辑的正确性。原创 2025-03-13 18:05:58 · 407 阅读 · 0 评论 -
协程看起来既不受到GIL锁的限制,又能实现很小的切换开销,效率很高,那他有什么缺点呢
协程的高性能建立在严格的编码规范和特定场景适配优点:适合IO密集型、可控的异步场景(如网络请求、数据库IO),内存和调度效率极高。缺点:对编程范式要求苛刻(必须全异步化),错误处理和调试成本高,无法解决CPU瓶颈。建议:在设计系统时,优先评估是否真的需要“十万级协程”,多数场景下线程池+异步IO的组合(如)可能更易维护。原创 2025-03-13 18:04:49 · 680 阅读 · 0 评论 -
多进程,多线程,协程,在子任务里面如果出现错误,各有什么样的表现呢,会抛出异常吗,最终结果正确吗
并发方式异常抛出范围对其他任务影响对最终结果影响多进程子进程内部通常不影响其他进程可能导致结果不完整多线程子线程内部通常不影响其他线程可能导致结果不完整协程协程内部,可能传播到事件循环可能影响依赖该协程的其他协程,甚至终止事件循环可能导致结果不完整或事件循环终止为了确保程序的健壮性,建议在子任务中捕获并处理可能出现的异常,避免异常导致整个程序崩溃或产生不正确的结果。原创 2025-03-13 18:01:19 · 631 阅读 · 0 评论 -
生成器在任务队列中有什么优势?如何避免阻塞?
【代码】生成器在任务队列中有什么优势?如何避免阻塞?原创 2025-03-12 11:50:51 · 1168 阅读 · 0 评论 -
优化闭包或装饰器的内存性能开销
在装饰器中,尽量只让闭包捕获必要的变量,避免捕获大量的数据。如果某些变量在包装函数中不需要使用,就不要将其传递给闭包。2.避免使用多个装饰器,考虑合并到一个装饰器里面。原创 2025-03-12 11:40:24 · 381 阅读 · 0 评论 -
dataframe从另一个dataframe批量更新数据
把df2的数据更新进df1,并且以df1的列为准进行批量更新。原创 2025-03-10 18:41:03 · 207 阅读 · 0 评论 -
自动化操作浏览器时遇到了checkbox的人机验证要怎么处理
在自动化操作浏览器时遇到checkbox形式的人机验证(如"我不是机器人"复选框),处理方式需根据验证类型和复杂度决定。最终选择方案时,需在合规性、成本效益和技术实现难度之间取得平衡。对于关键业务系统,建议预留人工验证回退通道。原创 2025-03-05 10:14:01 · 987 阅读 · 0 评论 -
进程间通信方式:对列、管道、共享内存
进程间通信在多任务并发执行时,能够帮我们高效的协调各个进程的工作。队列、管道和共享内存各有优劣,适合不同的应用场景。队列:适合多个进程之间的消息传递,简单且高效,支持多个生产者和消费者。管道:适合两个进程之间的通信,通常用于进程对进程的简单数据传递。共享内存:适合高效的数据共享,多个进程可以直接访问同一块内存区域,避免数据复制的开销。但是,也要留意当生产者数据快于消费者速度时,数据会被更新,导致数据丢失,此时可以考虑使用对列进行替代。原创 2025-02-28 16:07:24 · 983 阅读 · 0 评论 -
什么是幂等性
幂等性(Idempotence)是一个在数学、计算机科学等多个领域都有重要应用的概念,下面从不同领域为你详细介绍其含义。原创 2025-02-07 17:10:41 · 434 阅读 · 0 评论 -
区分字符串和base64图片内容
用正则精准提取Base64图片部分,剩余内容则为普通文本。匹配Base64字符(允许包含空格或换行)。:图片的Base64数据通常以类似。:将提取的图片和文本分别存储或处理。用于清理多余空格,使文本更整洁。开头,随后是编码内容。匹配MIME类型(如。移除Base64部分。原创 2025-02-06 10:54:55 · 591 阅读 · 0 评论 -
问题记录:dataframe使用np.where两个条件时报错TypeError:Cannot perform ‘rand_‘ with a dtyped [float64] array and sc
运算符连接两个布尔数组时,需要在每个条件外加括号,以确保正确的运算顺序。在 Python 中,使用。将两个条件分别加括号。原创 2025-01-13 17:38:33 · 428 阅读 · 0 评论 -
python手动创建一个虚拟环境
在Python中,可以使用内置的venv模块来创建虚拟环境,以下是在不同操作系统中创建venv。原创 2024-12-25 15:39:46 · 446 阅读 · 0 评论 -
云梦API - 高质量API服务站推荐
云梦API 这是一个提供了多种实用 API 接口的平台,各接口涵盖生活娱乐、信息获取、数据处理等多个领域,能为开发者提供丰富的数据和功能支持,助力其快速构建多样化的应用程序。原创 2024-12-23 11:59:08 · 558 阅读 · 0 评论 -
python记录日志loguruf方法
【代码】python记录日志loguruf方法。原创 2024-12-19 17:30:58 · 541 阅读 · 0 评论 -
SQL或ORM获取随机一行数据
时,对于一些大型数据库可能会导致性能问题,因为它会在内存中对整个查询集进行随机排序。如果对性能有较高要求,建议使用原生 SQL 结合。或其他更高效的方法。原创 2024-12-19 14:58:43 · 766 阅读 · 0 评论 -
天选打工人日报周报AI平台-AI云记介绍
作为一名资深的天选打工人,肯定这样想过有没有这样一款编辑器?可以自己帮我写好日报周报,我粘贴一下就好啦!可以帮我把内容扩容一下,我写个关键词就好啦!可以帮我把内容写的高大上,我只需要写点流水账就好啦!当当当!这个平台现在出来了,他就是 AI云记平台- note.airtab.cn。原创 2024-11-18 00:01:54 · 908 阅读 · 0 评论 -
pip的whell包.whl打包过程记录
安装库:pip install setuptools wheel1.目录结构-test_package --src --test_package -- __init__.py --function.py --pyproject.toml --readme.md2.文件说明pyproject...原创 2023-11-08 17:09:00 · 368 阅读 · 0 评论 -
pandas读取hdfs里面文件的方法
注意sep是你的列分隔符。原创 2024-08-30 10:27:09 · 1120 阅读 · 0 评论 -
pip3更换清华源-pip换源
【代码】pip3更换清华源-pip换源。原创 2024-08-26 16:39:05 · 741 阅读 · 0 评论 -
微信公众号发送模板消息使用说明
3.用户的openid一般在用户使用微信公众号登录时会获取,测试时可以在服务号后台的用户页面,在用户头像上右键在新标签中打开链接,里面的tofakeid=后面的值就是该用户的openid。1.测试时需要在服务号添加ip白名单,并等待10分钟生效。2.模板id在服务号的模板消息处获取。原创 2024-08-21 11:44:21 · 1222 阅读 · 0 评论 -
Python生成缩略图
默认是128 * 128的缩略图,像电脑使用的宽图一般是 1920 * 1080 这种的,一个常见的尺寸是300x169(保持16:9的宽高比),或者更小的尺寸如200x113,甚至更小到100x56。这样的尺寸既能在网页上快速加载,又能提供足够的预览信息。原创 2024-08-13 18:51:22 · 755 阅读 · 0 评论 -
Python版本和cuda版本不匹配解决办法
选择适合自己的 平台 和版本,在控制台执行安装即可,注意在windows下使用的是pip不是pip3。获取pip安装命令,按照可视化进行选择,复制下方的一键安装命令进行安装。如果输出为 False,则说明不匹配。一、检查版本是否匹配。原创 2024-08-07 00:20:55 · 923 阅读 · 0 评论
分享