
AI应用开发
文章平均质量分 75
德信软件
人工智能/数据工程/软件开发从业,华电硕士,CSDN人工智能领域认证新星博主。
算法研发、数据工程、PLC工控软件定制化、Web系统定制化、微信小程序定制化,合作私信。
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
CyberScraper-2077+simple-one-api:使用大模型爬虫
CyberScraper 2077 不仅仅是另一个网络抓取工具——它是对数据提取未来的一瞥。诞生于赛博朋克世界霓虹灯闪烁的街道,这款 AI 驱动的抓取工具使用 OpenAI 切开网络的防御,以无与伦比的精度和风格提取您需要的数据。原创 2024-08-23 09:12:07 · 1224 阅读 · 0 评论 -
快速web开发:Vue和FastAPI完美组合
Vue.js和FastAPI的结合,为开发者提供了一种高效、易维护且可扩展的前后端分离开发方案。Vue.js以其优雅的界面交互和组件化设计,为用户带来良好的体验;在这种趋势下,Vue.js和FastAPI这两大技术栈因其出色的性能和易用性,受到了广大开发者的青睐。接下来,我们创建一个Vue.js前端项目,用于调用FastAPI后端API并展示数据。Vue.js是一款渐进式的前端框架,它以其轻量级和高效性著称,为开发者提供了一种全新的开发体验。命令,启动Vue.js的开发服务器。为什么选择Vue.js?原创 2024-08-20 15:23:22 · 1753 阅读 · 0 评论 -
分享一个sh脚本测试网络连通性
【代码】分享一个sh脚本测试网络连通性。原创 2024-08-15 11:30:21 · 271 阅读 · 0 评论 -
telnet与ping:测试IP及端口连通性
ping 是一个广泛使用的网络诊断工具,它通过发送 Internet Control Message Protocol (ICMP) echo 请求到目标并监听回应报文来测试与目标主机的连通性。众所周知的、老生常谈的、好用有效的。原创 2024-08-01 09:43:00 · 1115 阅读 · 0 评论 -
离线条件下linux的docker及docker-compose快速部署(附资源)
这些配置文件允许用户以声明性的方式定义应用程序的组件,包括容器、网络、卷和数据卷等。Docker Compose 是一个强大的工具,特别是对于开发、测试和轻量级生产环境中的应用程序部署。使用 docker-compose stop、docker-compose start、docker-compose rm 等命令来管理服务的生命周期。创建一个 docker-compose.yml 文件,定义应用程序的服务、网络和卷。服务定义了容器在生产中的行为,包括构建设置、环境变量、依赖、卷映射和端口映射等。原创 2024-07-29 18:39:33 · 1230 阅读 · 0 评论 -
Conda pack 进行Python环境打包
工程项目落地免不了环境部署,可以使用conda-pack 进行conda 环境打包和分发。原创 2024-07-23 11:02:47 · 883 阅读 · 0 评论 -
无痛接入PDF-Extract-Kit:最强PDF文档解析项目
由于文档类型的多样性,现有开源的布局检测和公式检测很难处理多样性的PDF文档,为此我们内容采集多样性数据进行标注和训练,使得在各类文档上取得精准的检测效果,细节参考布局检测和公式检测部分。对于公式识别,UniMERNet方法可以媲美商业软件,在各种类型公式识别上均匀很高的质量。安装完环境后,可能会遇到一些版本冲突导致版本变更,如果遇到了版本相关的报错,可以尝试下面的命令重新安装指定版本的库。除了版本冲突外,可能还会遇到torch无法调用的错误,可以先把下面的库卸载,然后重新安装cuda12和cudnn。原创 2024-07-19 15:08:38 · 2197 阅读 · 0 评论 -
无痛接入FastText算法进行文本分类(附代码)
FastText的特点如下:速度:FastText的设计初衷就是为了高效,它的训练速度比许多其他文本处理工具快得多。简单:FastText的模型结构相对简单,易于理解和实现。准确性:尽管模型简单,但FastText在许多文本分类任务中都能达到与其他复杂模型相媲美的准确度。多功能性:除了文本分类,FastText还可以用于词嵌入的生成,它可以捕捉到词的语义信息,比如相似的词在嵌入空间中会彼此接近。支持多语言:FastText能够处理多种语言的文本,这对于跨语言文本分类任务非常有用。原创 2024-06-27 13:59:45 · 1395 阅读 · 0 评论 -
Segment any Text:优质文本分割是高质量RAG的必由之路
文本自动切句是个很有趣且很重要的场景,传统的句子分割方法依赖于基于规则或统计的方法,这些方法通常需要依赖于标点符号等词汇特征,例如早期方法使用决策树来确定文本中的每个标点符号是否表示句子边界,这基于标点周围的语言特征。这是一种用于改善自然语言处理(NLP)系统中文本句子分割的方法,据Segment any Text名称看,这是一个能够分割任意段落自然语言文本的工作。通过示例可以发现,其各种文本,是包括了无标点无格式文本、符号混乱无格式文本、语义混乱无格式文本。此次分享,各位按需使用。原创 2024-06-26 19:00:16 · 1146 阅读 · 0 评论 -
HAC-TextRank算法进行关键语句提取
该算法是我研究生毕业设计的一个创新点,在当时背景下是很好的研究成果,但随着大模型的推出,传统的NLP研究创新基本被革新了。这里分享出来是因为该创新的有一定的启发思路,希望在今后大模型或其他AI领域的开发中有开发者能用到。TextRank算法是一种基于图排序的文本挖掘算法,主要用于文本摘要和关键词提取。它是基于PageRank算法的原理,通过将文本内容构建成一个图模型,然后利用图的节点之间的连接关系来计算每个节点的权重,进而提取出重要的句子或关键词。分词和预处理。原创 2024-06-20 15:52:36 · 1065 阅读 · 0 评论 -
labelme使用笔记:目标检测数据集标注和语义分割数据集批量生成
Labelme 是一个开源的数据标注工具,它能够帮助用户为图像、视频等数据添加标签,以供机器学习模型训练使用。Labelme 支持多种类型的标注,包括目标检测、分割、分类等任务,用户可以通过绘制矩形框、多边形、圆形等图形来标注对象,也可以进行像素级的分割标注。Labelme 的特点包括:跨平台:Labelme 支持多个操作系统,包括 Windows、macOS 和 Linux。易于使用:它有一个直观的用户界面,方便用户进行标注工作。原创 2024-06-20 10:04:27 · 1690 阅读 · 0 评论 -
一文理清OCR的前世今生
什么是OCR?计算机文字识别,光学字符识别,英文全称Optical Charater Recognition,简称OCR.是利用光学技术和计算机技术把印刷在或者写在图纸上的文字以文本形式提取出来,并转换成一种计算机能够接受、人又可以理解的格式的技术。OCR技术是实现文字快速录入的一项关键技术。在信息社会时代,每天会产生大量的票据、表单、证件数据,这些数据要电子化,需要利用OCR技术进行提取录入。简而言之,OCR其本质是一种信息提取手段,也是一种工作提效方法。原创 2024-06-19 10:37:45 · 2056 阅读 · 0 评论 -
无痛接入图像生成风格迁移能力:GAN生成对抗网络
GAN(生成对抗网络)是一种深度学习算法,由Ian Goodfellow等人在2014年提出。GAN由两部分组成:生成器(Generator)和判别器(Discriminator)。生成器的作用是生成尽可能接近真实数据分布的数据,而判别器的作用是判断输入的数据是真实数据还是生成器生成的假数据。GAN的工作原理可以类比于造假币者和警察的博弈过程。造假币者(生成器)尝试制造尽可能逼真的假币,而警察(判别器)则尝试识别出假币。原创 2024-06-19 09:04:14 · 1051 阅读 · 0 评论 -
Ubuntu服务器的GitLab部署
GitLab 是一个基于网页的版本控制系统,它提供Git存储库的管理、代码审查、问题跟踪和活动流等功能。GitLab 由 GitLab Inc. 开发,使用 Ruby 语言编写,并使用 Git 版本控制系统作为其后端。GitLab 提供了与GitHub类似的功能,但重点在于支持内部部署。这意味着公司或组织可以在自己的服务器上部署GitLab,从而完全控制其源代码和协作工具。代码存储和管理:GitLab 提供了强大的代码存储和管理功能,支持多个版本库,允许用户轻松地克隆、推送、拉取和同步代码。原创 2024-06-17 10:14:29 · 1322 阅读 · 0 评论 -
图文RAG组件:360LayoutAnalysis中文论文及研报图像分析
最近要做一些图文RAG研究,其中,面向图文交叠的文档难以解析,因此对文档的图文内容进行详细定位就成了关键。该开源项目基于YOLO8,并结合优质中文研报场景数据,训练出了轻量级符合需求的图文分析模型。开源地址:模型权重:部署等工作可以通过镜像网站完成。原创 2024-06-14 16:32:34 · 948 阅读 · 0 评论 -
python脚本将视频抽帧为图像数据集
最近要做一些大模型多模态方面的工作,但缺少图像数据,这里分享一个脚本,可将视频抽帧为图像数据集。原创 2024-06-06 14:42:01 · 858 阅读 · 0 评论 -
拓扑数据的关键点识别算法
分享一下之前写的拓扑网络/系统结构/图数据的关键点识别程序。原创 2024-05-31 15:11:03 · 507 阅读 · 0 评论 -
sqlite性能考量及使用(附可视化操作软件)
要为工厂上一个信息化管理项目,该项目仅在本地支持运行,且无需高并发,数据量在w级,考虑各方面因素选定sqlite,本文介绍一些考量过程和简单使用,给大家一定参考。原创 2024-05-31 14:50:52 · 1300 阅读 · 0 评论 -
ChatTTS:开源语音合成项目
语音合成,顾名思义。ChatTTS是专门为对话场景设计的文本转语音模型。支持英文和中文两种语言。最大的模型使用了10万小时以上的中英文数据进行训练。在HuggingFace中开源的版本为4万小时训练且未SFT的版本。整体感觉语音还是比较自然。原创 2024-05-31 13:51:09 · 902 阅读 · 0 评论 -
python使用modbustcp协议与PLC进行简单通信
要使用pymodbus框架对PLC(如PLC 1512c,假设它支持Modbus协议)进行读和写操作,你需要首先确定PLC的Modbus地址、端口号、设备ID(单元标识符)以及你想要读写的寄存器类型(如线圈、离散输入、输入寄存器或保持寄存器)。Modbus协议:是一种广泛使用的通信协议,用于工业自动化系统。可以使用pymodbus库在Python中实现Modbus客户端或服务器。python使用modbustcp协议与PLC进行简单通信。原创 2024-05-29 17:45:34 · 1203 阅读 · 0 评论 -
爬虫进阶:多线程爬虫
【代码】爬虫进阶:多线程爬虫。原创 2024-05-22 16:11:23 · 444 阅读 · 0 评论 -
yolo-world:”目标检测届大模型“
YOLO在标准基准测试中,World 的速度和效率超过了现有的开放词汇检测器,包括 MDETR 和 GLIP 系列,展示了YOLOv8 在单个 NVIDIA V100 GPU 上的卓越性能。YOLO属于经典的传统AI模型,即经过有监督的训练后,模型学习到特征与标签间的关联关系,可对图像、视频中出现的物体进行特征检测,负荷已知特征的物体图像会被打上标签和置信度。:利用 CNN 的计算速度,YOLO-World 可提供快速的开放词汇检测解决方案,满足各行业对即时结果的需求。原创 2024-05-07 17:30:26 · 1956 阅读 · 3 评论 -
python使用API实现word文档翻译
最近公司涉及出口业务,需要将一些说明书、规格相关文件进行英文翻译,量大、难度大,人力远远不够。原创 2024-05-07 10:02:03 · 646 阅读 · 0 评论 -
python opencv实现图像分割(附代码)
图片中存在多个铭牌,这样会影响铭牌中信息抽取精度,由此需利用CV技术对图像进行分割。原创 2024-04-25 17:01:21 · 824 阅读 · 0 评论 -
windows下基于python语言的TTS开发
TTS,全称Text To Speech,即从文本到语音,是人机对话的一部分,它让机器能够说话。TTS是同时运用语言学和心理学的杰出之作,在内置芯片的支持之下,通过神经网络的设计,把文字智能地转化为自然语音流。原创 2024-04-03 17:13:51 · 622 阅读 · 0 评论 -
linux下python服务定时(自)启动
AI应用开发相关目录 本专栏包括AI应用开发相关内容分享,包括不限于AI算法部署实施细节、AI应用后端分析服务相关概念及开发技巧、AI应用后端应用服务相关概念及开发技巧、AI应用前端实现路径及开发技巧适用于具备一定算法及Python使用基础的人群AI应用开发流程概述Visual Studio Code及Remote Development插件远程开发git开源项目的一些问题及镜像解决办法python实现UDP报文通信python实现日志生成及定期清理Linux终端命令Screen常见用法原创 2024-04-03 14:47:25 · 608 阅读 · 0 评论 -
linux和windows系统下的python环境迁移
4.本地安装 pip install --no-index --find-links=./packs/ -r requirements.txt 如果无法离线创建虚拟环境,就需要运行下面的conda命令: conda config --set offline true。3.从指定源下载需要文件到指定文件夹里 pip download -r requirements.txt -d packs/ -i https://mirrors.aliyun.com/pypi/simple/原创 2024-04-03 14:09:11 · 1007 阅读 · 0 评论 -
Linux、Git、Docker常用指令
【代码】Linux、Git、Docker常用指令。原创 2024-03-22 13:49:25 · 465 阅读 · 0 评论 -
一文理清python学习路径
git、docker、vs、mobaxter、navicat、wincp等开发软件或工具的使用。gensim、jieba、音频处理、时频域变换、信号处理策略等数据方面的辅助技能和知识。爬虫基本代码框架(requests,正则、xpath、bs4等)迁移学习、强化学习、参数/超参数优化手段等模型方面的知识和技能。prompt、agent等方向的大模型性能提升能力。各种数据评估数据计算(混淆矩阵、SSE等)RAG、DB、KG等方向的大模型开发能力。python学习路线总结。mlp、arima等模型。原创 2024-03-22 09:23:05 · 573 阅读 · 0 评论 -
AI应用开发-基于python的知识图谱技术
图数据、图数据库、知识图谱和Neo4j都是与数据处理和存储相关的概念和技术,它们在许多领域都有广泛的应用。原创 2024-03-21 16:16:12 · 1240 阅读 · 0 评论 -
基于selenium和bs4的通用数据采集技术(附代码)
本文所说的数据采集技术即爬虫,爬虫技术用于从互联网上抓取大量数据。这些爬虫程序能够自动化地访问网页/公众号平台、解析内容,并提取所需的信息。在大数据和机器学习等领域,爬虫技术发挥着至关重要的作用。数据采集技术为项目提供丰富的数据资源,根据这些信息进行产品设计和创新,持续改进和优化产品。原创 2024-03-21 15:34:36 · 1929 阅读 · 1 评论 -
一文总结python的异常数据处理示例
数据是一切应用开发的基础,异常数据处理可以保障数据质量。本文总结了基于数据分布、聚类算法、树、距离以及概率的异常数据处理算法及其示例。原创 2024-03-16 20:18:21 · 667 阅读 · 0 评论 -
AI应用开发-python对MySQL数据的常见使用
完结,撒花!原创 2024-03-07 09:42:11 · 954 阅读 · 0 评论 -
AI应用开发-python实现文本向量化及文本相似度计算
完结,撒花!原创 2024-03-06 10:35:20 · 843 阅读 · 2 评论 -
AI应用开发-python字符串转字典
在python应用开发场景中,必然设计一些数据类型的转换。如:字符串类型转整型浮点型转整型整型、浮点型转字符串类型等等其中,字符串作为python的常用数据类型,掌握其向字典的转化非常必要。完结,撒花!原创 2024-03-05 16:01:39 · 570 阅读 · 0 评论 -
AI应用开发-python实现redis数据存储
完结,撒花!原创 2024-02-05 14:21:19 · 859 阅读 · 1 评论 -
AI应用开发-Linux终端命令Screen常见用法
完结,撒花!原创 2024-02-04 21:12:55 · 839 阅读 · 1 评论 -
AI应用开发-python实现日志生成及定期清理
完结,撒花!原创 2024-02-03 10:18:50 · 664 阅读 · 1 评论 -
AI应用开发-python实现UDP报文通信
完结,撒花!原创 2024-02-02 21:33:59 · 939 阅读 · 0 评论 -
AI应用开发-git开源项目的一些问题及镜像解决办法
完结,撒花!原创 2024-02-01 09:29:30 · 715 阅读 · 1 评论