自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(37)
  • 收藏
  • 关注

原创 项目实训个人工作梳理

创新实训最开始的拟题工作是我负责的,最开始是因为在通知里面提到了法律相关的任务,而在我的印象中,法律就是引用大量的案例(经验),并且在法条(逻辑)的框架下进行判罚,而且法律比较火的方向就是摘要提取,刑期预测以及简单的模拟律师(类似客服机器人的想法?在一切目标都有很好的前置条件的情况下做出的“法律文书专家系统”的题目决策。目标就是做一个轻量化的平台来实现以上的目标。

2025-06-15 20:53:50 928

原创 山东大学项目实训-创新实训-法律文书专家系统-项目报告(八)

可点开查看详情和删除,查看详情可进一步打印成pdf。

2025-06-15 19:27:36 394

原创 山东大学项目实训-创新实训-法律文书专家系统-项目报告(七)

作为项目中对话管理模块的开发者,我聚焦于核心功能,基于实现与 MongoDB 的高效交互。

2025-06-15 15:40:18 608

原创 山东大学项目实训-创新实训-法律文书专家系统-项目报告(六)

│ │ └── QARecordServiceImpl.java # 问答服务实现。├── webpack.base.config.js # Webpack基础配置。│ │ ├── LoginServiceImpl.java # 登录服务实现。│ │ └── LoginRequest.java # 登录请求DTO。│ └── QARecordService.java # 问答服务接口。│ │ │ ├── history1.vue # 法律文书历史会话。

2025-06-15 11:49:45 563

原创 山东大学项目实训-创新实训-法律文书专家系统-项目报告(五)

当前业务进度,已完成对话接口的调试并实现记忆功能,完成模型的。并为模型设计了更合理的prompt工程,提高了模型的可读性。基础摘要、预测、对话页面设计。

2025-06-15 01:31:19 156

原创 Prompt管理技巧

它的主要作用是将 Python 中的数据渲染到 HTML 页面中。但在本项目中jinja2可以用于自动化生成prompt模板。代码首先指明了存放prompt的目录,然后根据template_name找到对应的prompt,再将对应的属性进行填充。它是一种利用语言模型的能力,通过构造特定的输入,来达到高质量输出的技术手段。相关法条通过使用rag技术查询语义相关的法条,然后输入模型对结果进行预测。【结束符号】用于标注结果,将模型的输出于prompt分开。其中的案件描述以及相关法条就需要进行填充。

2025-06-15 01:22:50 244

原创 模型优化---------------切换模型(1)

已知我们的项目有三个功能法律文书摘要(摘要)、刑期预测(预测)、法律问答(问答)。并且针对三个功能都训练了对应的lora。但是同时挂载多个lora会导致溢出,并且只保留最后一个lora,导致最终产生效果的只有最后一个lora。为了增益模型的反馈,我使用的方案是请求端请求服务后再挂载lora,当请求另一个服务时,清除缓存,重新加载模型并加载lora。

2025-06-10 01:22:50 283

原创 Rag技术----项目博客(六)

定义:检索增强生成(Retrieval Augmented Generation),简称 RAG,已经成为当前最火热的LLM应用方案。目的:通过提供相关领域数据库通过问题检索信息,将相关信息合并到Prompt中,增强模型的专业性。深入浅出RAG技术:RAG=检索技术+LLM提示//LLM提示就是之前文章中提到过的promt工程,这里不再赘述,主要理解检索技术。

2025-06-03 21:39:08 866

原创 关于模型记忆力的实现方式----项目报告(五)

当请求段传回的conversation_id为空时创建一个conversation否则根据conversation_id来找到对应的conversation。add_message(self,conv_id:str,message:Message): 通过conv_id找到对应的conversation后插入message。get_conversation(self,conv_id:str):通过conversation_id找到对应的conversation。id:对不同的会话记录使用id来标识。

2025-05-26 19:16:18 590

原创 线性判别函数与参数、非参数估计

将一个一维或多维数组重塑为一个具有特定形状的二维数组。

2025-05-08 00:15:00 1528

原创 山东大学项目实训-创新实训-法律文书专家系统-项目报告(四)

法律文书专家系统是一个 Web 应用,提供法律文书摘要提取、法律预测报告生成和法律考试问题答疑三大核心功能。用户需要登录或注册后,进入主页面选择所需功能,进行相应的操作。法律文书原文:法律文书摘要:前端支持上传的文件格式有DOCX、TXT、PDF。后端响应日志:Prompt成功载入。

2025-05-06 16:37:04 330

原创 山东大学项目实训-创新实训-法律文书专家系统-项目报告(三)

法律文书专家系统是一个 Web 应用,提供法律文书摘要提取、法律预测报告生成和法律考试问题答疑三大核心功能。用户需要登录或注册后,进入主页面选择所需功能,进行相应的操作。

2025-05-05 21:22:02 393

原创 山东大学项目实训-创新实训-法律文书专家系统-项目报告(二)

法律文书专家系统是一个 Web 应用,提供法律文书摘要提取、法律预测报告生成和法律考试问题答疑三大核心功能。用户需要登录或注册后,进入主页面选择所需功能,进行相应的操作。

2025-05-05 15:11:24 752

原创 模型部署与提供服务

FastAPI是一个用于构建 API 的现代、快速(高性能)的 web 框架,使用 Python 并基于标准的 Python 类型提示。安装脚本/bin/bashLLaMA-Factory项目提供了多个高层次抽象的调用接口,包含多阶段训练,推理测试,benchmark评测,API Server等,使开发者开箱即用。安装脚本/bin/bash执行脚本后如果返回llamafactory-cli的版本号,那么代表校验成功。注意llamafactory依赖(4.51.0peft0.15.1)

2025-05-04 23:42:12 486

原创 基于AutoDL V100微调DeepSeek Coder 6.7B (2)

以上就是模型训练需要的相关知识,总的来说主要需要设置的参数Lora的参数以及训练参数,Lora参数的目的在于在训练的过程中降低GPU负荷。训练参数的目的在于加速训练速度以及影响训练的效果过低和过高都会影响模型训练速度以及模型的训练效果。最终将所有的参数载入到peft的trainer当中进行训练即可。import osTrainer,TaskType# ========== 基础配置 ==========# ========== 量化 & 加载模型 ==========

2025-04-29 21:53:02 1019

原创 基于AutoDL V100部署DeepSeek Coder 6.7B (1)

登录官网,并注册(学生认证之后有优惠,新用户好像也有30天优惠)注册完成后要向钱包内充值,充值完成后点击算力市场即可租赁算力。选择好想要的显卡后点击蓝色按钮即可。根据页面信息,免费提供50GB的硬盘存储空间,扩容的话需要支付额外的费用,此外,还可以选择框架名称/框架版本/python版本/CUDA版本,由于使用的DeepSeek版本大小仅为5GB因此不需要扩容,本项目使用的镜像版本为PyTorch / 2.1.0 / 3.10(ubuntu22.04) / 12.1完成设置后创建创建并开机即可。

2025-04-21 22:01:26 898

原创 决策树学习(ID3、C4.5、CART)

决策树中的节点:threshould:阈值,当feature(特征)对应的超过阈值之后可能向左/右节点移动,反之则向另一个节点移动。

2025-04-20 16:38:00 1033

原创 山东大学项目实训-创新实训-法律文书专家系统-个人报告(一)

在本项目中,我主要负责大模型的本地部署,个人工作主要围绕。

2025-04-12 19:35:46 883

原创 山东大学项目实训-创新实训-法律文书专家系统-项目报告(一)

将一个一维或多维数组重塑为一个具有特定形状的二维数组。

2025-04-12 12:46:29 881

原创 Servlet学习笔记---理论篇

到这里,您基本上已经完成了,现在让我们使用 <Tomcat-installation-directory>\bin\startup.bat(在 Windows 上)或 <Tomcat-installation-directory>/bin/startup.sh(在 Linux/Solaris 等上)启动 tomcat 服务器,最后在浏览器的地址栏中输入 http://localhost:8080/HelloWorld。另一个向后台程序传递信息的比较可靠的方法是POST方法。起到上传下达的作用。

2024-08-06 16:28:38 678

原创 Web术语(实时更新)

HTML表单HTML表单,表单用于收集用户的输入信息HTML表单是文档中的一个区域,此区域包含交互控件,将用户手机道德信息发送到Web服务器。表单表单的三个基本组成部分表单标签:包含了处理表单数据所用的URL以及数据提交到服务器的方式表单域:包含了文本框、密码框、隐藏域、多行文本框、复选框、单选框、下拉选择框和文件上传框表单按钮:提交按钮、复位按钮和一般按钮,用于将数据传送到服务器上或取消输入表单是一个抽象概念,有以上结构的就可以被称为是表单,如就是一个表单表单的基本语法。

2024-08-05 16:49:05 390

原创 山东大学操作系统实验--3

systemV:System V 信号量是 Unix 系统提供的一种进程间同步机制,用于协调多个进程对共享资源的访问。它们是 System V IPC (Inter-Process Communication) 的一部分,允许进程通过一组信号量来控制对资源的访问。因此我们需要一个buff初始值为1来表示生产者---消费者、消费者---消费者的互斥关系,需要tobacco、paper、matches来表示生产者与各个消费者之间的同步关系。抽烟者问题的本质就是一个生产者对应多个消费者的问题。

2024-05-28 16:31:52 476

原创 【CCF-CSP】202412-3 树上搜索

题目:西西艾弗岛大数据中心为了收集用于模型训练的数据,推出了一项自愿数据贡献的系统。岛上的居民可以登录该系统,回答系统提出的问题,从而为大数据中心提供数据。为了保证数据的质量,系统会评估回答的正确性,如果回答正确,系统会给予一定的奖励。近期,大数据中心需要收集一批关于名词分类的数据。系统中会预先设置若干个名词类别,这些名词类别存在一定的层次关系。例如,“动物”是“生物”的次级类别,“鱼类”是“动物”的次级类别,“鸟类”是“动物”的次级类别,“鱼类”和“鸟类”是“动物”下的邻居类别。

2024-05-26 13:55:59 1742

原创 【CCF-CSP】202403-2 相似度计算

两个集合的 Jaccard 相似度定义为:𝑆𝑖𝑚(𝐴,𝐵)=∣𝐴∩𝐵∣∣𝐴∪𝐵∣Sim(A,B)=∣A∪B∣∣A∩B∣​即交集的大小除以并集的大小。统计第一篇文章的时候可以把没有出现的词汇数量可以全部累加到并集中,统计第二篇文章时,先统计出现的词汇是否能在第一篇文章中找到,如果能找到那么就统计到并集中去,否则再第二个哈希表中查找,如果没能找到那么就可以将其统计的并集中。试编写程序帮助小 P 完成前两步,计算出 ∣𝐴∩𝐵∣∣A∩B∣ 和 ∣𝐴∪𝐵∣∣A∪B∣;小 P 将亲自完成最后一步的除法运算。

2024-05-16 21:29:26 1174

原创 【CCF-CSP】202403-4 词频统计

假设这 𝑛n 篇文章中共出现了 𝑚m 个不同的单词,则把它们从 11 到 𝑚m 进行编号。这样,每篇文章就简化为了一个整数序列,其中每个数都在 11 到 𝑚m 范围内。输入的第 𝑖+1i+1 行(1≤𝑖≤𝑛1≤i≤n)包含由空格分隔的若干整数, 其中第一个整数 𝑙𝑖li​ 表示第 𝑖i 篇文章的长度(单词个数);接下来 𝑙𝑖li​ 个整数表示对应的整数序列,序列中每个整数均在 11 到 𝑚m 范围内,各对应原文中的一个单词。输入的第一行包含两个正整数 𝑛n 和 𝑚m,分别表示文章篇数和单词编号上限。

2024-05-16 21:23:24 769

原创 【CCF-CSP】202403-4 十滴水

在我们的例子中,c=m=5,按照编号顺序,每个格子中分别有 2,4,4,4,22,4,4,4,2 滴水。在我们的例子中,若玩家对第三格进行操作,则其水滴数变为 55,故第三格水滴爆开,水被清空,其左侧最近的有水格子(第二格)和右侧最近的有水格子(第四格)的水量增加 11,此时每个格子中分别有 2,5,0,5,22,5,0,5,2 滴水。此时第二格和第四格的水滴数均大于等于 55,按照规则,第二格的水先爆开,爆开后每个格子中分别有 3,0,0,6,23,0,0,6,2 滴水;十滴水是一个非常经典的小游戏。

2024-05-16 21:21:22 1089

原创 Leetcode 652. 寻找重复的子树

将所有二叉树子树序列化成字符串然后利用哈希表统计出现过的二叉树序列如果出现重复的那么就将该节点插入答案序列。(二叉树序列化其实就是按照某种顺序输出二叉树节点的值)需要注意的细节是,节点的取值是多位数,因此不能直接使用加法连接,而是要在中间加上括号来识别序列。对于同一类的重复子树,你只需要返回其中任意。给你一棵二叉树的根节点。

2024-05-16 12:46:32 207

原创 Leetcode 2997. 使数组异或和等于 K 的最少操作次数

这里只需要关注异或运算的性质,异或具有交换律结合律,何时进行操作并不重要,因此可以看成先进行异或运算最后再对剩余的1进行处理。,你也可以将一个数的前导 0 翻转。,请你返回达成这一目标的。你可以对数组执行以下操作。元素的按位异或和得到。翻转第四个数位,得到。

2024-05-14 21:42:50 241

原创 Leetcode 代码测试用例测试用例测试结果2998. 使 X 和 Y 相等的最少操作次数

ans用来存储当前数据直接使用减法或者加法到达y数值的操作数,step用来记录利用除到达y的操作数。add()用来更新ans的同时把经过操作的数字添加到bfs队列当中。可以把x-->y转化为x'-->y其中x'的变化方案有,为x/11向下取整。注意x/11向上取整可以分为先向下取整再向上+1,但是注意。1+x%11+1不一定小于11-x%11+1。解法二:记忆化搜索+BFS。

2024-05-14 21:39:55 216

原创 Leetcode 1792. 最大平均通过率

一所学校里有一些班级,每个班级里有一些学生,现在每个班都会进行一场期末考试。的优先级更高,并执行extraStudent次添加学生操作,最后统计平均通过率即可。由于班级总数不变,因此可以把平均通过率最大转化为总通过率最大。等于这个班级通过考试的学生人数除以这个班级的总人数。能通过任何班级的期末考。是所有班级的通过率之和除以班级数目。个学生每人都安排一个班级,使得。,总是给一个班级分配贡献并不高。以内的结果都会视为正确结果。,表示你提前知道了第。个学生去对应班级后的。个学生可以通过考试。

2024-05-13 12:13:18 187

原创 Leetcode 1793.好子数组的最大分数

枚举num[k]~0之间的所有数字作为最小值的区间并求和,这样的时间复杂度会式O(C+n)其中C为数组中的最小值,之所以是加法是因为i是单调枚举的,因此整个数组只会被遍历一遍。子数组的两个端点下标需要满足。

2024-05-13 11:38:03 222

原创 LeetCode1094.拼车

车上最初有capacity个空座位。车向一个方向行驶(也就是说,给定整数capacity和一个数组trips表示第i次旅行有乘客,接他们和放他们的位置分别是fromi和toi。这些位置是从汽车的初始位置向东的公里数。当且仅当你可以在所有给定的行程中接送所有乘客时,返回true,否则请返回false。

2024-04-29 11:27:30 142 1

原创 LeetCode1329.将矩阵对角线排序

是一条从矩阵最上面行或者最左侧列中的某个元素开始的对角线,沿右下方向一直到矩阵末尾的元素。巧妙之处在于对角线的映射,利用对于不同的对角线映射在i-j+m上非常巧妙。上的元素按升序排序后,返回排好序的矩阵。

2024-04-29 10:57:10 164

原创 学习笔记(23.4.11)指针基础学习

当我们用int连续定义几个变量的时候他们的内存空间事实上是相邻的,但是使用new int(x)开辟的地址是存储在heap里面,也就是与之前的几个变量名存储的空间并不连续。内存的每个每个字节有一个自己的编号叫做地址,而相关的数据和代码会被储存在一段连续的内存内,因此我们可以通过访问首地址然后根据数据类型从而得到该数据的全部内容。//&i相当于是对i的一个引用,也可以看作是一种取地址的运算符,p存储了i的内存地址。//*p是对p存储内存地址的访问,*也可以看作一个运算符,用于对地址的访问。

2023-04-11 09:52:35 172 1

原创 学习笔记(23.4.23)树状数组,线段树

对于区间修改,需要引入“慵懒标记”这个概念,如果遍历修改区间的每一个数字,那么复杂度其实和遍历一整颗树差不多(向下二分了还得回来,感觉还不如直接遍历区间修改),但是我们可以直接对想要的区间进行修改,并对它进行标记,当我们想要利用到接下来的子区间的时候我们再将标记下放,这样就可以O(1)修改区间了。(即排名在这个数据之后,但是却先被标记的数字)而查询就是对想要查询的区间不断二分拆解,最后所查询到的区间包含在想要查询的区间内的时候,就返回查询的值,本质上来说就是将查询到的子区间拼接成我们想要查询的区间。

2023-04-11 08:06:22 110 1

原创 Buy low sell high

第一个5的意义是2升值为5,如果日后我们发现可以以大于5的价格(x)去售卖那么我们又在那一天将这支股票卖出,事实上就是对之前在5这一天卖出股票决策的“反悔”,在之后更高价格的点卖出,因为5>2,因此x-52,那么假设我们就用5的价格去售卖,我们压入两个5,理由如下。你可以预测未来n天的股价,你需要设计一个算法来计算未来n你能活得的最大利益。会有多个x和y的组合,而我们要求的就是。

2023-01-17 23:11:57 124

原创 素数筛(个人学习分享)

对于素数筛的一些理解,以及对于欧拉筛合理性的推导。

2022-11-08 15:19:55 156

山东大学项目实训-创新实训-法律文书专家系统-项目报告(二)

原始数据集

2025-05-05

山东大学软件学院2024信息安全导论往年题

山东大学软件学院2024信息安全导论往年题

2024-12-17

山东大学软件学院信息安全导论期末复习笔记

山东大学软件学院信息安全导论期末复习笔记

2024-12-17

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除