- 博客(66)
- 收藏
- 关注
原创 [补题] 第 45 届国际大学生程序设计竞赛(ICPC)亚洲区域赛(上海)
前往独立博客获取更好阅读体验:http://kesisour.work/index.php/archives/90/题源: https://ac.nowcoder.com/acm/contest/9925G Fibonacci签到题,斐波那契数列中偶数的个数为长度的三分之一,贡献值从 n 向下递减/// ~~AK~~ Cu#include <bits/stdc++.h>#define int lltypedef long long ll;using namespace .
2020-12-19 23:50:03
994
1
原创 “后疫情时代”的金融科技价值
“后疫情时代”的金融科技价值建议去博主的独立博客以获得更好的阅读体验首先附上自己整理的文章结构以下文章来源于北大金融评论杂志 ,作者朱光“后疫情时代”之下,疫情凸显了金融科技不可估量的价值。一方面,作为数字经济基础设施的重要组成部分,金融科技能够基于风险管理本质,推动产品及服务变革,助力金融行业向“全流程线上化”快速演进;另一方面,金融科技将加速金融行业服务下沉,承担起助力小微的“稳定器”和“加速器”职能,携手金融机构为中小微企业输血,持续与经济体中的各个基本单元加速融合,为拉动内需、激活
2020-07-29 22:26:27
631
原创 Hierarchical Attention Networks(HAN)
HAN模型由paperHierarchical Attention Networks for Document Classification提出,模型结构如下图:模型自下而上结构如下:Enbedding -> Bidirectional RNN(GRU/LSTM) -> Attention -> Bidirectional RNN(GRU/LSTM) -&...
2020-06-27 17:44:01
1406
2
原创 TextCNN
TextCNN 最早由paper《Convolutional Neural Networks for Sentence Classification》提出,将 CNN 应用到 NLP 领域,论文本身比较容易理解,下图即可理解模型结构:其实单层CNN加个全连接层辣基本流程:输入数据 embedding卷积核尺寸 = 单词 embedding 后的维度 * 每次考虑单词的数量,...
2020-06-26 14:18:40
221
原创 词向量(one-hot/SVD/NNLM/Word2Vec/GloVe)
词向量简介无论是是机器学习还是深度学习在处理不同任务时都需要对对象进行向量化表示,词向量(Word Vector)或称为词嵌入(Word Embedding)做的事情就是将词表中的单词映射为实数向量。(长文预警)基于one-hot编码的词向量方法简单方法就是将词向量用one-hot向量来表征。在训练词向量之前,我们都有一个包含我们需要的所有词的词表。首先,我们对每个词进行编...
2020-06-11 23:05:31
977
原创 词嵌入(Word Embedding)
1. 什么是词嵌入(Word Embedding)⾃然语⾔是⼀套⽤来表达含义的复杂系统。在这套系统中,词是表义的基本单元。顾名思义,词向量是⽤来表⽰词的向量,也可被认为是词的特征向量或表征。把词映射为实数域向量的技术也叫词嵌⼊(word embedding)。近年来,词嵌⼊已逐渐成为⾃然语⾔处理的基础知识。在NLP(自然语言处理)领域,文本表示是第一步,也是很重要的一步,通...
2020-06-11 11:18:33
1658
原创 无监督学习(学习记录)
预处理与缩放归一化常用四种预处理:StandardScaler:去均值和方差归一化。且是针对每一个特征维度来做的,而不是针对样本。 $$ x = \frac{x-μ}{σ} $$RobustScaler: 针对数据含有较多的异常值使用,去中位数和四分位距的归一化。$$ x = \frac{x-meian}{IQR} $$MinMaxScaler:将特征缩放到给定的最小值和最...
2020-06-05 11:32:47
297
原创 Does Dimensionality curse effect some models more than others?
In general, the curse of dimensionality makes the problem of searching through a space much more difficult, and effects the majority of algorithms that "learn" through partitioning their v...
2020-05-27 01:54:48
183
1
原创 模型评估与改进(学习记录)
引入数据集创建函数:sklearn.datasets.make_blobs()x,y = sklearn.datasets.make_blobs(n_samples=100, n_features=2, centers=3, cluster_std=1.0, center_box=(-10.0, 10.0), shuffle=True, random_state=None)...
2020-05-12 16:10:31
896
原创 欧氏距离与余弦距离
对于两个向量A和B,其余弦相似度定义为 $cos(A,B)= A \cdot B/(||A||||B||)$ 即两个向量夹角的余弦,关注的是向量之间的角度关系,并不关心它们的绝对大小,其取值范围是[-1,1]。当一对文本相似度的长度差距很大、但内容相近时,如果使用词频或词向量作为特征,它们在特征空间中的的欧氏距离通常很大;而如果使用余弦相似度的话,它们之间的夹角可能很小,因...
2020-04-29 08:04:46
776
原创 LCA
题源链接:https://www.luogu.com.cn/problem/P3379倍增LCA pypy3最高七十分def dfs(now, old): global mmap, depth, fa depth[now] = depth[old] + 1 fa[now][0] = old for i in range(1, 31): ...
2020-04-27 15:04:50
107
原创 问卷自动填写脚本
简介懒人专用刷问卷脚本! 害怕验证码!本文基于Selenium+chromedriver实现问卷自动填写。目前只支持单选和多选题型,暂不支持填空题。原理通过检查问卷星的网页代码,我们会发现一个规律:每道题的选项答案会有一个共同特征: a[rel='q题目号_选项号']因此我们可通过代码定位第一题的A选项:find_element_by_css_selector("a[rel...
2020-04-26 22:59:54
7151
1
原创 Selenium+chromedriver环境配置
简介selenium 是一个用于Web应用程序测试的工具。Selenium测试直接运行在浏览器中,就像真正的用户在操作一样。支持的浏览器包括IE(7, 8, 9, 10, 11),Mozilla Firefox,Safari,Google Chrome,Opera等。这个工具的主要功能包括:测试与浏览器的兼容性——测试你的应用程序看是否能够很好得工作在不同浏览器和操作系统之...
2020-04-26 20:50:06
3473
1
原创 线性筛素数(欧拉筛)
题源:https://www.luogu.com.cn/problem/P3383def solve(): n, q = map(int, input().split()) isprime = [True for i in range(n + 1)] prime = [] for i in range(2, n + 1): i...
2020-04-26 14:05:30
147
原创 背包DP
0-1背包问题分析:0-1背包问题,即每个物体只有2种状态(取与不取),正如二进制中的0和1,且一个物品只能取一次。一般例题中,已知条件有第$i$个物品的重量 $w_i$ ,价值$v_i$,以及背包的总容量$W$,在最大容量内取最高价值的物品。解决dp类型的问题,我们需要先写出其状态转移方程。设状态$f_{i,j}$为只能放前$i$个物品时,容量为$j$的背包所能达到的最大...
2020-04-25 05:57:52
166
原创 KMP算法
算法简介KMP算法即字符串匹配算法,主要解决在一个主串S中找到子串T的起始位置。该算法是三位大牛:D.E.Knuth、J.H.Morris和V.R.Pratt同时发现的,以其名字首字母命名。算法引入在学习KMP算法前,我们应该先了解前缀函数。简单来说,前缀函数是一个长度为n+1的列表next[i],存储的是子串(1~i)的最长真前缀长度。最长真前缀:该前缀既是字符串的前缀,...
2020-04-24 07:43:46
258
原创 HITS(科普向)
文章整理自:https://blog.csdn.net/hguisu/article/details/8013489简介HITS(HITS(Hyperlink - Induced Topic Search) ) 算法是由康奈尔大学(Cornell University)的Jon Kleinberg博士于1997年首先提出的,为IBM公司阿尔马登研究中心(IBM Almade...
2020-04-22 09:45:47
1670
原创 Google PageRank(科普向)
以下内容均整理自百度百科相关词条(2020.4.22)简介PageRank,网页排名,又称网页级别、Google左侧排名或佩奇排名,是一种由根据网页之间相互的超链接计算的技术,而作为网页排名的要素之一,以Google公司创办人拉里·佩奇(Larry Page)之姓来命名。Google用它来体现网页的相关性和重要性,在搜索引擎优化操作中是经常被用来评估网页优化的成效因素之一。...
2020-04-22 06:53:23
647
原创 最短路问题
SPFA一种基于松弛的最短路算法 (支持负权!! 可算闭环!!)算法思路:OVO 小洪觉得遍历方法有点像广搜!先遍历一个点的相邻区域,然后通过松弛方法判断是否更新起点到该点的最短路值(不要着急,松弛方法我们后面讲!)更新了我们还要判断该点是否在队列里,若不在,才将该点加入队列。当队列为空时,即没有可松弛的点,我们结束遍历。算法小步骤首先我们要用到队列from queue...
2020-04-21 05:22:31
176
原创 蓝桥杯4月校内模拟赛(Python组)
第七题 螺旋矩阵(模拟题)问题描述对于一个nn 行 mm 列的表格,我们可以使用螺旋的方式给表格依次填上正整数,我们称填好的表格为一个螺旋矩阵。 例如,一个 44 行 55 列的螺旋矩阵如下: 1 2 3 4 5 14 15 16 17 6 13 20 19 18 7 12 11 10 9 8输入格式输入的第一行包含两个整数 n, mn,m,分别表示螺...
2020-04-20 11:12:26
902
原创 [luogu] P1048 采药
题源:https://www.luogu.org/problem/P1048#include <bits/stdc++.h>#define numm ch - 48#define pd putchar(' ')#define pn putchar('\n')#define pb push_back#define fi first#define se...
2019-11-15 21:23:12
163
原创 P1880 [NOI1995]石子合并
题源:https://www.luogu.org/problem/P1880#include <bits/stdc++.h>#define numm ch - 48#define pd putchar(' ')#define pn putchar('\n')#define pb push_back#define fi first#define se...
2019-11-15 13:11:31
85
原创 [luogu] P1855 榨取kkksc03
二维0-1背包,跟0-1背包没啥区别,数组多开一维就行#include <bits/stdc++.h>#define numm ch - 48#define pd putchar(' ')#define pn putchar('\n')#define pb push_back#define fi first#define se second#de...
2019-11-15 10:19:00
133
原创 [SCOI2009] windy数
经典数位dpconst int maxn = 2e9 + 5;ll l, r;int dim[15];ll f[15][15];int dfs(int x, int st, int op) { if (!x) return 1; if (!op && ~f[x][st]) return f[x][st]; int max...
2019-11-15 00:39:28
76
原创 [USACO06NOV] 玉米田Corn Fields
题源:https://www.luogu.org/problemnew/solution/P1879偏模板的状压dp题。#include <bits/stdc++.h>#define numm ch - 48#define pd putchar(' ')#define pn putchar('\n')#define pb push_back#defi...
2019-11-14 16:43:03
185
原创 [USACO07DEC]手链Charm Bracelet
题源:https://www.luogu.org/problem/P28710-1背包模板题int n, m;int c[3500], w[3500];int dp[20000] = {0};int main() { read(n), read(m); for (int i = 1; i <= n; i++) { read(c...
2019-11-14 04:49:11
188
原创 矩阵加速
题面<center>矩阵加速<center><center>时间限制1.00s 内存限制125.00MB<center>题目描述a[1]=a[2]=a[3]=1a[x]=a[x-3]+a[x-1] (x>3)求a数列的第n项对1000000007(10^9+7)取余的值。输入格式第一行一个整数T,表示询问个数。以下T行...
2019-11-13 19:24:42
100
原创 [模板] KMP
题源:https://www.luogu.org/problem/P3375#include <bits/stdc++.h>#define numm ch - 48#define pd putchar(' ')#define pn putchar('\n')#define pb push_back#define fi first#define se...
2019-11-12 23:55:07
71
原创 It's a Mod, Mod, Mod, Mod World
upc组队训练赛D题题面<center>问题 D: It’s a Mod, Mod, Mod, Mod World<center><center>时间限制: 2 Sec 内存限制: 128 MB<center>题目描述You are given multiple problems with three integers p,...
2019-11-11 14:32:25
170
原创 [模板] manachar
题源:https://www.luogu.org/problem/P3805manacher算法,就是在字符之间插入特殊字符避免奇偶分类讨论然后利用之前的已有的回文信息计算回文半径。#include <bits/stdc++.h>#define numm ch - 48#define pd putchar(' ')#define pn putchar('...
2019-11-11 14:12:09
112
原创 最短路算法之SPFA算法
南昌网络赛H题签到题题面As the current heir of a wizarding family with a long history,unfortunately, you find yourself forced to participate in the cruel Holy Grail War which has a reincarnation of si...
2019-11-11 04:28:46
101
原创 [模板] Alpha-Beta 剪枝
题源:https://nanti.jisuanke.com/t/A1538#include <bits/stdc++.h>#define numm ch - 48#define pd putchar(' ')#define pn putchar('\n')#define pb push_back#define fi first#define se ...
2019-11-11 01:47:59
199
原创 [模板] 扫描线(面积并)
题源:https://www.luogu.org/problem/P5490#include <bits/stdc++.h>#define numm ch - 48#define pd putchar(' ')#define pn putchar('\n')#define pb push_back#define fi first#define se...
2019-11-10 21:55:42
147
原创 [模板] zkw线段树
题源:https://www.luogu.org/problem/P3372非递归线段树 不能处理混合优先级code#include <bits/stdc++.h>#define numm ch - 48#define pd putchar(' ')#define pn putchar('\n')#define pb push_back#define...
2019-11-09 14:46:18
95
原创 [模板] 线段树
题源:https://www.luogu.org/problem/P3373code#include <bits/stdc++.h>#define numm ch - 48#define pd putchar(' ')#define pn putchar('\n')#define pb push_back#define fi first#defin...
2019-11-09 04:49:16
88
1
原创 [模板] 最长公共子序列
题源:https://www.luogu.org/problem/P1439tips问题能转化成二分求最长上升子序列lower_bound() 返回第一个大于等于查询值的位置lower_bound() 返回第一个小于查询值的位置binary_search() 返回判断查询值在不在的 bool 值code#include <bits/stdc++.h>#def...
2019-11-07 13:52:54
101
原创 [模板] 快速幂
题源:https://www.luogu.org/problem/P1226tips每进行一步运算时都要把得到的答案对c取模。a b c ans 都要定义成 long long 型变量。不要认为运算过程中对答案取模就够了,再输出答案的时候不要忘记把最终的答案再对c取一次模。code#include <bits/stdc++.h>#define numm ch...
2019-11-06 22:07:15
88
原创 [模板]堆(优先队列)
题源:https://www.luogu.org/problem/P3378定义priority_queue<int> q;//这是一个大根堆qpriority_queue<int,vector<int>,greater<int> >q;//这是一个小根堆q操作q.top()//取得堆顶元素,并不会弹出q.pop()//弹...
2019-11-06 19:38:15
192
原创 [模板] 裴蜀定理
题源:https://www.luogu.org/problem/P4549code#include <bits/stdc++.h>#define numm ch - 48#define pd putchar(' ')#define pn putchar('\n')#define pb push_back#define fi first#defin...
2019-11-06 18:23:06
82
原创 [模板] 并查集
题源:https://www.luogu.org/problem/P3367tips1.查找时顺手路径压缩。while(x!=fa[x]) x=fa[x]=fa[fa[x]];2.合并操作先将二者追溯到最新的祖先,然后再更新。fa[find(x)]=find(y);//其中find(x)为x的祖先code#include <bits/stdc++.h>#de...
2019-11-06 06:26:39
76
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人