自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(362)
  • 收藏
  • 关注

转载 Contest 157

2019-10-0612:15:28 总体感受:总体难度一般,dfs和dp题花了点时间,最后一题dp有思路,但是实现上不够好。 注意点:首先是hard问题的覆盖度依然是很大的问题,其次是要注意审题。dp题需要着重训练。 转载于:https://www.cnblogs.com/hyserendipity/p/11626977.html...

2019-10-06 12:18:00 329

转载 图的割边 Critical Connections in a Network

2019-10-05 23:40:13 问题描述: 问题求解: 本题首次出现在Contest 154,是一条模版题,是一条经典的求割边的问题,该问题有Tarjan算法,可以在O(n + e)的时间复杂度求解。 Tarjan算法的核心思路是维护两个数组discovery[],low[]。disc[]数组里存放访问节点的时间戳,low[]数组里存放与节点邻接的(不包含父节点)最...

2019-10-05 23:43:00 445

转载 条件随机场 CRF

2019-09-2915:38:26 问题描述:请解释一下NER任务中CRF层的作用。 问题求解: 在做NER任务的时候,神经网络学习到了文本间的信息,而CRF学习到了Tag间的信息。 加入CRF与否网络的差别 首先对于不加CRF层的NER网络,往往每个输出的Tag是贪心的进行选取到的,如下图所示: 这种方案的结果没有考虑到Tag之间的关系,往往会造成最后的结果...

2019-09-29 15:57:00 389

转载 Contest 156

2019-09-2914:56:09 总体感受:30min解决了前三题,最后一题其实也很简单,但是题目没有看清。赛后5min解决了。总体来说,本次周赛是比较简单的一次。 注意点:首先是hard问题的覆盖度依然是很大的问题,其次是要注意审题。 转载于:https://www.cnblogs.com/hyserendipity/p/11607909.html...

2019-09-29 14:58:00 215

转载 Contest 155

2019-09-2722:39:24 总体感受:这次比赛心态不够好,最后导致没有很好的完成比赛。 注意点: 1)保持心态稳定,是情商的体现; 2)hard题的覆盖还是明显不够; 1201.Ugly Number III 问题描述: 问题求解: 本体中的数据规模已经决定了使用O(n)的解法是肯定会超时的。那么自然而然就是使用二分查找了。 这里有个地方需...

2019-09-27 22:40:00 184

转载 Range Module

2019-09-2118:54:16 715.Range Module 问题描述: 问题求解: 用线段树解决了。 class RangeModule { Node root; class Node { int l; int r; int m; Node...

2019-09-21 18:56:00 137

转载 Python 环境搭建

2019-09-1914:41:48 基于Conda // 创建python=3.6版本的环境,取名叫python3 conda create -n python3 python=3.6 // 激活环境 source activate python3 基于virtualenv 首先需要安装virtualenv pip insta...

2019-09-19 14:42:00 107

转载 Git 使用

2019-09-1417:06:27 .gitignore 文件 .gitignore 文件可以手动忽略一些不想被 git track 的文件。 # Python *.py[cod] *.so *.egg *.egg-info dist build # Pycharm IDE .idea/* .gitconfig 文件 可以设置...

2019-09-17 21:03:00 133

转载 Contest 154

2019-09-1617:22:28 总体感受:这次比赛的模版题也太多了吧,两条模版题没有想出来。总的来说,还是自己的刷题量还是严重的不够。 注意点: 1)提升刷题量和覆盖率非常重要; 2)在碰到大数处理的时候,还是会出现一些问题,有两个路径吧,一个是使用long来测试一下;二是使用bigInteger。 1191.K-Concatenation Maximum Sum...

2019-09-16 17:23:00 132

转载 生命是一种长期而持续的累积过程

生命是一种长期而持续的累积过程 台湾清华大学电机系彭明辉 许多同学应该都还记得联考前夕的焦虑:差一分可能要掉好几个志愿,甚至于一生的命运从此改观!到了大四,这种焦虑可能更强烈而复杂:到底要先当兵,就业,还是先考研究所?我就经常碰到充满焦虑的学生问我这些问题。可是,这些焦虑实在是莫须有的!生命是一种长期而持续的累积过程,绝不会因为单一的事件而毁了一个人的一生,也不会因为单...

2019-09-14 23:41:00 199

转载 Contest 153

2019-09-1423:16:25 总体感受:节奏尚可,难度尚可。然而还是卡在了最后一题,完全没有想到使用dp。 注意点: 1)Contest的最后一题往往是DP,Graph,这个敏感度需要提高; 2)DP的题目还是远远不够熟练。 801.Minimum Swaps To Make Sequences Increasing 问题描述: 问题求解: kee...

2019-09-14 23:17:00 162

转载 Attention 机制

2019-09-1019:46:07 问题描述:Seq2Seq模型引入注意力机制是为了解决什么问题?为什么选择使用双向循环神经网络模型? 问题求解: 在实际任务中使用Seq2Seq模型,通常会先使用一个循环神经网络作为编码器,将输入序列编码成一个向量表示;然后再使用一个循环神经网络模型作为解码器,从编码器得到的向量表示里解码得到输出序列。 这里计算当前隐状态的时候只考虑了上一个...

2019-09-10 22:39:00 191

转载 精确率和召回率的权衡

2019-09-1022:17:21 问题描述:精确率和召回率的权衡。 问题求解: 要回答这个问题首先要明确这两个概念,精确率是分类正确的正样本 / 判定为正样本的总数;召回率是分类正确的正样本 / 真正正样本的总数。 Presion 和 Recall 是既矛盾又统一的两个指标,为了提高Presion,分类器需要保守一点,尽量在更有把握的时候才把样本归类到正样本,但此时往往会因...

2019-09-10 22:24:00 461

转载 介绍 Seq2Seq 模型

2019-09-1019:29:26 问题描述:什么是Seq2Seq模型?Seq2Seq模型在解码时有哪些常用办法? 问题求解: Seq2Seq模型是将一个序列信号,通过编码解码生成一个新的序列信号,通常用于机器翻译、语音识别、自动对话等任务。在Seq2Seq模型提出之前,深度学习网络在图像分类等问题上取得了非常好的效果。在深度学习擅长的问题中,输入和输出通常都可以表示成固定长度...

2019-09-10 19:46:00 309

转载 fastText 训练和使用

2019-09-0916:33:11 问题描述:fastText是如何进行文本分类的。 问题求解: fastText是一种Facebook AI Research在16年开源的一个文本分类器。 其特点就是fast。相对于其它文本分类模型,如SVM,Logistic Regression和neural network等模型,fastText在保持分类效果的同时,大大缩短了训练时间。...

2019-09-09 16:33:00 572

转载 word2vec 和 glove 模型的区别

2019-09-0915:36:13 问题描述:word2vec 和 glove 这两个生成 word embedding 的算法有什么区别。 问题求解: GloVe (global vectors for word representation) 与word2vec,两个模型都可以根据词汇的 "共现 co-occurrence" 信息,将词汇编码成一个向量(所谓共现,即语料中词...

2019-09-09 16:16:00 739

转载 关于 word2vec 如何工作的问题

2019-09-0722:36:21 问题描述:word2vec是如何工作的? 问题求解: 谷歌在2013年提出的word2vec是目前最常用的词嵌入模型之一。word2vec实际是一种浅层的神经网络模型,它有两种网络结构,分别是cbow和skip gram。 cbow的目标是根据上下文来预测中心词的出现概率,skip-gram则是通过中心词来预测上下文中的单词的出现概率。 ...

2019-09-07 22:38:00 122

转载 关于LSTM实现长短期记忆功能问题

2019-09-0722:01:45 问题描述:LSTM是如何实现长短期记忆功能的? 问题求解: 与传统的循环神经网络相比,LSTM仍然是基于当前输入和之前的隐状态来计算当前的隐状态,只不过对内部的结构进行了精心的设计,加入了更新门,遗忘门和输出门这三个门和一个内部记忆单元。 在一个训练好的网络中,当输入的序列中没有重要的信息时,LSTM的遗忘门的数值接近于1,更新门的数据接近...

2019-09-07 22:02:00 1726

转载 动态规划/MinMax-Stone Game

2019-09-0716:34:48 877.Stone Game 问题描述: 问题求解: 典型的博弈问题,也是一个典型的min-max问题。通常使用算diff的方法把min-max转为求max。 dp[i][j] : i ~ j 玩家 A 和 玩家 B 得分的diff。 public boolean stoneGame(int[] pile...

2019-09-07 16:36:00 363

转载 位运算的技巧

2019-09-0310:29:36 x & (x - 1) x & (x-1)相当于消除了 x 从右向左数遇到的第一个 1。 应用一、用 O(1) 时间检测整数 n 是否是 2 的幂次。 若 n 是 2 的幂次,则 n & (n - 1) == 0。 应用二、计算整数二进制中包含 1 的个数。 public int countO...

2019-09-03 10:31:00 148

转载 Contest 152

2019-09-0120:59:55 总体感受:最近几次参加contest发现自己的水平还是严重的不够,尤其是在处理一些异常情况的时候,遇到TLE,MLE如何有效的进行Debug是需要去锻炼的。 注意点: 1)TLE,首先可以通过加上特殊判断进行解决,这个需要在实际的问题中考虑好特殊的情况,过滤掉明显不符合的解;其次可以考虑是否可以使用位运算来进行状态压缩,同时降低时间复杂度。 ...

2019-09-01 23:50:00 81

转载 RNN,GRU,LSTM

2019-08-2917:17:15 问题描述:比较RNN,GRU,LSTM。 问题求解: 循环神经网络 RNN 传统的RNN是维护了一个隐变量 ht用来保存序列信息,ht基于 xt和 ht-1来计算ht。 ht= g( Wixt+ Uiht-1+ bi) yt= g( Woht+ bo) 门控循环神经网络 GRU ...

2019-08-29 17:17:00 181

转载 循环神经网络梯度消失/梯度爆炸问题

2019-08-2715:42:00 问题描述:循环神经网路为什么会出现梯度消失或者梯度爆炸的问题,有哪些改进方案。 问题求解: 循环神经网络模型的求解可以采用BPTT(Back Propagation Through Time,基于时间的反向传播)算法实现,BPTT实际上是反向传播算法的简单变种。如果将循环神经网络按照时间展开成T层的前馈神经网络来理解,就和普通的反向传播算法没...

2019-08-27 16:07:00 2095

转载 过拟合和欠拟合问题

2019-08-2711:45:21 问题描述:在模型评估过程中,过拟合和欠拟合具体是指什么现象,如何解决。 问题求解: 过拟合是指模型对于训练的数据集拟合呈现过当的情况,反应到评估指标上就是模型在训练集上的表现很好,但是在测试集和新数据上的表现较差。 欠拟合是指模型对于训练和预测时的表现都不好。 降低过拟合 1)从数据入手,获得更多的训练数据是解决过拟合问题最有效...

2019-08-27 12:15:00 242

转载 不均衡样本集问题

2019-08-2711:01:52 问题描述:对于二分类问题,如果在训练的时候正负样本集合非常的不均衡,比如出现了1 :1000甚至更大的比例悬殊,那么如何处理数据以更好的训练模型。 问题求解: 为什么很多的分类模型在训练数据的时候会出现数据不均衡的问题呢?本质原因是模型在训练时优化的目标函数和人们在测试的时候的评价标准不一致。这种不对齐可能是由于训练数据的样本分布与测试时的样...

2019-08-27 11:37:00 259

转载 NLP interview

2019-08-2617:19:58 1)聊实习项目 2)代码题,二维数组中的查找某个target 3)讲一些最能体现创新能力的工作,而不是一些工程上的实现 4)讲论文可以从哪些方面做创新点,文本生成的结果怎么排序 5)部门是做任务型聊天机器人的 第一个开始面试的公司,一开始没找内推,被互娱的组捞了。 3.8 一面,聊项目,然后计算机基础(dns),最后一道算...

2019-08-27 10:42:00 67

转载 Linux 指令

awk awk取自三位创始人Alfred Aho,Peter Weinberger, 和Brian Kernighan的姓名首字符,是一种处理文本文件的语言。 cat file.txt 1,5,6 2,5,6 3,7,8 awk -F ',' '$1==2 && $2==5 {print $NF}' file.txt 6 -...

2019-08-26 21:47:00 66

转载 Python 趣题

如何优雅判断list为空 list_temp = [] if list_temp: # 存在值即为真 else: # list_temp是空的 在Python中,False,0,'',[],{},()都可以视为假。 迭代器和生成器 迭代器:可以被next()函数调用并不断返回下一个值的对象称为迭代器:Iterator。 生成...

2019-08-26 21:44:00 86

转载 Grid Illumination

2019-07-0716:53:31 问题描述: 问题求解: 本题和n后问题很类似,所以最初的时候就直接套了n后的板子,MLE。 public int[] gridIllumination(int N, int[][] lamps, int[][] queries) { int[] rows = new int[N]; int[...

2019-07-07 17:09:00 172

转载 动态规划-Minimum Cost to Merge Stones

2019-07-0715:48:46 问题描述: 问题求解: 最初看到这个问题的时候第一反应就是这个题目和打破气球的题目很类似。 但是我尝试了使用dp将问题直接转为直接合并到一个堆问题复杂度迅速提高并且并没有ac,这里的思想是和打爆气球一致的,就是找最后合并的部分。 Discuss里给出了可以过的代码,思路其实和打破气球是不一致的。 这里的想法是先把i-j的数组分成...

2019-07-07 16:04:00 201

转载 Contest 141

2019-06-1614:35:52 1089.Duplicate Zeros - Easy 问题描述: 问题求解: 很显然的可以使用O(n), O(n)的解法。主要问题在于如何在O(1)空间复杂度完成求解。 答案就是通过两次遍历,第一次求出复制后的数组的长度,第二次遍历填写数组。 public void duplicateZeros(int[] ...

2019-06-16 16:45:00 190

转载 Python join()方法

2019-06-0217:12:16 描述 Python join() 方法用于将序列中的元素以指定的字符连接生成一个新的字符串。 语法 join()方法语法: str.join(sequence) 参数 sequence -- 要连接的元素序列。 返回值 返回通过指定字符连接序列中元素后生成的新字符串。 实例 以下实例展示了join()的使用...

2019-06-02 17:14:00 87

转载 Single Number

2019-06-0215:09:36 Single Number 问题其实我很早就遇到了,当时还是第一次刷leetcode,那个时候完全没有想到怎么在<O(n), O(1)>完成这个解答,看了答案之后才恍然大悟,原来可以使用异或来解决。这个问题还有很多的变种问题,比如1-n的数字缺少了一个,找到缺失的那一个(补齐1 - n, 就变成了Single Number),等等。 ...

2019-06-02 16:34:00 227

转载 真值表推出表达式

2019-06-0216:31:01 从真值表到表达式的化简,想起来似乎不好弄,其实很简单,三步就好: 1:找所有真值为1的情况。 2:用“与”组织输出为1的组合 3:将所有组合用“或”结合 举例: 表达式为: 转载于:https://www.cnblogs.com/hyserendipity/p/10963333.html...

2019-06-02 16:33:00 1245

转载 加油站问题 Gas Station

2019-06-0117:09:30 问题描述: 问题求解: 其实本题本质上是一个数学题。 【定理】 对于一个循环数组,如果这个数组整体和 SUM >= 0,那么必然可以在数组中找到这么一个元素:从这个数组元素出发,绕数组一圈,能保证累加和一直是出于非负状态。 【证明】 从第一个数字开始进行累加和,中间必然会有一个累加和最低的点,我们设为x。最后的s...

2019-06-01 17:29:00 164

转载 Inception V1-V4

2019-05-2920:56:02 一、Inception V1 当不知道在卷积神经网络中该使用1 * 1卷积还是3 * 3的卷积还是5 * 5的卷积或者是否需要进行pooling操作的时候,我们就可以通过inception模块来将所有的操作都做一遍,然后将得到的结果直接concat到一起,由神经网络来决定是使用哪种方式处理。 另外,Inception V1中还有一个trick...

2019-05-29 21:19:00 140

转载 NDCG的理解

2019-05-2914:15:44 转载于:https://www.cnblogs.com/hyserendipity/p/10943600.html

2019-05-29 14:16:00 308

转载 进程与线程

2019-05-0822:00:55 一、定义 进程:是操作系统资源分配的基本单位。 线程:是进程的一个执行单元,线程也被称为轻量级进程。 一个程序至少一个进程,一个进程至少一个线程。 二、区别 地址空间:同一进程的线程共享本进程的地址空间,而进程之间则是独立的地址空间。 一个进程崩溃后,在保护模式下不会对其他进程产生影响,但是一个线程崩溃整个进程都死掉。所以多...

2019-05-08 22:13:00 70

转载 Java中的接口和抽象类

2019-05-0821:30:02 对于面向对象编程来说,抽象是它的一大特征之一。在Java中,可以通过两种形式来体现OOP的抽象:接口和抽象类。这两者有太多相似的地方,又有太多不同的地方。很多人在初学的时候会以为它们可以随意互换使用,但是实际则不然。今天我们就一起来学习一下Java中的接口和抽象类。 一、抽象类 在了解抽象类之前,先来了解一下抽象方法。抽象方法是一种特殊...

2019-05-08 21:41:00 67

转载 HashMap的工作原理

2019-05-0722:30:55 一、概述 从本文你可以学习到: 什么时候会使用HashMap?他有什么特点? 你知道HashMap的工作原理吗? 你知道get和put的原理吗?equals()和hashCode()的都有什么作用? 你知道hash的实现吗?为什么要这样实现? 如果HashMap的大小超过了负载因子(load factor)定义的容量,怎么办?...

2019-05-08 17:08:00 118

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除