自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Yolen_Chan的博客

一个python小白的学习笔记

  • 博客(2)
  • 收藏
  • 关注

原创 【python】gensim corpora的简单使用

本文将展示gensim的一些用法。python环境:Anaconda3(Python3.7) 使用gensim做自然语言处理的一般思路是:使用(处理)字典 ----> 生成(处理)语料库 ----> 自然语言处理(tf-idf的计算等) 利用列表生成字典(dict): #导入模块 from gensim import corpora from pprint import ppr...

2018-12-11 12:33:48 11414 4

原创 Python的bytes和str理解,以及解码编码问题。

  尝试将ascii文件转换成utf-8的编码格式.Python3有两种表示字符序列的类型:bytes和str。个人理解是,bytes是计算机能够识别的数据类型,然后str是Unicode字符,即是人比较容易理解的字符类型。 以下代码包含在debug.py文件中: def main(): pass if __name__ == '__main__': main() ...

2018-11-08 13:53:17 2675

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除