- 博客(2)
- 收藏
- 关注
原创 【python】gensim corpora的简单使用
本文将展示gensim的一些用法。python环境:Anaconda3(Python3.7) 使用gensim做自然语言处理的一般思路是:使用(处理)字典 ----> 生成(处理)语料库 ----> 自然语言处理(tf-idf的计算等) 利用列表生成字典(dict): #导入模块 from gensim import corpora from pprint import ppr...
2018-12-11 12:33:48
11414
4
原创 Python的bytes和str理解,以及解码编码问题。
尝试将ascii文件转换成utf-8的编码格式.Python3有两种表示字符序列的类型:bytes和str。个人理解是,bytes是计算机能够识别的数据类型,然后str是Unicode字符,即是人比较容易理解的字符类型。 以下代码包含在debug.py文件中: def main(): pass if __name__ == '__main__': main() ...
2018-11-08 13:53:17
2675
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人