HanLP从中文分词开始,覆盖词性标注、命名实体识别、句法分析、文本分类等常用任务,提供了丰富的API。对于中文文本的分词处理是一个十分有益的工具。
由于pyhanlp源码是用java写的,为python提供了API,所以直接调用十分方便,但是在安装时则需要额外提供java环境。
下面则进入pyhanlp安装全步骤:
首先安装java环境:
官网下载java 1.8地址(需要注册一个oracle账户):
https://www.oracle.com/java/technologies/downloads/#java8
华为镜像下载 (推荐)
https://repo.huaweicloud.com/java/jdk/
点击8u202-b08,然后根据自己的电脑下载对应版本即可。然后打开文件安装记住安装路径。最后打开电脑的环境配置。
1、新建用户变量:
变量值为安装jdk的路径
2、点击path,添加:
%JAVA_HOME%\bin;%JAVA_HOME%\jre\bin;
3、点击classpath(如果没有则新建),添加:
.;%JAVA_HOME%\lib;%JAVA_HOME%\lib\tools.jar
安装pyhanlp
打开a