【LuceneFileSearch】demo实践
- 学习了lucene 索引建立,更新,删除,以及多种查询方法,查询结果的高亮显示,以及IK分词的具体设置
- tika包对ppt,pdf,xml等多种文档的自动识别于内容读取
- 简单的给小女花不弃.txt小说文本建立索引,并返回最高评词汇,解决了文档读取格式乱码问题,本来打算做个词云图的,但分词效果不尽理想,没深究了
【lucene】文档搜索类实践
- 掌握了maven工程本地jar包的导入
- lucene创建索引,使用何种方式进行分词,查询结果的高亮显示
【elastic search】项目学习实践:
- 简单的新闻搜索web项目
- 数据时从备份的sql文件导入的
- 使用了MySQL8.0进行连接
- elastic search6.6.0版本,相关的依赖包:
<dependency> <groupId>org.elasticsearch.client</groupId> <artifactId>transport</artifactId> <version>6.6.0</version> </dependency>
注意版本一致否则会报错。
-
建立索引,搜索方式等都有多种方法,以后遇到在具体深入掌握,现在只知道有那些方法,但具体使用可能存在问题
-
查询结果高亮显示,页式结果查询,类似JPA页式查询