- 授权协议: Apache
- 开发语言: Java
- 操作系统: 跨平台
- 软件首页: https://github.com/huaban/elasticsearch-analysis-jieba
- 软件文档: https://github.com/huaban/elasticsearch-analysis-jieba
- 官方下载: https://github.com/huaban/elasticsearch-analysis-jieba
软件介绍
结巴分词插件(for elasticsearch),目前支持0.90.*以上版本
---------------------------------------------------- | Jieba Chinese Analysis Plugin | ElasticSearch | ---------------------------------------------------- | 0.0.1-SNAPSHOT (master) | 0.90.* | ----------------------------------------------------
支持两种分词模式(seg_mode):
- index 索引模式,搜索引擎建立索引阶段使用该模式
- search 搜索模式,搜索时采用该种模式分词
使用说明
创建mapping
#!/bin/bash curl -XDELETE '0:9200/test/';echo curl -XPUT '0:9200/test/' -d ' { "index" : { "number_of_shards": 1, "number_of_replicas": 0, "analysis" : { "analyzer" : { "jieba_search" : { "type" : "jieba", "seg_mode" : "search", "stop" : true }, "jieba_index" : { "type" : "jieba", "seg_mode" : "index", "stop" : true } } } } }';echo
test
# index mode curl '0:9200/test/_analyze?analyzer=jieba_index' -d '中华人民共和国';echo
结果:
{ "tokens": [ { "token": "中华", "start_offset": 0, "end_offset": 2, "type": "word", "position": 1 }, { "token": "华人", "start_offset": 1, "end_offset": 3, "type": "word", "position": 2 }, { "token": "人民", "start_offset": 2, "end_offset": 4, "type": "word", "position": 3 }, { "token": "共和", "start_offset": 4, "end_offset": 6, "type": "word", "position": 4 }, { "token": "共和国", "start_offset": 4, "end_offset": 7, "type": "word", "position": 5 }, { "token": "中华人民共和国", "start_offset": 0, "end_offset": 7, "type": "word", "position": 6 } ] }
# search mode curl '0:9200/test/_analyze?analyzer=jieba_search' -d '中华人民共和国';echo
结果:
{ "tokens": [ { "token": "中华人民共和国", "start_offset": 0, "end_offset": 7, "type": "word", "position": 1 } ] }
挑战程序设计竞赛
秋叶拓哉、岩田阳一、北川宜稔 / 巫泽俊、庄俊元、李津羽 / 人民邮电出版社 / 2013-7-1 / CNY 79.00
世界顶级程序设计高手的经验总结 【ACM-ICPC全球总冠军】巫泽俊主译 日本ACM-ICPC参赛者人手一册 本书对程序设计竞赛中的基础算法和经典问题进行了汇总,分为准备篇、初级篇、中级篇与高级篇4章。作者结合自己丰富的参赛经验,对严格筛选的110 多道各类试题进行了由浅入深、由易及难的细致讲解,并介绍了许多实用技巧。每章后附有习题,供读者练习,巩固所学。 本书适合程序设计......一起来看看 《挑战程序设计竞赛》 这本书的介绍吧!
