Jcseg 2.3.0 发布,Java 轻量级开源自然语言处理包

栏目: 软件资讯 · 发布时间: 6年前

内容简介:Jcseg是基于mmseg算法的一个轻量级中文分词器,同时集成了关键字提取,关键短语提取,关键句子提取和文章自动摘要等功能,并且提供了一个基于Jetty的web服务器,方便各大语言直接http调用,同时提供了最新版本的l...

Jcseg是基于mmseg算法的一个轻量级中文分词器,同时集成了关键字提取,关键短语提取,关键句子提取和文章自动摘要等功能,并且提供了一个基于Jetty的web服务器,方便各大语言直接http调用,同时提供了最新版本的lucene,solr和elasticsearch的分词接口!

jcseg 2.3.0更新如下:

1,NLP切分部分时间实体没有使用空格隔开的bug,例如:“2017年大年初三”,应该结果:“2017年 大年初三”。
2,检索模式重复输出的bug。report at https://gitee.com/lionsoul/jcseg/issues/IEZLN
3,自动摘要自定义输出的长度失效bug。
4,修复英文同义词追加token.offset尚未继承的bug
5,修复NLP模式对类“五月天”等datetime词条的拆分优先级,以词库中的词条优先级最高
6,修复增加对lucene单字段多值索引的offset支持,例如elasticsearch的Array字段
7,jcseg-server会打包为一个完整项目,增加jvm.options对jvm配置调整支持:

01, config: 配置目录,jcseg-server.properties管理服务器和词库的配置,jvm.options管理jvm的参数,例如内存分配等,默认1.5G
02, lib: 全部依赖的jar包目录
03, lexicon: jcseg词库目录,在此更改管理词库即可
04, jcseg-server: 启动管理脚本, 仅限linux 增加-d参数可以后台启动

jcseg-server使用:

# 将jcseg-server/target/jcseg-server整个目录拷贝到安装目录,设为$JS_DIR

cd $JS_DIR

# 初次运行给jcseg-server增加+x权限
# 同步运行
./jcseg-server

# 后台运行
./jcseg-server -d

备注:本次更新大部分修改都是针对“原语智能”AI平台的版本,已经经过长期测试!

2.3.0版本下载地址:

码云:https://gitee.com/lionsoul/jcseg/tree/v2.3.0-release

github:https://github.com/lionsoul2014/jcseg/releases/tag/v2.3.0-release

maven仓库:已经同步


【声明】文章转载自:开源中国社区 [http://www.oschina.net]


以上就是本文的全部内容,希望本文的内容对大家的学习或者工作能带来一定的帮助,也希望大家多多支持 码农网

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

Agile Web Development with Rails 4

Agile Web Development with Rails 4

Sam Ruby、Dave Thomas、David Heinemeier Hansson / Pragmatic Bookshelf / 2013-10-11 / USD 43.95

Ruby on Rails helps you produce high-quality, beautiful-looking web applications quickly. You concentrate on creating the application, and Rails takes care of the details. Tens of thousands of deve......一起来看看 《Agile Web Development with Rails 4》 这本书的介绍吧!

在线进制转换器
在线进制转换器

各进制数互转换器

图片转BASE64编码
图片转BASE64编码

在线图片转Base64编码工具

RGB HSV 转换
RGB HSV 转换

RGB HSV 互转工具