汉语言处理包 HanLP 1.6.2 发布,支持简繁和索引模式

栏目: 软件资讯 · 发布时间: 6年前

内容简介:HanLP 是由一系列模型与算法组成的 Java 工具包,目标是普及自然语言处理在生产环境中的应用。HanLP 具备功能完善、性能高效、架构清晰、语料时新、可自定义的特点。 在提供丰富功能的同时,HanLP 内部模块坚持低...

HanLP 是由一系列模型与算法组成的 Java 工具包,目标是普及自然语言处理在生产环境中的应用。HanLP 具备功能完善、性能高效、架构清晰、语料时新、可自定义的特点。 在提供丰富功能的同时,HanLP 内部模块坚持低耦合、模型坚持惰性加载、服务坚持静态提供、词典坚持明文发布,使用非常方便,同时自带一些语料处理工具,帮助用户训练自己的模型。

HanLP v1.6.2 更新内容:

  1. 所有词法分析器都支持用户词典、简繁、offset 与全切分索引模式(需更新模型与 CharTable )

  2. CRF 分词升级到 CRF 词法分析器,支持训练,与 CRF++ 兼容

  3. 重构词法分析器,提供统一的接口:

    汉语言处理包 HanLP 1.6.2 发布,支持简繁和索引模式

  4. HanLP.newSegment 支持传入算法名称构造相应的分词器

  5. Sentence 支持翻译词性,方便记不住词性短码的初级用户

  6. Sentence 支持输出 brat standoff format:http://brat.nlplab.org/standoff.html

  7. 修复 DoubleArrayTrie 的 LongestSearcher

  8. 修订词库、修订 CharTable 、微调人名识别模型,解决:#772

  9. 新数据包 data-for-1.6.2.zip
    获取最新版的数据包,请 forkgit clone 一份仓库中的最新 data 。

  10. Portable 版同步升级到 v1.6.2

        <dependency>
            <groupId>com.hankcs</groupId>
            <artifactId>hanlp</artifactId>
            <version>portable-1.6.2</version>
        </dependency>

【声明】文章转载自:开源中国社区 [http://www.oschina.net]


以上就是本文的全部内容,希望本文的内容对大家的学习或者工作能带来一定的帮助,也希望大家多多支持 码农网

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

The Filter Bubble

The Filter Bubble

Eli Pariser / Penguin Press / 2011-5-12 / GBP 16.45

In December 2009, Google began customizing its search results for each user. Instead of giving you the most broadly popular result, Google now tries to predict what you are most likely to click on. Ac......一起来看看 《The Filter Bubble》 这本书的介绍吧!

SHA 加密
SHA 加密

SHA 加密工具

html转js在线工具
html转js在线工具

html转js在线工具

HEX HSV 转换工具
HEX HSV 转换工具

HEX HSV 互换工具