| Interface | Description |
|---|---|
| Dictionary.FileLoading |
| Class | Description |
|---|---|
| CharNode |
所有词都记录在第一个字的结点下.
|
| CharNode.KeyTree | |
| Chunk |
它是MMSeg分词算法中一个关键的概念。Chunk中包含依据上下文分出的一组词和相关的属性,包括长度(Length)、平均长度(Average Length)、标准差的平方(Variance)和自由语素度(Degree Of Morphemic Freedom)。
|
| ComplexSeg |
正向最大匹配, 加四个过虑规则的分词方式.
|
| Dictionary |
词典类.
|
| MaxWordSeg |
最多分词.
|
| MMSeg |
Reader 流的分词(有字母,数字等), 析出中文(其实是 CJK)成句子
Sentence 再对 mmseg 算法分词.非线程安全 |
| Seg |
分词抽象类.
|
| Sentence |
句子, 在一大串字符中断出连续中文的文本.
|
| SimpleSeg |
正向最大匹配的分词方式.
|
| Word |
类似 lucene 的 token
|
Copyright © 2015-2016 Ganshane Developer Team. All Rights Reserved.