如何解释 mecab unidic csv 列

问题描述

以下是来自 mecab unidic 的一些示例条目:

ネコ - 名词,普通名词,一般,ネコ,猫,和,体,1 7918141644612096,28806

が - 助词,格助词,ガ,が,格助,动词%F2@ 0,名词%F1,2168520431510016,7889

蚊子 - 名词,カ,蚊子,C4,1536851034907136,5591

o - 助词,ヲ,o,オ,形容词%F2@-1,11381878116459008,41407

如您所见,这些 un​​idic 条目中有 30 个 csv 列。它们都代表什么?

解决方法

您可以在 UniDic FAQ 处看到所有列的日语名称列表。看到名称后,大多数列都非常明显。

UniDic Manual 中有更多详细信息来解释所有字段,但对于其中一些字段 - 主要是 *ConType*ModType 字段 - 它们非常复杂。这些领域大多与复合词的读音有关。