问题描述
以下是来自 mecab unidic 的一些示例条目:
ネコ - 名词,普通名词,一般,ネコ,猫,和,体,1 7918141644612096,28806
が - 助词,格助词,ガ,が,格助,动词%F2@ 0,名词%F1,2168520431510016,7889
蚊子 - 名词,カ,蚊子,C4,1536851034907136,5591
o - 助词,ヲ,o,オ,形容词%F2@-1,11381878116459008,41407
如您所见,这些 unidic 条目中有 30 个 csv 列。它们都代表什么?
解决方法
您可以在 UniDic FAQ 处看到所有列的日语名称列表。看到名称后,大多数列都非常明显。
UniDic Manual 中有更多详细信息来解释所有字段,但对于其中一些字段 - 主要是 *ConType
和 *ModType
字段 - 它们非常复杂。这些领域大多与复合词的读音有关。