Prose Go Go 语言文本处理库

程序名称:Prose Go

Prose Go 介绍


Prose 是一款用于Go 语言的文本处理库(主要是英文),支持 okenization(分词)、part-of-speech
tagging(词性标注)、named-entity extraction(命名实体提取)等。

安装

$ go get github.com/jdkato/prose/...

使用

Tokenizing  

单词、句子和 regexp tokenizer 可用。 每个分词器实现相同的接口,这样可以轻松地在库的其他部分中自定义词语切分。

package main

import (
    fmt

    github.com/jdkato/prose/tokenize
)

func main() {
    text := They'll save and invest more.
    tokenizer := tokenize.NewTreebankWordTokenizer()
    for _, word := range tokenizer.Tokenize(text) {
        // [They 'll save and invest more .]
        fmt.Println(word)
    }
}

Prose Go 官网

https://github.com/jdkato/prose

相关编程语言

Pacman 是一个软件包管理器, 作为 ArchLinux 发行版...
Smb4K 是KDE下的网络共享浏览器 更多屏幕截图请看:...
Wine (“Wine Is Not an Emulator” 的首字母缩写)...
虚拟桌面软件,可管理最多9个虚拟桌面,你可以用热键...
UNetbootin (Universal Netboot Installer)为一种跨...
Cobbler 可以用来快速建立 Linux 网络安装环境,它已...