php – 尝试创建’趋势词/短语’引擎但需要过滤掉常用词

我想解析进入我系统的字符串,并在单独的表中保留每个单词的字数.问题是许多常见的单词,如’the’,’at’等将包含在内,不应该包含.我不想手工创建字典.任何人都知道我可以匹配的常用词的体面词典不包括在内?谢谢.

解决方法:

你特指的是“停用词”列表.

http://en.wikipedia.org/wiki/Stop_words

你可以在这里找到一个

http://truereader.com/manuals/onix/stopwords1.html

相关文章

统一支付是JSAPI/NATIVE/APP各种支付场景下生成支付订单,返...
统一支付是JSAPI/NATIVE/APP各种支付场景下生成支付订单,返...
前言 之前做了微信登录,所以总结一下微信授权登录并获取用户...
FastAdmin是我第一个接触的后台管理系统框架。FastAdmin是一...
之前公司需要一个内部的通讯软件,就叫我做一个。通讯软件嘛...
统一支付是JSAPI/NATIVE/APP各种支付场景下生成支付订单,返...