使用php在html网页上计数单词

我需要一个 PHP脚本,它接收一个网页的URL,然后回应一个单词被提及多少次.

这是一个通用的HTML页面

<html>
<body>
<h1> This is the title </h1>
<p> some description text here,<b>this</b> is a word. </p>
</body>
</html>

这将是PHP脚本:

<?PHP
htmlurl="generichtml.com";
the script here
echo(result);
?>

所以输出将是这样的表:

WORDS       Mentions
This        2
is          2
the         1
title       1
some        1
description 1
text        1
a           1
word        1

这就像搜索机器人在上网时所做的那样,所以,有什么想法,如何开始,甚至更好,你有一个PHP脚本已经这样做了吗?

从您的字符串中删除所有HTML标记后,下面的一行将执行不区分大小写的字数.

Live Example

print_r(array_count_values(str_word_count(strip_tags(strtolower($str)),1)));

获取页面的源代码,可以使用cURLfile_get_contents()

$str = file_get_contents('http://www.example.com/');

从内到外:

>使用strtolower()使所有小写.
>使用strip_tags()剥离HTML标签
>创建使用str_word_count()使用的单词数组.参数1返回一个数组,其中包含字符串内的所有单词.
>使用array_count_values()通过计算单词数组中每个值的出现来捕获多次使用的单词.
>使用print_r()显示结果.

相关文章

统一支付是JSAPI/NATIVE/APP各种支付场景下生成支付订单,返...
统一支付是JSAPI/NATIVE/APP各种支付场景下生成支付订单,返...
前言 之前做了微信登录,所以总结一下微信授权登录并获取用户...
FastAdmin是我第一个接触的后台管理系统框架。FastAdmin是一...
之前公司需要一个内部的通讯软件,就叫我做一个。通讯软件嘛...
统一支付是JSAPI/NATIVE/APP各种支付场景下生成支付订单,返...