PHP提取文档中与搜索词最重要的部分

问题描述

我修改了文字,使其更清晰。

以下摘录摘自一本500页的书。目的是提取文档中与搜索词最重要的部分并显示它。我曾想过用PHP中的STRIPOS查找文本中每个单词的位置,然后查找文本中包含搜索词位置最多的部分,例如,该部分将在文本的第1000至第1400个字符,然后我就可以提取文本了。

所以对于每个搜索到的单词,我都会得到一系列位置。

机构:3,8,5,67,80,90,92,165

français:4,15,26,78

加拿大人:12、56、79

渥太华:5,14,45,70,82,120,140,​​157,200,700

诀窍是找到这些系列之间的对应关系,以找到最重要的提取物。我不知道这是否是个好方法。

提取字符串总共约400个字符,如下所示:

leprésidentde l' Institut C.-F.,qui 信使邮报《 fait partie de ladélégation》 国际布宜诺斯艾利斯航空公司 解析amis de l'研究所。惊喜àl'研究所 canadien 。学院- Canadien Français réunissamedi

即使我在网络上进行了研究,我也不知道从哪里开始,却一无所获。至少我需要一个线索来开始编码。

谢谢, 安迪

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)