如何从Wikipedia页面URL获取页面标题?

问题描述

我正在尝试创建一个系统,用户可以在该系统中输入其Wikipedia页面链接,应用程序将从Wikipedia页面URL获取页面标题。

就像,如果用户给出:https://id.wikipedia.org/wiki/Eminem,我想获得页面标题Eminem

或者如果用户输入:https://id.wikipedia.org/wiki/Eminem#1992%E2%80%931997:_Awal_karier,_Infinite_dan_masalah_keluarga,我想要页面标题,即Eminem

我尝试找到一种 regex 模式。我正在考虑是否可以创建/找到一个正则表达式模式,该模式将找到位于/wiki/之间并以/结尾的单词。到目前为止,还没有找到任何办法。

那我该怎么办?我还有其他选择吗?

解决方法

这将部分起作用:/(?<=https?:\/\/..\.wikipedia\.org\/wiki\/).+(?=\/(.+)?|#)/ 但是,如果没有/则无法使用。

相关问答

依赖报错 idea导入项目后依赖报错,解决方案:https://blog....
错误1:代码生成器依赖和mybatis依赖冲突 启动项目时报错如下...
错误1:gradle项目控制台输出为乱码 # 解决方案:https://bl...
错误还原:在查询的过程中,传入的workType为0时,该条件不起...
报错如下,gcc版本太低 ^ server.c:5346:31: 错误:‘struct...