Javascript正则表达式-如何在组内查找PascalCase项目

问题描述

我需要转换如下内容

[[Click here|ThisIsALink]]

收件人:

[Click here](https://example.com/this-is-a-link)

我可以使用此正则表达式[[Click here|ThisIsALink]]找到第一个/\[\[(.*?)\|(.*?)\]\]/g,可以将其替换为[Click here](https://example.com/ThisIsALink]),但是我该如何吸收最后一部分并进行转换发送到this-is-a-link吗?我已经尝试了一些方法,但是似乎可以找到所有PascalCased事件,而不仅仅是发现第一个正则表达式模式中发生的事件。 (我将.md文件转换为.pdf,所以它是一整页的内容,而不仅仅是这些链接)。

这是我到目前为止所拥有的

var exampleUrl = "https://example.com/";
var urlOne = /\[\[(.*?)\|(.*?)\]\]/g;

data.replace(urlOne,"[$1](" + exampleUrl + "$2)"));

这导致: [Click here](https://example.com/ThisIsALink)

解决方法

您可以使用

const texts = ["Text [[Click here|ThisIsALink]] text...","Text [[Click here|This-Is-A-Link]] text..."];
const exampleUrl = "https://example.com/";
const urlOne = /\[\[((?:(?!\[\[).)*?)\|(.*?)]]/g;
for (var text of texts) {
  console.log(
    text.replace(urlOne,(_,x,y) =>
                 `[${x}](${exampleUrl}${y.replace(/[^A-Za-z]+/g,'')
                                         .replace(/(?!^)[A-Z]/g,'-$&')
                                         .toLowerCase()})`) );
}

正则表达式1的详细信息

  • \[\[-[[字符串
  • ((?:(?!\[\[).)*?)-第1组:除换行符以外的任何其他字符(不超过零次或更多),且不开始[[字符序列
  • \|-一个|字符
  • (.*?)-第2组:除换行符以外的任何零个或多个字符,并且尽可能少
  • ]]-一个]]字符串。

第二个正则表达式(?!^)[A-Z]应用于组2的内容,并且匹配不在字符串开头的任何大写ASCII字母。 -$&替换项仅在比赛之前附加-

额外的正则表达式.replace(/[^A-Za-z]+/g,'')将在插入连字符之前从第2组内容中删除所有非字母字符。

,

这种方法的确会在任意给定长度的文本中找到并替换为OP提及的模式,而不考虑该模式在文本中匹配的频率。

它还为String.prototype.replace使用了非常简单的正则表达式。

正则表达式确实看起来像这样……/\[\[([^|]+)\|([^\]]+)\]\]/g ...看起来像这样……

  1. \[\[ ...(从字面上)匹配两个方括号...
  2. ([^|]+) ...捕获不是管道的每个字符序列 (链接文本) ...
  3. \| ...然后匹配管道...
  4. ([^\]]+) ...捕获每个字符序列 (非常网址) ,它不是一个右方括号...
  5. \]\] ...然后匹配两个右方括号。
  6. / ... /g ...将正则表达式标记为全局要处理/应用的模式。

const sampleUrl = 'https://example.com/'
const sampleText = `Text [[Link A|ThisIsLinkA]] text. Text [[Link B|thisIsLinkB]] text.
Text [[Link C|This-Is-Link-C]] text.
Text [[Link D|ThisIsLinkD]] text. Text [[Link E|-this--Is--Link--E]] text.`;

function convertLinkMarkup(text,baseUrl) {
  function ensureKebabCase(str) {
    return str
      .replace((/([A-Z])/g),'-$1') // - prefix any latin uppercase char with '-'.
      .replace((/-+/g),'-')        // - replace any '-' sequence with a single '-'.
      .replace((/^-+/g),'')        // - trim any leading '-' sequence.
      .toLowerCase();               // - lower-case the result.
  }
  function createLinkMarkup(match,text,path) {
    return `[${ text }](${ baseUrl }${ ensureKebabCase(path) })`;
  }
  const regXUrl = (/\[\[([^|]+)\|([^\]]+)\]\]/g);

  return text.replace(regXUrl,createLinkMarkup);
}

console.log(
  sampleText,'\n\n... => ...\n\n',convertLinkMarkup(sampleText,sampleUrl)
);
.as-console-wrapper { min-height: 100%!important; top: 0; }