DataStudio 中的正则表达式提取

问题描述

我在 DataStudio 中尝试提取单个博客文章(我们有多个区域)。

我想提取 /article/?间的所有内容

  • 并非所有实例都有 ?(下面的屏幕截图)

我已经完成了第一部分但没有完成第二部分:REGEXP_EXTRACT(Landing Page,'/article/(.*)')

示例网址字符串:/au/article/how-to-clear-skin-in-4-steps/?sc_eh=0c375f5a122591491&sc_src=email_1

感谢您的帮助。

解决方法

在评论中添加基于 REGEXP_EXTRACT by Michi 的答案以及附加的 REGEXP_REPLACE Calculated Field 以供将来参考,将 - 替换为 (一个空格)并删除最后一个 /

1) 提取 /article/? 之间的所有内容

REGEXP_EXTRACT(Landing Page,"/article/([^\\?]+)")

2) 用 -(一个空格)替换 并删除最后一个 /

REGEXP_REPLACE(REGEXP_EXTRACT(Landing Page,"/article/([^\\?]+)"),"[-/]"," ")

Editable Google Data Studio Report 和 GIF 详细说明: