是否可以从HTML页面上的dataLayer.push脚本中提取结构化数据?

问题描述

我已经在node.js中设置了一些基本的网页抓取脚本...使用request或axios包加载URL,并使用jquery类型选择器将数据提取到csv文件中。好的,到这里。

但是,我想获取的某些数据仅在同一页面上的datalayer.push脚本中以结构化数据(我认为是JSON)形式提供。例如,请参见下面。

我已经在MeasureSchool和Chrome /开发人员工具/控制台中读取了数据层变量,可以在数据层中键入内容并浏览页面上的结构化数据。这样我就可以看到Office对象和数据元素。

但是我不确定数据层是否是一个对象...在脚本在页面上运行后我可以直接引用它,还是我需要在去除所有其他内容之后解析script标记中包含的json。

道歉,如果问题是基本的或显而易见的。显然是新手...

如果我希望能够在node.js的脚本之一中访问javascript中的数据... 有人可以建议最好的方法解决这个问题吗?非常感谢

<script>
                
      (function(a,b){
         ANALYTICS.DataLayer.pushAB(a,b);
           }('office',{"officeId":11234,"companyName":"Acme Co","officeType":"sales"}));

</script>

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)