从 BigQuery 中的 json 字符串中提取信息

问题描述

我正在 Bigquery 中存储一个表,其中包含分类算法的结果。表架构是 INT、STRING,看起来像这样:

ID 输出
1001 {'苹果酒':0.7,'咖啡':0.2,'果汁':0.1}
1002 {'黑咖啡':0.9,'茶':0.1}

问题是如何获取每个字符串的第一个(或第二个或任何顺序)元素及其分数。 JSON_EXTRACT 似乎不太可能工作,而且很可能可以用 Javascript 来完成。想知道这里的优雅解决方案会是什么样子。

解决方法

考虑以下

=ROUNDDOWN(C2/15,0)&" Days "&ROUNDDOWN(MOD(C2,15),0)&" Hours "& MOD(C2,1)*60 & " Minutes"

如果应用于您问题中的样本数据 - 输出为

enter image description here

注意:如果你愿意,你可以使用更简洁的 unnest 语句

select ID,trim(split(kv,':')[offset(0)]," '") element,cast(split(kv,':')[offset(1)] as float64) score,element_position
from `project.dataset.table` t,unnest(regexp_extract_all(trim(Output,'{}'),r"'[^':']+'\s?:\s?[^,]+")) kv with offset as element_position           

相关问答

Selenium Web驱动程序和Java。元素在(x,y)点处不可单击。其...
Python-如何使用点“。” 访问字典成员?
Java 字符串是不可变的。到底是什么意思?
Java中的“ final”关键字如何工作?(我仍然可以修改对象。...
“loop:”在Java代码中。这是什么,为什么要编译?
java.lang.ClassNotFoundException:sun.jdbc.odbc.JdbcOdbc...