问题描述
我有一个非固定的XML数据库,我想将其转换为R数据帧。我将其解析如下:
s1 = df.groupby('id')['datetime'].transform(lambda x:
x.diff().gt('15Sec').cumsum())
s2 = df.groupby('id')['uri_len'].transform(lambda x: x.diff().lt(0).cumsum())
df['session'] = s1+s2
然后我将其转换为如下所示的数据帧:
page <- xmlParse("<dataset>
<language>
<name>Old_Irish</name>
<definite>
<definite_source>Demonstrative</definite_source>
<definite_article>1</definite_article>
</definite>
<n_cases>5</n_cases>
</language>
<language>
<name>Irish</name>
<definite>
<definite_source>Demonstrative</definite_source>
<definite_article>1</definite_article>
</definite>
<n_cases>4</n_cases>
</language>
</dataset>")
这是结果:
xmlToDataFrame(page,stringsAsFactors = FALSE,) %>%
mutate_all(~type.convert(.,as.is = T))
但是我想要什么:
name definite n_cases
1 Old_Irish Demonstrative1 5
2 Irish Demonstrative1 4
如何创建嵌套在 name definite_source definite_article n_cases
1 Old_Irish Demonstrative 1 5
2 Irish Demonstrative 1 4
中的列?
解决方法
暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!
如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。
小编邮箱:dio#foxmail.com (将#修改为@)