如何将结构化XML数据加载到R中?

问题描述

我有一个非固定的XML数据库,我想将其转换为R数据帧。我将其解析如下:

s1 = df.groupby('id')['datetime'].transform(lambda x: 
x.diff().gt('15Sec').cumsum())

s2 = df.groupby('id')['uri_len'].transform(lambda x: x.diff().lt(0).cumsum())

df['session'] = s1+s2

然后我将其转换为如下所示的数据帧:

page <- xmlParse("<dataset>
  <language>
    <name>Old_Irish</name>
    <definite>
    <definite_source>Demonstrative</definite_source>
    <definite_article>1</definite_article>
    </definite>
    <n_cases>5</n_cases>
  </language>
  <language>
    <name>Irish</name>
    <definite>
    <definite_source>Demonstrative</definite_source>
    <definite_article>1</definite_article>
    </definite>
    <n_cases>4</n_cases>
  </language>
</dataset>")

这是结果:

xmlToDataFrame(page,stringsAsFactors = FALSE,) %>% 
                        mutate_all(~type.convert(.,as.is = T))

但是我想要什么:

       name       definite n_cases
1 Old_Irish Demonstrative1       5
2     Irish Demonstrative1       4

如何创建嵌套在 name definite_source definite_article n_cases 1 Old_Irish Demonstrative 1 5 2 Irish Demonstrative 1 4 中的列?

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)