在R中将多个xml文件解析为单个Dateframe [英] Parsing multiple xml files to a Single Dateframe in R

查看:231
本文介绍了在R中将多个xml文件解析为单个Dateframe的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

我在一个文件夹中有200个xml文件。我想解析文件夹中的所有xml文件,并将其转换为单个数据框以用于文本挖掘目的。

I have 200 xml files in a folder.I wanted to parse all the xml files in the folder and convert it into a single dataframe for text mining purpose.

对于一个单独的xml文件 - 我有以下代码来处理和工作正常:

For a single xml file - i have the below code to process and working fine:

library(XML)
d1 <- "C:\\Users\\Administrator\\Documents\\file.xml"
doc1 <- xmlParse(d1)
Data <- xmlToDataFrame(nodes=getNodeSet(doc1,"//Column1"))[c("Column2","Column3","Column4","Column5","Column6")]  

谢谢

Thanks

推荐答案

下面的代码工作,由hrbrmstr建议

The below code works , as advised by hrbrmstr

setwd("E:/xxx/SplitFIles/") 
    files <- list.files() 
    parse_xml <-function(FileName) {
     doc1 <- xmlParse(FileName) 
    doc <- xmlToDataFrame(nodes=getNodeSet(doc1,"//Column1"))[c("Column2","Column3","Column‌​4","Column5","Column6")] 
    } 
    Data <- ldply(files,parse_xml)

这篇关于在R中将多个xml文件解析为单个Dateframe的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!

查看全文
登录 关闭
扫码关注1秒登录
发送“验证码”获取 | 15天全站免登陆