在R中将多个xml文件解析为单个Dateframe [英] Parsing multiple xml files to a Single Dateframe in R
本文介绍了在R中将多个xml文件解析为单个Dateframe的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!
问题描述
我在一个文件夹中有200个xml文件。我想解析文件夹中的所有xml文件,并将其转换为单个数据框以用于文本挖掘目的。
I have 200 xml files in a folder.I wanted to parse all the xml files in the folder and convert it into a single dataframe for text mining purpose.
对于一个单独的xml文件 - 我有以下代码来处理和工作正常:
For a single xml file - i have the below code to process and working fine:
library(XML)
d1 <- "C:\\Users\\Administrator\\Documents\\file.xml"
doc1 <- xmlParse(d1)
Data <- xmlToDataFrame(nodes=getNodeSet(doc1,"//Column1"))[c("Column2","Column3","Column4","Column5","Column6")]
谢谢
Thanks
推荐答案
下面的代码工作,由hrbrmstr建议
The below code works , as advised by hrbrmstr
setwd("E:/xxx/SplitFIles/")
files <- list.files()
parse_xml <-function(FileName) {
doc1 <- xmlParse(FileName)
doc <- xmlToDataFrame(nodes=getNodeSet(doc1,"//Column1"))[c("Column2","Column3","Column4","Column5","Column6")]
}
Data <- ldply(files,parse_xml)
这篇关于在R中将多个xml文件解析为单个Dateframe的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!
查看全文