728x90

R은 통계프로그래밍 언어로 일반인이 사용하기 쉽게 만든 언어이다.

그러나 필자는 프로그래머이고 비 프로그래머의 인식으로 접근하기 힘든면이 있다.

강의 또한 그러하다. 강의 곳곳에 프로그래머적인 시선이 들어있으니 참고하여 필요없으면 넘겨라.


참고:

[개발환경 셋팅하기]R설치 및 환경변수 등록-(1)

[개발환경 셋팅하기]RStudio설치-(2)

[개발환경 셋팅하기]RStudio프로젝트 만들기-(3)


xml역시 자주보이는 데이터 유형이다.

xml이 복잡하게 되어있다면 긁어오는데 힘이들겠지만 대부분 OpenAPI에서 주는 유형은 정규화된 데이터들이므로 큰 문제는 없다.

xml역시 자동으로 읽을 수 없으므로 XML이라는 라이브러리를 설치해야한다.


xml라이브러리


install.packages("XML")

이렇게 사용할 경우 XML파일을 사용할 수 있다.


test.xml

이 파일을 다운받자.

http://www.w3ii.com/ko/r/r_xml_files.html에서 예제로 있는 파일이다.



내부에는 총 5개의 원소가 있다.

이제 이를 읽어보자.

읽는 방식은 총 2가지가 있는데 일단 XML그자체로 읽는 방법부터보자.


library('XML')

result <- xmlParse(file = "test.xml")

rootnode <- xmlRoot(result)

print(rootnode[[1]])

print('**********')

print(rootnode[[1]][[1]])


출력을 xmlParse함수를 사용해서 xml파일을 읽어올 수 있다.

이 방법은 xml로 출력하거나할때는 장점이 있다.



그러나 데이터를 가공하거나 사용할때는 xml파일로 유지시키는건 별 도움이 안된다.

그냥 데이터 프레임으로 받는게 가공하긴 더 수월하다.

xml데이터를 데이터프레임으로 변환시키는것은 아래와 같다.


library('XML')

result <- xmlToDataFrame("test.xml")

print(result)


이 때 사용하는 함수는 xmlToDataFrame함수이다.

결과는 데이터프레임이 된다.


다시 저장하려면 어떻게 해야할까?

가능은 한데 매우 귀찮다. 여기서는 xml을 어떻게 쓰는지는 다루지 않겠다.

dataframe을 다시 xml로 컨버팅하려면 다시 xml을 쌓는수 밖에 없다.

그리 어렵지 않으니 여러분이 한번 만들어 보는걸 추천한다.

+ Recent posts