R을 활용한 데이터 분석 #3 –재현성과 실행 가능성

R을 활용한 데이터 분석, 3편에서는 데이터 분석에 있어 가장 중요한 두 가지 요소를 다뤄보겠습니다. 그 두 가지 요소는 바로  ‘재현성’과 ‘실행 가능성’인데요, 엔씨소프트 데이터분석팀 이은조 팀장의 쉽고(!) 친절한(!) 설명을 들어 보실까요~?   ( ͡° ͜ʖ ͡°) 이번에는 R과 직접 연관이 있으면서 좀 더 포괄적인 이야기를 하도록 하겠습니다. 데이터 분석에 있어 가장 중요한 것은  ‘재현성(reproducibility)’과 ‘실행 가능성(actionability)’입니다. […]

R을 활용한 데이터 분석 #2 실제 분석 과정

데이터 분석가들이 가장 선호하는 언어, R. 1편에서는 R의 특징과 인기 요인을 다뤘는데요. 2편에서는 엔씨소프트 데이터분석팀 이은조 팀장이 엔씨소프트에서 R을 실제로 사용해 데이터를 분석하는 과정을 설명해 드리도록 하겠습니다.  ( ͡° ͜ʖ ͡°) 엔씨소프트 데이터분석팀에서 진행하는 분석 프로젝트는 크게 1) 탐사 분석 2) 예측 모델링 3) 시스템 혹은 서비스 개발 단계로 나눌 수 있습니다. 1단계인 탐사 분석은 말 […]

R을 활용한 데이터 분석 #1 – R, 그것이 알고 싶다!

알파고의 출현 이후, AI와 더불어 빅데이터 기술이 새로운 산업 구조의 변화를 이끌어 나가고 있습니다. 데이터 분야에 종사하거나 해당 분야의 전문가를 꿈꾸는 사람들이라면  ‘R’이라는 언어를 한번쯤 들어본 적 있을 텐데요. 앞으로 3편에 걸쳐 엔씨소프트 데이터분석팀 이은조 팀장이 R은 무엇인지, 뭣 때문에 중한지(!), 그리고 엔씨소프트에서는 R을 어떻게 활용해 데이터를 분석하는지 소개해 드리도록 하겠습니다.  ( ͡° ͜ʖ ͡°) […]

엔씨가 사용하는 오픈소스 #2- 분석도구 ‘하이브(Hive)’와 ‘R’

엔씨가 사용하는 오픈소스 #1 빅데이터 처리기술 : ‘하둡(HADOOP)’ 편에 이어 2편입니다. 엔씨가 사용하는 오픈소스 #2 빅데이터 분석도구 ‘하이브(Hive)’ & ‘R’ 진행 : 이은조 팀장 (데이터분산처리팀 팀장) 참여 : 조원준 차장, 장길주 과장, 조현우 과장 2014년 월드컵 우승팀, 여러분은 무엇을 기준으로 예상하셨나요? 그동안의 기록? 현재의 순위? 세계적인 검색 포털 사이트 구글(Google)에서는 이를 예측하는 데 빅데이터를 활용하였습니다. 최근 가장 핫한 […]

TOP