데이터 분석을 이용한 게임 고객 모델링 #1

게임 회사는 고객들의 유형과 특성을 정확히 파악하는 것이 매우 중요합니다. 이는 고객들을 위한 맞춤형 콘텐츠를 기획하고, 보다 편리한 서비스를 제공하기 위함인데요. 고객 유형 분석에 쓰이는 다양한 데이터 분석 방법을, 엔씨소프트 데이터분석팀 이은조 팀장이 소개합니다.  (*´∀`*) 혹시 MBTI 검사를 받아본 적 있으신가요? MBTI는 테스트를 통해 사람의 성격을 16가지 유형으로 분류하는 지표입니다. 비교적 단순한 검사와 몇 가지 유형만으로도 […]

IPython Notebook을 통한 데이터 분석 #2

게임 운영 관리의 핵심은 데이터 분석이라 해도 과언이 아닙니다. 고객의 유형을 파악하고 그에 맞는 서비스를 제공하는 것이 핵심이기 때문이죠! 때문에 엔씨소프트에서는 최신 데이터 분석 툴을 활용해 여러 데이터를 다각도로 분석하고 있습니다. 그중 요즘 가장 각광받는 데이터 분석 툴이자, 엔씨소프트 데이터 분석 전문가들이 강추(!)하는  IPython Notebook의 활용 사례를 데이터분석팀 강병수 주임이 소개해 드리도록 하겠습니다~. ( ͡° ͜ʖ ͡°) 지난 […]

IPython Notebook을 통한 데이터 분석 #1

데이터 분석 기술은 이제 비단 IT업계 뿐만 아니라 금융, 경제, 언론 등 다양한 분야에서 없어서는 안 될(!) 기술이 되었습니다. 이렇듯 데이터 분석에 대한 관심과 인기가 높아지면서 분석 과정을 설명하고 결과를 표현하는 방법 또한 다양해지고 있는데요~. 특히 엔씨소프트에서는 요즘 가장 각광받는 데이터 분석 툴인 IPython Notebook을 적극 도입해 전방위적으로 활용하고 있습니다. 엔씨소프트 데이터 분석 전문가들이 강추(!)하는 IPython Notebook의 이모저모를, 데이터분석팀 강병수 […]

R을 활용한 데이터 분석 #3 –재현성과 실행 가능성

R을 활용한 데이터 분석, 3편에서는 데이터 분석에 있어 가장 중요한 두 가지 요소를 다뤄보겠습니다. 그 두 가지 요소는 바로  ‘재현성’과 ‘실행 가능성’인데요, 엔씨소프트 데이터분석팀 이은조 팀장의 쉽고(!) 친절한(!) 설명을 들어 보실까요~?   ( ͡° ͜ʖ ͡°) 이번에는 R과 직접 연관이 있으면서 좀 더 포괄적인 이야기를 하도록 하겠습니다. 데이터 분석에 있어 가장 중요한 것은  ‘재현성(reproducibility)’과 ‘실행 가능성(actionability)’입니다. […]

R을 활용한 데이터 분석 #2 실제 분석 과정

데이터 분석가들이 가장 선호하는 언어, R. 1편에서는 R의 특징과 인기 요인을 다뤘는데요. 2편에서는 엔씨소프트 데이터분석팀 이은조 팀장이 엔씨소프트에서 R을 실제로 사용해 데이터를 분석하는 과정을 설명해 드리도록 하겠습니다.  ( ͡° ͜ʖ ͡°) 엔씨소프트 데이터분석팀에서 진행하는 분석 프로젝트는 크게 1) 탐사 분석 2) 예측 모델링 3) 시스템 혹은 서비스 개발 단계로 나눌 수 있습니다. 1단계인 탐사 분석은 말 […]

R을 활용한 데이터 분석 #1 – R, 그것이 알고 싶다!

알파고의 출현 이후, AI와 더불어 빅데이터 기술이 새로운 산업 구조의 변화를 이끌어 나가고 있습니다. 데이터 분야에 종사하거나 해당 분야의 전문가를 꿈꾸는 사람들이라면  ‘R’이라는 언어를 한번쯤 들어본 적 있을 텐데요. 앞으로 3편에 걸쳐 엔씨소프트 데이터분석팀 이은조 팀장이 R은 무엇인지, 뭣 때문에 중한지(!), 그리고 엔씨소프트에서는 R을 어떻게 활용해 데이터를 분석하는지 소개해 드리도록 하겠습니다.  ( ͡° ͜ʖ ͡°) […]

엔씨가 사용하는 오픈소스 #3 – 개발, 운영도구(Bootstrap, Pig, Voldemort, Ganglia)

엔씨가 사용하는 오픈소스 #1 빅데이터 처리기술 : ‘하둡(HADOOP)’ 엔씨가 사용하는 오픈소스 #2- 분석도구 ‘하이브(HIVE)’와 ‘R’ 편에 이어지는, 오픈소스 이야기 3편! 엔씨가 사용하는 오픈소스 #3 개발, 운영도구 부트스트랩(Bootstrap), 피그(Pig), 볼드모트(Voldemort), 강글리아(Ganglia) 진행 : 김진필 팀장(데이터인프라개발팀) 참여 : 백승학 차장, 최부경 과장, 윤영도 과장, 김주환 대리 리니지 운영자가 대규모 이벤트를 열었을 때 조건에 맞는 참가자를 걸러내는 방법에는 어떤 것이 […]

엔씨가 사용하는 오픈소스 #2- 분석도구 ‘하이브(Hive)’와 ‘R’

엔씨가 사용하는 오픈소스 #1 빅데이터 처리기술 : ‘하둡(HADOOP)’ 편에 이어 2편입니다. 엔씨가 사용하는 오픈소스 #2 빅데이터 분석도구 ‘하이브(Hive)’ & ‘R’ 진행 : 이은조 팀장 (데이터분산처리팀 팀장) 참여 : 조원준 차장, 장길주 과장, 조현우 과장 2014년 월드컵 우승팀, 여러분은 무엇을 기준으로 예상하셨나요? 그동안의 기록? 현재의 순위? 세계적인 검색 포털 사이트 구글(Google)에서는 이를 예측하는 데 빅데이터를 활용하였습니다. 최근 가장 핫한 […]

엔씨가 사용하는 오픈소스 #1 빅데이터 처리기술 : 하둡(HADOOP)

엔씨가 사용하는 오픈소스 #1   빅데이터 처리기술 :      ‘하둡(HADOOP)’ 진행 : 윤종완 실장(데이터플랫폼실 실장) 참여 : 노재호 차장, 박경재 차장, 박수혁 차장 자고 일어나면 연봉이 상승한다는 꿈의 직업이 있습니다. 2014 IT 자격증 HOT 리스트에도 빠짐없이 등장하는 직업, 빅데이터 엔지니어! 빅데이터란 데이터의 생성 양과 주기, 형식 등이 방대한 데이터를 이르는 말인데요, 인터넷의 발달로 인해 자연스럽게 데이터량이 […]

TOP