대니킴의 TEKnology
캐글러(Kaggler)가 되다! - Introduction to Kaggle 본문
제가 최근에 캐글에 입성했습니다!
캐글은 구글이 소유한 데이터 사이언스 온라인 커뮤니티로서 수많은 데이터 사이언티스트들이나 머신러너들에게 사랑받고 있는 커뮤니티입니다! 우리가 어떠한 프로젝트를 진행하다보면 정말 질 좋은 데이터가 생명이라는 것을 깨닫게 되는데, 캐글 데이터셋 (kaggle datasets)에서는 모두 전처리가 완료된 깔끔한 데이터를 카테고리 별로 잘 정리해서 무료로 제공해 줍니다.
이러한 데이터들을 이용하여 프로젝트를 진행한다면 데이터를 전처리 하는 데에 쏟을 힘을 좋은 모델을 설계하는 데에 더 사용할 수 있겠죠^^
캐글은 여러가지 Competitions들도 개최를 하는데요, 개인이나 팀으로 대회에 참가하고 주어진 데이터를 가지고 미션을 달성한 후에 Kaggle Kernel이나 Kaggle API를 사용해서 캐글에 결과를 제출해주면 됩니다. 점수와 등수는 LeaderBoard에서 즉시 확인 가능하고요. 아래 사진에서 보실 수 있듯이 우승상금도 만만치 않습니다ㅋㅋ 물론 금은동 메달들이 상금은 나눠 갖습니당
저는 이번 여름에 인공지능 부트캠프에서 머신러닝과 딥러닝을 포함한 인공지능 기술들을 배우고 있는데요, 팀 프로젝트의 일환으로 캐글러의 Hello World라고 할 수 있는 Titanic Competition에 팀으로서 참가하게 되었답니다ㅎㅎ 쉬운 대회인 만큼 참가자 수도 엄청나게 많더라고요 (2019년 7월 기준으로 대략 11000명 정도 참가 중). 우선 지금 일주일 정도 진행을 했는데 리더보드 등수는 1100등 정도입니다! 거의 10% 안에 들었네요^^
다음 포스팅에서부터는 제가 현재 진행 중인 타이타닉 대회에서 저희 팀이 짠 코드들을 업데이트해드리도록 하겠습니다. 깃허브에서 공동작업 중이기 때문에 제 깃헙으로 들어오셔서 보셔도 됩니다!