본문 바로가기

IT 세상

빅데이터에 대해 알아봅시다.

안녕하세요.
오늘은 빅데이터에 대해 알아보겠습니다.


 


빅데이터가 등장하게 된 계기부터 알아볼텐데요
PC와 인터넷, 모바일 기기들의 이용이 생활화되면서
데이터들이 기하급수적으로 증가하여 기존의 방법이나 도구로
수집, 저장, 분석 등이 어려워 짐에 따라 등장하게 되었어요.



지금 현재 1분 동안 구글에서는 200만건의 검색이 이루어지고있고,
유트브에서는 72시간의 비디오가 생성이 된다고 합니다.
이것은 기존의 데이터베이스의 역량을 넘어서는 규모이고,
앞으로도 계속 변화될 것이라고 예측을 하고있어요.
그래서 빅데이터를 테라비이트 이상의 데이터라고 부르기도 한답니다.


 


빅데이터의 대표적인 활용사례는 구글이예요!
구글은 데이터의 양이 많으면 많을수록 얻을 수 있는 정보의 품질이
좋아진다는것을 인터넷 검색에서 실천하고 있는 기업입니다.
방대한 작업을 빠른 시간에 처리하기 위해서 새로운 처리 기술을 개발을 했다고하네요.


 


빅데이터의 데이터 처리를 개발된 오픈소스 소프트웨어도 있는데
이것을 하둡이라고 해요.
하둡은 대량의 자료를 처리할 수 있는 분산 어플리케이션을
지원하는 오픈 자바 소프트웨어 프레임워크예요.
말이 어렵지만 쉽게 말씀드리면 자바로 만들어진

빅데이터를 처리하는 프로그램이라고 보시면 됩니다!



빅데이터의 특징으로는 크기, 속도, 다양성들을 들 수 있어요.
앞에도 말씀드렸지만 테라바이트 이상의 데이터라고 부르는데
그 이유가 일반적으로 수십 테라바이트 혹은, 페타바이트 이상 규모의
데이터 속성으로 이루어지기 때문이에요.


속도는 대용량의 데이터를 굉장히 빠르게 처리하고 분석할 수 있어요.
지금 디지털 데이터는 굉장히 빠른속도로 생산이 되는데
이것을 실시간으로 저장, 유통, 수집, 분석처리가 가능하죠!


그리고 다양한 종류의 데이터가 있어서 종류에 따라

정형, 반정형, 비정형 데이터로 분류를 하게 됩니다!



요즘 빅데이터전문가, 기술자가 되고 싶어하시는 분들이 많은것으로 알고있습니다.
하지만 우리나라에서는 아직 빅데이터를 공부하기는 많이 부족한 환경입니다.
전문가도 많이 부족할 뿐더러 체계적으로 공부를 할 수 있는곳도 없기 때문이죠.
그래서 빅데이터쪽으로 진로를 정하셨다면 간단한 데이터베이스 정도만
우리나라에서 공부를 한 뒤 외국으로 나가서 공부를 하는 방법이 있습니다.

 

 

 

 


▼ 오픈카톡 문의하기 ▼

 


▼ 설문조사 문의하기 ▼