빅데이터란 용어를 한번 생각해봅니다.
제가 다니는 회사에서도 빅데이터라고 할만한게 있을지?
전체 업무시스템에서 사용하는 데이터베이스의 크기가 아직도 10TB 미만으로 처리가 가능한데 개별 업무시스템별로 보면 빅데이터로 할수 있을까요?
빅데이터의 특징이 3V(Volume, Velocity,Variety)라고 하는데요.
위키백과 빅데이터정의 ==>
업무시스템에서 정형화된 데이터베이스에 축적된 저희 회사의 경우는 아무래도 Volume 부분에서는 빅데이터로 부르기 힘들어보입니다.
제 개인적으로 데이터베이스에 축적된 데이터로 한정하지 않는다면 각 업무시스템에서 발생시키는 각종 서버의 로그파일들이 진정한 빅데이터 이지 않을까 싶습니다.
개별 업무 시스템별로 시간당 몇Gb씩 생성되고 그 로그 파일을 DB화 한다면 나름의 빅데이터가 될거라고 생각합니다. 물론 그 로그 파일을 어떻게 사용할지는 또 IT를 다루는 우리의 몫이 되겠지만요.
저는 그래서 개인적으로 생활데이터 이런 용어를 좋아합니다. 진정 빅데이터를 쌓고 그걸 분석해서 업무에 활용하는 공룡 IT기업들이 있겠지만(구글, 페이스북, 아마존, 네이버, 카카오) 저희 같은 조그만 회사들은 빅데이터라고 쓰고 그냥 데이터를 가지고 분석도 열심히 하지 못하는건 아닐런지?
어떻게 생각하시나요?
0