저는 구글 포토를 잘 쓰고 있습니다. 무제한 용량에 자동으로 백업을 해주어서 쓰고 있는데요.
간혹 이 녀석이 물어봅니다. 2개의 사진을 보면서 같은 사람이냐? 다른사람이냐?
그럼 제가 친절하게 알려주죠. 맞다, 틀리다.
이게 바로 라벨링 작업중에 하나인데요. 구글의 머신러닝하는 녀석이 얼굴인식으로 같은 사람인지 판단이 애매할때 결국 답을 알고 있는 사용자 본인에게 직접 라벨링을 하라고 지시를 하는 셈이죠.
전 공짜로(구글 포토를 쓰고 있으니 해야하는?) 그 라벨링 작업을 해준셈이고,구글 머신러닝은 제가 라벨링한걸 가지고 다시 학습을 해서 보다 정밀하게 사람들을 분류하게 됩니다.
이런게 AI에게 꼭 필요한게 이런 라벨링 작업이지요~
혹시 실무에서 AI를 쓰신다면 이런 라벨링 작업들이 필수 불가결 할것 같은데 어떻게 해결들 하시나요?
저는 아직 회사에서 이정도 수준까지는 아니라서 고민을 안하고 있지만,데이터 라벨링 자체가 데이터 산업에서 중요한 포션을 차지하는것도 사실인 것 같습니다.
리멤버분중에 이런 데이터 라벨링 사업을 하는 회사 소속도 계시는지도 궁금합니다.
아래 글은 관련 기사와 블로그입니다.
첫번째는 비즈조선의 라벨링 사업이 우리가 소위 말하는 인건비가 싼 중국,인도를 이용해 라벨링을 하고 있다는 내용이구요
두번째는 아마존 AWS상에서 라벨링을 좀더 자동화 하는 방법을 소개하는 포스팅인데
Amazone Sagemaker Ground Truth라는 라벨링 인터페이스를 소개하는 글입니다.
----------------
함께 보면 좋을 글
----------------
● AI의 머신러닝, 알고보니 中·인도의 값싼 노동력 덕분
● 데이터라벨링 노가다는 이제 그만
0