글쓰기
최신글
데이터분석 석사 취득?
데이터분석 관련해서 석사학위 취득을 위해 대학원을 다니려 하는데.. 졸업 후 연봉상승 등 기회비용대비 효과가 있을까요? 현재 대기업 공장에서 데이터 관련 업무 중이며, 전공은 화공계열입니다. 고견 부탁 드립니다 ㅠ
울산마철금
4일 전
조회수
823
좋아요
8
댓글
7
데이터분석, 무엇부터 시작해야할까요?
안녕하세요. 소비재 기업에서 7-8년 정도를 근무했습니다. 영업직무를 계속하다 운이 좋게 데이터 관련 팀으로 이동하게 되어 1년정도 근무하게 되었는데, 제가 생각했던것과는 많이 다르네요. 가설을 데이터로 검증하고 실무에 적용하는것을 기대했는데, 지금 하고 있는 업무는 대부분이 sql과 시각화툴을 이용한 리포팅 자동화 업무입니다. 이것 또한 배우는 과정이라 생각하고 일해왔는데… 앞으로가 고민이네요. 이제와서 배우기 위해 이직하긴 조금 늦은 것 같고… 더욱이 이 회사에서 제가 기대하는 데이터 분석을 심도깊게 하는 부서나 인원은 없는것 같은데, 독학하자니 비전문가(비개발자 출신)가 어디서부터 시작해야할지도 모르겠고… 엑셀이나 파워bi, 태블로 등은 재미있게 다뤄왔는데, 이 길이 맞는건지, 잘못된 길은 아닌지, 이미 선회하긴 늦은건지 등 고민이 많습니다. 비개발자 출신의 데이터분석가 선배님들은 어떻게 시작했고, 공부하고 계신지 궁금합니다.
erehwon
08.22
조회수
725
좋아요
6
댓글
10
서비스 론칭 이후 데이터의 무결성은 누구의 롤인가?
안녕하세요 E밀러공입니다. 데이터 관련 업무를 하다보니 문득 드는 생각이.. 다른 회사에서는 위 주제를 어떻게 보시는지.. 신규 서비스를 론칭한 이후에 데이터 수집을 DB에 하는데, 이거는 누가 책임을 지고 지표를 봐야 하나요? - 데이터지표를 보는 데이터 팀 - 해당 서비스에 데이터를 수집하게 설계한 서비스팀 - 해당 서비스를 구축한 개발팀 - 해당 서비스 기능을 검수하는 QA팀 - 해당 서비스를 이용하고 기획한 영업팀 다른 리멤버 분들의 회사에서는 어떤 방식으로 검수하시는지 궁금합니다!..
E 밀러공
동 따봉
08.13
조회수
498
좋아요
3
댓글
8
데이터분석가의 술술듣는 썰썰 - 13. 구글 애널리틱스의 변화에 대한 건.
안녕하세요 리멤버 인플루언서 3기 두꺼비세상 김지영입니다. "처음에는 맛만 보여주는 거지. 그러면 그게 지극히 당연하고 일상적이어 지는거지. 그러다 점점 양을 줄여나가면, 애가 타는거지. 그게 독점이야." 구글 애널리틱스는 초보 마케터에서부터 데이터 분석영역까지, 기업을 가리지 않고 널리 쓰이는 무료툴입니다. 구글의 기술력을 기반으로 하는 만큼 사용자의 분석과 각종 유입량, 이탈율에서 활성사용자 체크까지 두루 쓰이는 툴입니다. 그러다 최근 구글에서 구글 애널리틱스의 변화와 동시에 기존의 유니버셜 버전의 지원 중단을 발표하였습니다. 아무래도 파이어베이스 기반의 G/A4의 사용성을 증대시키려는 목적인 것 같습니다. 유예기간은 2023년 7월이죠. 그러면 기존의 유니버셜버전과 G/A4의 차이점은 무엇일까요? 단순하게만 표현하자면 -유니버셜(웹로그) -G/A4(웹로그) + firebase(앱로그) 등으로 앱 플랫폼의 로그들을 수집하는 기능이라 할 수 있습니다. 그렇다면 어떤 방식이 달라지는 것일까요? 기존의 웹서비스만 제공하던 ga유니버셜의 기능은 페이지뷰와 관련된 page중심의 수집이었습니다. 하지만 이러한 페이지뷰 수집방식을 앱에도 도입할 시, 각종 이벤트로 인한 화면전환들이 전부 페이지뷰로 잡히기 때문에 기하급수적으로 로그값이 늘어납니다. 그렇기 때문에 앱로그는 page기준이 아닌 event기준으로 측정을 해야 정확하다고 볼 수 있습니다. 이처럼 앱과 웹 지표를 사용하는 회사들의 경우 이러한 변화가 반가울수 있겠지만, 기존 유니버셜 버전을 활용하는 회사일수록 구글 애널리틱스의 변화에 대응해야하는 점이 부담이 될 수 있겠죠. 구글은 G/A를 바탕으로 - 구글 옵티마이즈(최적화 툴) - 구글 애즈(광고관련) - 구글 데이터 스튜디오(대시보드) - 구글 빅쿼리(대용량 로그처리) 등의 데이터 생태계를 구축하였습니다. 이러한 툴들을 잘 활용하고 변화에 대응하는 회사들이 데이터를 쓰고 활용하는데 있어서 우위를 차지 할 수 있겠죠. 여러분도 구글애널리틱스의 변화에 신속히 반응하셔서 새로운 툴들의 활용을 잘 하시길 바랍니다. 김지영 -스타트업들을 돌아다니며 기술분석, 패션 등 다양한 분야에서 경험을 쌓으며, 현재 프롭테크 '두꺼비세상' 피터팬의 좋은방구하기- 데이터 분석 전담. -개발% 분석50%하는 반반 개발 분석자. -완벽한 자연어 처리에 대한 관심. -웹크롤링, 텍스트마이닝, 머신러닝 기법에 관심. .cc @GA @FIREBASE @MKT @SVC @DEV
김지영
인플루언서
매니저 | 두꺼비세상 경영전략팀 데이터파트
08.13
조회수
483
좋아요
6
댓글
0
제조 데이터분석
여러가지 장단이 있으리라 생각합니다만, 흔히 이야기하는 데이터 분석직의 경우, 특정 도메인 영역에서 일을 하는데 특히나 제조 데이터 분석의 경우, 수요의 부분에 있어서의 흔히 말하는 도메인 지식의 중요도가 어느정도일지 궁금합니다. 여기서 세가지 커리어 path가 가능해 보입니다. 1. 도메인 지식을 굳혀서 그 분야에서 전문성을 갖는다. 2. 적당한 도메인 지식(+ 추가 study를 통해 학습 필요) 와 적당한 개발경험과 지식 3. 컴퓨터 공학 백그라운드이나 부족한 도메인 지식 세가지를 생각할때 2번의 경우로 가는것이 앞으로 risk가 있어 보이는데, 이럴경우 1 혹은 3으로 전향할 필요성에 대해서 질문드립니다.
jangod
07.30
조회수
552
좋아요
3
댓글
6
ADSp 온라인 강의를 찾고 있습니다.
안녕하세요. 비 전공자 출신의 데이터 분석/개발 업무를 하고 있는 40대입니다. 업무 상 조금이라도 도움이 될까 싶어 ADSp 공부를 해보려는데 인터넷에 검색해보면 뭐가 좋은 지 정말 판단하기가 어렵네요ㅠ 비 전공자가 공부하기 좋은 온라인 강의가 있다면 추천 부탁드립니다. 감사합니다.
Gorgo13
07.28
조회수
119
좋아요
3
댓글
2
데이터 추출 요청 프로세스
회사에 계신 데이터 담당자 분들께 여쭙습니다. 데이터 추출 요청 프로세스를 어떻게 구축해놓고 계신가요? 너무 요청이 몰려와서 대응이 힘들 지경이네요 ㅠㅠ
출근전문가
07.27
조회수
512
좋아요
0
댓글
2
파워 BI툴 사용하시는 분 계신가요?
안녕하세요 E밀러공입니다. 데이터 분석툴을 사용하려는데 마소의 Power BI를 써보려고 합니다. 가격을 보니 회사용 전체가 일년에 300-400? 이고 그냥 데스크톱용이 1.2만원? 이던데 이거는 그냥 편집자만 사면 뷰어는 어떤 아이디여도 무료로 볼 수 있는건가요? 사용해보셨거나 사용중이신 리멤버 분들이 있으시면 조언 부탁드립니다 ㅠ
E 밀러공
동 따봉
07.25
조회수
449
좋아요
1
댓글
4
CDP 솔루션추천 해주세요
CDP 솔루션 업체 추천해주세요 다양한 회사가 있는거 같은데요 어디가 좋을지 추천 부탁드립니다
CDP
07.18
조회수
421
좋아요
2
댓글
3
스타트업에서 데이터 분석 역량 방향성은?..
안녕하세요 E밀러공입니다. 지난 글에 다들 제가 회사생활에 회의감만 느끼는거처럼 비춰져서 뭔가 반성도 하고 고민도 많이 하네요. 요즘 회사분위기도 걱정이지만 제 커리어와 관련하여 업무 스킬 업그레이드에도 정말 관심이 많습니다. 회사업무를 하면서 제가 원했던 방향성보다는.. 좀 다른 방향으로 가는거 같아서 요즘 고민인데요, 데이터분석 업무를 하면서 실제로 태블로나 파워BI등의 시각화 툴이나 BI툴을 쓰기는 개뿔 파이썬이나 sql통해서 전처리나 정제작업이 거의 주된 업무가 되었습니다 ㅋㅋ 그래도 나름 작업물(?)에 만족하며 나름 회사의 데이터 분야에서 감시관(?)이 되었다고 생각하며 부서별 협업을 하며, 나름 일의 만족도는 좋습니다. 음.. 스타트업이라 그런가 웹크롤링 개발 요청도 많고 생각보다 데이터 시각화보다는 재료손질(?)의 업무가 많은데, 제 커리어를 어떤 부분에서 맞춰가야할지 고민이네요. 개발업무로는 요즘 - mysql + php등으로 어드민 개발도 관심 - pytouch, tensoflow 등의 머신러닝 모델링 - github, git등의 협업툴 기초 - sql관련 튜닝 및 쿼리 추출 심화 - 웹크롤링 기술 관련 selenium 및 request - get,post형식의 호출 방식 기술 등에 관심이 많아 깔짝..깔짝..하고 있고 시각화 관련 서드파티, bi툴은 - G/A, big query, appsplyer, adjust등의 서드파티 지표 파악 및 사용법 기초 -태블로, power bi, 파인리포트 등의 기초 bi지식.파악 및 사용법 공부 - big query등 구글 기반의 데이터 정제 툴 활용법 등을 공부하고 있습니다.. 사실 위에 나열한거는 수박 겉핧기 식으로 하는중이라 실무에서 못다루는 내용들이긴 한데... 이대로 학습하는게 맞는지.. 일단 궁금하네요.. 데이터 분석가라고 하면 개발쪽보다는 시각화툴 및 인사이트 도출론에 좀더 힘을 실어야 할지? 앞으로 커리어에 도움이 될만한 스텝을 공부하고 싶습니다.. 리멤버 분들의 조언 부탁드립니다..ㅠㅠ
E 밀러공
동 따봉
07.16
조회수
879
좋아요
5
댓글
10
데이터분석가의 성장
신입/주니어때는 통계/SQL/파이썬/데이터 분석 이론을 공부하면 되었는데요. 중/시니어 데이터 분석가로 성장하려면 뭘 더 공부해야할까요? 실무 경력/경험? 회사에서의 성과? 석사 후 데이터사이언티스트로 전직? 선배님들은 어떻게 공부하셨나요?
닥터와사비
07.09
조회수
983
좋아요
9
댓글
9
회사에 데이터 모델링, 머신러닝 직무가 있으신가요?
안녕하세요? 중견기업의 데이터 분석 직무로 일하고 있는 직장인입니다. 저희 회사는 대부분의 데이터가 RDBMS에 저장되어 있어서 사실 빅데이터라고 할 수 있는 데이터가 없는데요. 최근에 데이터 관련 신입 지원자들은 대부분이 빅데이터 모델링, 알고리즘 연구 등을 배우고 활용하고 싶다고 자기소개서를 쓰더라고요. 그걸 보면서 참 괴리감을 느꼈는데, 다른 분들은 어떠신가요? 삼성, LG 수준의 대기업, 금융권, 혹은 데이터 쌓는 것부터 비즈니스를 시작한 스타트업 정도가 아닌 중견/중소 기업에도 빅데이터 분석에 해당하는 직무가 있나요?
코고
07.08
조회수
538
좋아요
0
댓글
4
데이터분석가의 술술듣는 썰썰 - 9. 소개팅과 자기객관화의 필요성(서드파티툴 이야기)
안녕하세요 리멤버 인플루언서 3기 두꺼비세상 김지영입니다. "좋은 사람 만나시길 바래요. 저는 아직 연애 할 준비가 안된거 같아요." 2022.06 - '무더운 어느날 서울 한복판에서 받은 매서운 카톡' 친구놈에게 오랜만에 연락이 왔습니다.📞 잔뜩 고취되어 있던 소개팅이 결국 3차 애프터에서 망했다는 소식을요. 그날 술자리에서 저는 웃음을 지으며 이유가 뭔지 슬며시 물어봤습니다.🍶 그 친구도 꽤나 분석적이여서 저에게 이런저런 이유를 말하더군요. - 객관적인 입장으로 볼때 여유가 없어 보였다. - 내 입장에서는 좋았는데 여자분이 아닌거 같았다. - 시간이 흐르면서 마음이 떠나간거 같다. 연애란 참 어렵고도 쉽고, 운명적이면서 작위적인 '인류의 희노애락의 작품'인것 같습니다. 시간이 지나면 해결될 것을 항상 마음에 담아두게 되는 법이죠.💔 친구의 입장에서 들어봤을때 이처럼 객관적이고 중립적인 시각에서 분석이 이루워 진다면 정확한 연애를 위한 분석이 될거라고 생각합니다(갑자기 너무 비인간적인가..) 오늘은 예전에 여러분께 보여드린 '4. 페이지뷰'에 관련된 이야기 입니다. 앱서비스의 경우 웹서비스와 뷰에 대한 측정기준도 다르고, 광고매체나 여러 경로로 진입하는 고객들을 구분하기 어렵기에 이때문에 '제 3자의 입장'에서 앱서비스를 객관화 시켜 분석이 가능한 '서드파티툴'에 관련된 이야기를 해볼까 합니다. 서드파티툴이란 간단히 얘기하자면 메인 분석 시스템이 아닌, 사용자의 입장에사 해당 앱서비스에 대한 지표들을 파악하고 분석하는 툴입니다. 대표적으로 앱스플라이어, 애드저스트, 앱애니, 애드브릭스등.. 여러가지 종류의 툴이 있습니다. 이 서드파티툴들은 공통적으로 앱에 'sdk'라는 것으로 사용자의 설치수를 파악하거나, 신규 가입 유저들을 트래킹하는데 사용합니다. aos의경우 구글플레이스토어, ios는 앱스토어 등 설치, 삭제, 재방문등의 숫자들을 집계하는경우에 이러한 트래킹 시스템을 사용합니다. 이를 통해 앶 서비스를 하는 회사는 고객의 인입 지표를 파악하고 이를 통하여 앱서비스의 전반적인 설치/삭제 지표를 파악할 수 있는 법이죠. 또한 서드파티툴은 앱플랫폼별 식별자로 aos-adid, ios-idfa를 활용하여, 유저들이 각 광고별 매체로 얼마나 진입하였는지, 광고가 아닌 자연유입은 얼마나 되는지 파악하여 마케팅 집행 비용으로도 활용 할 수 있습니다. 정확한 지표의 광고매체 유입 인원을 알 수 있다면, 이를 통해 다시 리타게팅을 하거나, 광고비용 투입 증대를 통하여 좀 더 고객 유입에 박차를 가할 수도 있겠죠. 앱의 인지도를 높이기 위하여 많은 기업들은 이러한 서드파티 트래킹툴을 통하여 마케팅 효과를 톡톡히 보고 있습니다. 이처럼 서드파티툴은 파이어베이스 처럼 구글 기반의 무료 툴도 있지만, 좀더 기능이나 사용목적에 따라 유료툴을 활용하는 경우도 있습니다. 기업에서 인지도와 마케팅 측면에서 성공을 보려면 이러한 매체광고나 서드파티툴을 사용하는 비용은 오히려 효율적인 효과라고도 할 수 있겠네요. 오늘날 많은 플랫폼 회사에서 활용되는 지표들은 이 서드파티툴을 통하여 관리하고, 보여진다고 보시면 되겠습니다. 객관적이면서 중립적인 유저의 입장에서 서비스의 지표를 분석해주는 서드파티툴은 플랫폼사에서 빠질 수 없는 필수 용도라고 봐야 겠습니다. ------------------------------------------------ 리멤버 여러분들의 회사는 어떠한 서드파티툴을 쓰시나요? 여러분들의 앱 서비스는 잘 관리되고 있나요? 마케팅 광고를 효율적으로 관리하는 서드파티툴이 없이 광고 집행만 하는것은 마치 밑빠진 독에 물붓기와 같습니다. 현재의 서비스에 잘 맞는 서드파티툴을 도입하여 새로운 인사이트와 마케팅분석에 필요한 정보를 찾는건 어떠실까요? 김지영 -스타트업들을 돌아다니며 기술분석, 패션 등 다양한 분야에서 경험을 쌓으며, 현재 프롭테크 '두꺼비세상'에서 데이터 분석 전담. -개발% 분석50%하는 반반 개발 분석자. -완벽한 자연어 처리에 대한 관심. -웹크롤링, 텍스트마이닝, 머신러닝 기법에 관심. .cc @은하수다방 @당산대협 PS. 결국 그 친구는 요즘도 다른 사랑을 찾아 이리저리 헤메고 있다고 하는군요. 이번에는 본인에 대한 객관적인 분석과 자아성찰을 마치고 임한다고 하네요. 연애도, 일도 쉬엄쉬엄 잘 해나갔으면 하는 바랍입니다. 조만간 또 좋은 소식이 있지 않을까 살짝(?) 기대를 하고 있습니다.
김지영
인플루언서
매니저 | 두꺼비세상 경영전략팀 데이터파트
07.03
조회수
539
좋아요
8
댓글
0
데이터분석가의 술술듣는 썰썰 - 8. 분리수거 하는 말년병장
안녕하세요! 리멤버 인플루언서 3기 두꺼비세상 김지영입니다. "행보관님.. 저 진짜 할 거 없는데 심심해서 그렇습니다. 뭐라고 할 거 주십쇼." - "2012.09 즈음 전역을 한달 앞둔 말년 병장" 군 시절 너무너무~ 따분했던 말년을 보낸 저는 뭔가 작업 열외되어 혼자 있는게 심심해서 분리수거장에서 조용히 쓰레기를 분류하는 작업을 했었죠🚮 지금은 왜 그랬나 싶지만 아무래도 말년이라 더 이상 군이라는 집단에서 소외되는 것이 외로워서 그랬을지도 모릅니다🤣 오늘 여러분에게 해드리고 싶은 이야기는 바로 가비지 데이터(garbage data)입니다. 데이터분석에서 결측값, 이상값이라고도 불리고 개발분야에서 가끔 null이란 이름으로도 나오는 이 가비지 데이터. 과연 전혀 쓸모없는 데이터일까요? 가비지 데이터의 정의는 데이터의 '정제'와 연관이 있습니다. 간략하게 예시를 한번 들어보겠습니다. 1. CGV / 탑건 / 오전 / 성인 / 2인 2. 왓챠 / 탑건 / 오후 / 아동 / 3인 3. 광명 DVD점 / 탑건 / '' / 성인 / 2인 4. 우리집 / 탑건 / 아동 / '' 자, 이 데이터는 고객들에게 최근에 본 영화의 종류와 장소, 인원, 시간대까지 설문을 받은 것 인데요, 가비지 데이터는 위 데이터에서도 '보고자 하는 기준'에 따라서도 구분이 됩니다. 예를 들어 -탑건은 주로 어떤 연령대가 많이 보았나? 라는 질의에 대하여 데이터 추출을 하자면 위 내용중 공란인 3번을 제외하고 1,2,4번의 데이터들로 성인(1), 아동(2) 이라고 집계가 되겠죠. 그렇다고 3번 데이터는 쓸모 없는 가비지 데이터 일까요? 아닙니다. 우리는 데이터의 4번째 컬럼인 '연령'을 기준으로 봐서 그렇습니다. 만약 '탑건을 본 위치나 장소'를 뜻하는 1번 컬럼으로 기준을 삼는다면 3번 데이터는 사용 할 수 있는 데이터라 할 수 있습니다. 이처럼 데이터를 보는 기준에 따라 가비지 데이터가 될 수도 있고 정상 데이터가 될 수도 있습니다. 물론 기준에 따라 데이터들은 다양하게 쪼갤 수 있어야 하고, 정확히 들어와 있어야 합니다. 플랫폼의 경우 데이터의 지표를 관리하는 관리자는 이러한 데이터들의 정제 과정에서 발생하는 손실과 수집 시스템상의 오류를 끊임없이 파악해야 겠지요. 이전 시간에 이야기한 웹크롤링과 더불어 업무자동화인 RPA를 도입한 회사들이 많은데요, 이러한 영역에서도 가비지 데이터들은 생성되며 지표의 관리에 필요성을 만듭니다. 하지만 이러한 데이터들도 정제와 보는 관점에 따라 충분히 효용가치가 있는 데이터가 되죠. 평소에는 가비지 데이터들로 보던 것들이 다른 기준을 적용하면 충분히 가용한 자원이 될 수 있습니다. 리멤버 여러분들도 여러분들의 가비지 데이터를 잘 활용해 보시는 기회가 되셨으면 좋겠습니다. ------------------------------------------------ 전역 후에도 군대의 생각이 절로 나는 건 지겨워서인지, 그때의 제가 그리워서 인지🪖 가비지 데이터 처럼 제 안의 가치와 가능성에 대한 시각을 달리보고 자기객관화를 했던 시기였을까요. 정신없이 달려오는 지금의 30대에 없던, 20대는 낭만과 패기의 나이여서 그런가 싶습니다🏃‍♂️🐎 더운 장마도 지나고 주말을 축복(?)인지 해가 떳습니다🌅 무더위가 찾아왔지만 그래도 날씨가 좋아서 오늘은 밖으로 나가야 겠네요. 리멤버 여러분들도 오늘만큼은 사랑하는 연인들과, 가족들과 소중한 시간 보내시기 바랍니다💪♥️ 김지영 -스타트업들을 돌아다니며 기술분석, 패션 등 다양한 분야에서 경험을 쌓으며, 현재 프롭테크 '두꺼비세상'에서 데이터 분석 전담. -개발% 분석50%하는 반반 개발 분석자. -완벽한 자연어 처리에 대한 관심. -웹크롤링, 텍스트마이닝, 머신러닝 기법에 관심. .cc @933 @OBSERVER @paju
김지영
인플루언서
매니저 | 두꺼비세상 경영전략팀 데이터파트
07.02
조회수
495
좋아요
4
댓글
0
데이터분석가의 술술듣는 썰썰 - 6. 비가 오는 날에는 왜 파전이 잘팔리는가?
안녕하세요 리멤버 인플루언서 3기 두꺼비세상 김지영입니다. "비가 오는날에는 일조량이 줄어들어 쉽게 우울해진다. 이를 피하기 위해 파전에 있는 탄수화물(밀), 타우린(해산물), 황화아릴(파) 등의 영양소를 찾는다. 하지만 누가 신경쓰나? 그냥 땡겨서 먹는거다."🍶 - '비오는 날 방구석 철학자'☔ 네 맞습니다. 비도 추적추적 오고, 수요일이라 일은 힘들고, 왠지 집에 들어가기 싫은 날이네요😭 그런 날이면 왠지 동료에게 술생각이나 먼저 한잔하고 하긴 뭐하고 기다리게 됩니다. 결국 제가 먼저 얘기하는 경우도 있구요🤣 비오는날 = 파전 처럼 날씨나 특정 상황에 어울리는 상품들은 기업에서 훌륭한 마케팅소재로 쓰일 때가 많습니다. 흔히 SNS를 통한 바이럴 마케팅이 대표적인 예라고 할 수 있겠습니다. 비오는날 인스타그램 등 SNS에서 '파전'등 비와 연관된 음식, 주류의 포스팅은 평소보다 약 5배 증가한다고 합니다.🥓🥘🍣🍜🍲 데이터적으로 이러한 SNS게시물을 모아 텍스트형태의 자료로 머신러닝 모델로 만들어 낸 종류 중 하나가 '군집분석'과 이를 시각화 한 '워드클라우드'입니다. 텍스트 마이닝에서 이 군집분석의 경우 사용한다면, '같은 게시물에서 얼마나 많은 단어들을 언급하며, 이는 얼마나 많은 문장들과 연관이 되고, 얼마나 같은 주제로 분석되는가' 입니다. 이는 텍스트마이닝을 통해 군집분석을 하면 -비슷한 주제의 게시물을 올리는 사람들의 성향 -하나의 주제(술)를 군집(n개)으로 나눠 집단으로 표현하여, 그 집단의 성향과 특성을 파악하기 용이 하다고 볼 수 있습니다. 생소하신 분들도 있겠지만 어려운 내용은 아니기에 간략한 이미지와 설명해 보겠습니다🖼️ 아래 두번째 그림은 '혼술'이라는 주제로 군집분석을 실행하였고, 총 5가지 집단 중 4번째 집단입니다. 위 워드 클라우드에서 의미하는 것을 무엇일까요? 4번째 집단은 포스팅시 '자주 언급되는 주류의 종류'라 할 수 있겠습니다. 맥주, 와인, 칵테일, 위스키등 통상적인 개념의 주류가 있겠지만 세부적인 워드를 보자면 - 페일에일, 라거, 등의 키워드 - 스페인, 미국 등의 주류국가에 대한 관심 - 향, 청량감, 달달, 과일 등의 술을 표현할때 중요도 - 가성비, 느낌등 포스팅의 조건 등이 있겠습니다. 이를 통해 주류 회사는 상품에 대한 고객들의 아이디어나, 어떤 방식을 선호하는지, 경쟁사의 경우 노출빈도가 어떠한지 대략적으로 파악 할 수 있습니다. 물론 해당내용을 좀 더 심화해서 분석을 해볼 수도 있겠지만, 군집분석을 통한 워드클라우드의 매력은 한눈에 추세를 가시적으로 볼 수 있다는 점이 아닐까요👀 ------------------------------------------------ 비가오는 날이면 왠지 집에 푹 쉬고 싶거나, 밖에서 빗소리를 들으며 친구들과 술잔을 나누고 싶습니다. 오늘은 직장에서 같이 오래하지 않았지만 친분이 있는 직장 상사분이 퇴사하셨습니다. 이직한 곳에서 꽃길은 아니어도 포장도로에서 잘 달리시길 바랍니다. 집에 들어가는 길에 맥주나 한캔 해야 겠네요🍻 다들 장마철인데 건강 조심하시고 내일도 힘차게. 열심히 날아봅시다🌅 김지영 -스타트업들을 돌아다니며 기술분석, 패션 등 다양한 분야에서 경험을 쌓으며, 현재 프롭테크 '두꺼비세상'에서 데이터 분석 전담. -개발% 분석50%하는 반반 개발 분석자. -완벽한 자연어 처리에 대한 관심. -웹크롤링, 텍스트마이닝, 머신러닝 기법에 관심. .cc @RAIN @GANG @goodbyejm
김지영
인플루언서
매니저 | 두꺼비세상 경영전략팀 데이터파트
06.29
조회수
708
좋아요
10
댓글
2
대표전화 : 02-556-4202
06235 서울시 강남구 테헤란로 134, 5층
(역삼동, 포스코타워 역삼) (대표자:최재호)
사업자등록번호 : 211-88-81111
통신판매업 신고번호: 2016-서울강남-03104호
| 직업정보제공사업 신고번호: 서울강남 제2019-11호
| 유료직업소개사업 신고번호: 2020-3220237-14-5-00003
Copyright 2019. Drama & Company All rights reserved.