이런 경우 경험 공유 부탁드려요

2021.04.22 | 조회수 322
불합리
y_lab = a_1 x_1 + a_2 x_2 + a_3 x_3 + a_0 데이터 자체가 error 거의 없이 아주 깔끔하게 리니어하게 나오는 실험 결과. 그런데, x_4, x_5를 측정할 수 없는 상황에다 x_1 ~ x_3만 가지고 y를 예측해 볼 수 없는가 하는 상황입니다. x_4랑 x_5가 implicit하게 영향을 주는 y값을 얻어 보니 (y_real이라 하죠) linear하긴 마찬가지, 기울기와 절편이 x_3까지만 세 개 썼을 때와 다를 뿐. 그런데, reproducibility는 얼마나 좋을지 모르는 이 때 y_lab, x_1 ~ x_3만 측정한 데이터만 가지고 y_real을 최대한 가깝게 예측하려면, 팁 좀 부탁해요. 데이터 포인트는 200개 정도, 그런데 이게 샘플 종류별로 합친 거라 종류별로는 약 40~60개 정도(즉, 샘플 종류가 한 4~5종). 굳이 y_real은 얻는 데 너무 오래 걸리고 x_4, x_5는 전혀 확보 못함요, 그렇다고 y_lab을 굳이 더 모을 필요는 없어 보이는 게 linear regression 결과가 꽤 괜찮으므로요.
닉네임으로 등록
등록
전체 댓글 1

리멤버 회원이 되면 모든 댓글을 보실 수 있습니다

로그인
회원가입
김커뮤니티
@멘션된 회사에서 재직했었음
BEST회사에서 풀지 못한 고민, 여기서 회사에서 업무를 하다가 풀지 못한 실무적인 어려움, 사업적인 도움이 필요한 적이 있으셨나요? <리멤버 커뮤니티>는 회원님과 같은 일을 하는 사람들과 이러한 고민을 해결할 수 있는 온라인 공간입니다. 회원 가입 하고 보다 쉽게 같은 일 하는 사람들과 소통하세요
2020.07.01
154
김커리어
@멘션된 회사에서 재직 중
BEST리멤버 회원을 위한 경력 관리 서비스, 리멤버 커리어를 소개합니다. 당장 이직 생각이 없어도, 좋은 커리어 제안은 받아보고 싶지 않으신가요? <리멤버 커리어>는 리멤버에서 새롭게 출시한 회원님들을 위한 경력 관리 서비스 입니다. 능력있는 경력직 분들이 <리멤버 커리어>에 간단한 프로필만 등록해두면, 좋은 커리어 제안을 받아 볼 수 있습니다. 단 1분의 투자로 프로필을 등록해두기만 하면, 기업인사팀이나 헤드헌터가 회원님께 꼭 맞는 제안을 직접 보내드립니다. 지금 바로 <리멤버 커리어>에 프로필을 등록하고, 새로운 기회를 만나보세요!
2020.07.01
21
대표전화 : 02-556-4202
06235 서울시 강남구 테헤란로 134, 5층
(역삼동, 포스코타워 역삼) (대표자:최재호)
사업자등록번호 : 211-88-81111
통신판매업 신고번호: 2016-서울강남-03104호
| 직업정보제공사업 신고번호: 서울강남 제2019-11호
| 유료직업소개사업 신고번호: 2020-3220237-14-5-00003
Copyright 2019. Remember & Company All rights reserved.