WebKit

공명

첫번째 논문 : https://arxiv.org/abs/2603.16367  <- GPU를 20~70% 절감해주는 희소 행렬 모델, MoE의 차세대. 

두번째 논문 : http://arxiv.org/abs/2604.13546  <- 현존하는 모델은 추론 중 학습 못합니다. 저희는 우연히 발견했는데, 제 모델 구조가, 
                                                                    동시성 ( 서빙 추론 중에 학습이 되면서 오프라인 정확도를 찾아갑니다. ) 이 됩니다.