본문 바로가기

내 맘대로 읽는 논문 리뷰/CV9

A Survey on Moving Object Detection & Tracking methods A Survey on Moving Object Detection and Tracking Methods ijcsit.com/docs/Volume%206/vol6issue06/ijcsit2015060679.pdf OT의 가장 기초를 다진 논문이라고 한다. 비디오의 객체를 다루는 알고리즘은 Object Detection → Object Classfication → Object Tracking 과 같이 이어지는데, 요즘은 OD가 Classification을 겸하니? 허튼 최종 단계라고 생각할 수 있는 단계가 OT인 것이다. OT는 OD로 찾은 물체 혹은 RoI를 추적하면서 Motion(움직임), Occlusion(없어짐), 위치 등등의 상황을 추적하며 분석하는 행위라고 생각하면 될 것 같다. 이 논문이 15년 .. 2021. 3. 10.
Early-Learning Regularization : ELRloss Early-Learning Regularization Prevents Memorization of Noisy Labels arxiv.org/pdf/2007.00151v2.pdf Clothing1M dataset을 통해 공부 (해당 데이터셋 SOTA) noisy label을 통해 학습 시 위의 1번 그래프와 같이, 잘못된 label이 섞인 경우 early learning의 잘못된 결과를 "memorize"함에 따라 학습이 제대로 안되게 된다. 이를 해결하기 위해 나온 논문. Related Work robust-loss, loss connection, sample selection 등등은 noisy label 학습을 위해 제안 된 것들. early learning을 통해 얻은 logit을 통해 label을 .. 2021. 3. 10.
TResNet - ASLLoss Asymmetric Loss For Multi-Label Classification arxiv.org/pdf/2009.14119.pdf MVC Dataset을 통해 공부. MVC dataset은 15년에 나온 Multi-label classification에 적합한 dataset이다. 264개의 label에 대해 binary class로 명시한 truth값을 가졌기 때문이다. 이에 최근에는 Multi-label classification을 어떻게 접근을 했을지 보기 위해, papers-with-code에서 해당 논문을 읽게 되었다. ASL loss는 이름부터 Asymmetric loss로, 비대칭적으로 계산한다는 것을 생각하면 편하다. 이전에 읽었던 RetinaNet에서는 다음과 같은 Focal Loss.. 2021. 3. 10.
DG-STA DG-STA arxiv.org/pdf/1907.08871.pdf Dynamic Graphs for hand gesture recognition via Spatial-Temporal Attention 이 논문은 CV 팀 프로젝트에서 구현했던 논문이다. 그래서 논문 리뷰라기 보단 프로젝트 리뷰라고 생각하면 편하다. 실제로 프로젝트 얘기밖에 안한다. 논문 내용도 많지 않아서. 비교적 유명하진 않은 논문인데, 우선 이용한 이유를 말해보자면 우리의 프로젝트는 한국 수어 영상을 실제 단어,문장으로 바꾸는 모델을 만들자! 였다. 처음엔 영상을 frame 단위로 끊어, 영상의 얼굴, 손 point 들을 추출하는 모델 하나(1), point로 부터 gesture feature를 뽑아내는 모델 하나(2), feature를.. 2021. 3. 10.