분류 전체보기 98

[CVPR 2023] InstantAvatar: Learning Avatars from Monocular Video in 60 Seconds

- Introduction 최근 monocular video 에서 NeRF 를 이용한 avatar reconstruction 등장 NeRF 는 canonical space 를 사용하는 model (canonical space 라는 단어가 굉장히 많이 등장) Canonical space 란? canonical: 기본형의, 표준이 되는 Canonical space: Object-centered coordinate system View space: Viewer-centered coordinate system 좋은 성능을 내지만 (1) Differentiable deformation module 과 (2) Volume rendering 두 가지에 의해 다음과 같은 문제점 발생 오랜 train 시간 실시간 ren..

[CVPR 2022 Oral] Point-NeRF: Point-based Neural Radiance Fields

- Introduction NeRF: High-quality view synthesis Deep multi-view stereo methods: Quickly reconstruct scene geometry via direct network inference, 일반적으로 MVS 라고 많이 부르는 듯 ► Point-NeRF: 3D point cloud 를 이용하여 위 두 방법의 장점을 합친 방법 Point-NeRF 는 scene surface 주변에 있는 neural point features 를 합쳐서 효과적으로 render Pre-trained 된 network 의 inference 를 통해 Point-NeRF 를 initialize 할 수 있음 → point cloud 생성 NeRF: Reconstr..

[Linux] ssh 비밀번호 없이 접속

Local terminal 에서 > ssh-keygen Generating public/private rsa key pair. Enter file in which to save the key (/Users/USER/.ssh/id_rsa): # 그대로 enter키 /Users/USER/.ssh/id_rsa already exists. Overwrite (y/n)? y # Y 입력 Enter passphrase (empty for no passphrase): # 비밀번호를 설정하는건데 비밀번호 없이 접속해야하기 때문에 아무것도 입력하지 말고 enter키 Enter same passphrase again: # 마찬가지로 아무것도 입력하지 않고 enter 키 Your identification has been ..

Code/Linux 2023.07.31

[CVPR 2022] Masked Autoencoders Are Scalable Vision Learners (MAE)

- Introduction In NLP, models such as GPT or BERT remove a portion of data and learn to predict the removed content ► What is the difference in masked autoencoding between CV and NLP? Architecture was different CNN was traditionally used in the field of vision ViT addressed this gap Information density is different Language: Human-generated signals Vision: Natural signals Masking a very high por..

[CVPR 2022] OMNIVORE: A Single Model for Many Visual Modalities

- Introduction 현재, computer vision model 들은 single modal 에 대하여 굉장히 잘 작동함 그러나 사람과 같이 modal 에 대한 flexibility 를 가지지 못함 ► Modality-agnostic model 의 필요성 Modality-agnostic model 의 장점 Cross-modal generalization: 한 가지 modality 에서 배운 정보를 다른 modality 의 recognition 에 활용할 수 있음 Saves the research and engineering effort: 너무 당연함 Leverage new visual sensors 이런 장점들에도 불구하고 다양한 문제(capacity)들로 인해 연구가 거의 되지 않았음 논문에서..

AUROC (Area Under Receiver Operating Characteristic curve)

AUROC 를 알기위해선 ROC (Receiver Operating Characteristic) curve 가 무엇인지 알아야한다. ROC curve: $x$ 축이 FPR (False Positive Rate), $y$ 축이 TPR (Talse Positive Rate) 으로 이루어져 있으며 모든 threshold 에 대한 모델의 성능을 보여주는 그래프 AUROC: ROC curve 밑 부분의 넓이를 구하는데 높을수록 모델의 성능이 좋음 (↑) Specificity (특이도): $\frac{TN}{FP+TN}$ Precision (정밀도): $\frac{TP}{TP+FP}$ Recall (재현율) = Sensitivity (민감도): $\frac{TP}{TP+FN}$ Accuracy (정확도): $\fr..

AI/Metrics 2023.07.04

[CVPR 2023] GEN: Pushing the Limits of Softmax-Based Out-of-Distribution Detection

- Introduction OOD detection scenarios Covariate shift: Change in the input distribution Semantic shift: Change in the label distribution Existing OOD detection works Predictive distribution Incorporate feature statistics for ID data Requires a portion of training data Internal feature activation GOAL: Explore and push the limits of OOD detection when the output of a softmax layer is the only av..

[CVPR 2021] ORDisCo: Effective and Efficient Usage of Incremental Unlabeled Data for Semi-supervised Continual Learning

- Introduction In real-world applications, incremental data are often partially labeled. ex) Face Recognition, Fingerprint Identification, Video Recognition → Semi-Supervised Continual Learning: Insufficient supervision and large amount of unlabeled data. SSCL 에선 기존 CL 에서 사용하던 regularization-based method, replay-based method 가 잘 작동하지 않음 (왜 Architecture-based method 를 뺐는지는 모르겠음) 다만, Joint trainin..