- Introduction 현재, computer vision model 들은 single modal 에 대하여 굉장히 잘 작동함 그러나 사람과 같이 modal 에 대한 flexibility 를 가지지 못함 ► Modality-agnostic model 의 필요성 Modality-agnostic model 의 장점 Cross-modal generalization: 한 가지 modality 에서 배운 정보를 다른 modality 의 recognition 에 활용할 수 있음 Saves the research and engineering effort: 너무 당연함 Leverage new visual sensors 이런 장점들에도 불구하고 다양한 문제(capacity)들로 인해 연구가 거의 되지 않았음 논문에서..