객체 인식을 위한 자가 학습 장치 및 방법이 개시된다. 개시된 장치는, 학습할 객체에 상응하는 키워드에 기초하여 범용 검색 엔진을 통해 학습 영상을 획득하는 학습 영상 획득부; 상기 학습 영상 획득부에서 획득한 학습 영상을 학습을 위해 입력하는 영상 입력부; 상기 영상 입력부로부터 입력되는 영상에 대한 객체 인식을 학습하는 학습 네트워크; 상기 학습 네트워크의 인식 성능을 평가하는 학습 평가부; 및 상기 학습 평가부의 평가 결과에 기초하여 상기 학습 네트워크의 학습 방향을 설정하는 학습 방향 설정부를 포함한다. 개시된 장치 및 방법에 의하면, 학습 데이터가 충분히 확보되지 않은 상태에서도 적절한 학습이 가능하고, 자동적으로 학습 영상을 확보하면서 학습의 적절성을 진단할 수 있는 장점이 있다.