Google DeepMind와 옥스포드대학 연구팀이 Deep Learning기술을 많은 양의 BBC TV 프로그램을 이용하여 훈련시켰다고 한다. 훈련의 목적은 사람의 입술모양과 변화를 읽어, 그 사람이 현재 무슨 말을 하는지 알아내기 위함이었다. 결과적으로, 12.4%를 읽어낸 인간전문가에 비해, Deep Learning 모델은 46.8%를 읽어냈다고 하니, 거의 4배에 가까운 결과이다. 아마도, 곧, 영어권 영화를 보기위해 이미도씨가 필요하지 않을지도 모르겠다. (이미도씨께 개인적인 감정은 없다. 가장 대표적인 분이라 예를 든것이니 혹시라도 기분나빠하지 않으시길..) 원본문서는 여기에: https://www.newscientist.com/article/2113299-googles-deepmind-ai-can-lip-read-tv-shows-better-than-a-pro/
댓글
댓글 쓰기