Google DeepMind - 게임을 통한 협력의 이해

기본적으로 사람은 각자의 이익을 위해 움직인다.

자신의 이익을 해치는 행위는  최대한 자제하려고 하는 본성이 있다.

그렇다면 어느  때 인간은 협력을 할까? 

간단하게 생각하면, 당연히, 협력했을  때 보상이 더 클때 협력을 한다.

Google DeepMind에서는 강화학습 (Reinforcement Learning)을 통한 두 개의  다른 게임플레이를 통해 이를  확인시켜준다.


첫번째 게임은 "수확게임".  두 명의 플레이어가 보다 많은 과일 (녹색점)을 얻기위해 경쟁하는 게임이다. 과일을 많이 얻을수록 보상도  높아진다.

각 플레이어는 일종의 "광선"으로 상대방이 잠시동안 수확을 못하도록 할수  있다. 하지만  이로 인한 보상은 없다.

자연히,  그렇기에, 과일의 수가 적어질수록 서로를  마비광선으로 방해하려고 한다.

과일이 많은 경우는 수확에 힘을 더 쏟지만  말이다.


이  게임은  "늑대무리게임" 으로 기본적으로 두 늑대가 협력해야 먹잇감을 잡을  가능성이 커지는 게임이다.

따라서 자연히  늑대들은 협력을 하게된다.


위 게임을 통해 간단하지만 쉽게 지나치는 인간사회의 한가지 보편적인 사실을 알  수 있다.

"인간은 주어진  규칙 위에서 최대한의 보상을 위해 움직인다."

다른 말로 바꾸자면, 어떤 그룹의 구성원들의 행동양태는 해당 그룹이 규정한  규칙에 따라 바뀐다는  것이다.

그것이,  한  가정이든, 학교든,  연구소든, 기업이든, 심지어는 한 국가이든 상관없이.

홀로 독립적으로 자급자족 생활을  영위하는 로빈손 크루소같은 사람이 아닌 이상,  인간의  모든 행위는  그가 속한 "사회"와 밀접하게 관련이 있다는 매우  당연한 사실을  위에서 보여준 매우 단순한  두 게임들을 통해 알 수있다.

댓글

이 블로그의 인기 게시물

Intel이 ONNX에 참여하다

Google의 DeepMind가 인간전문가보다 독순술을 더 잘한다고 한다

천문학에서의 인공지능: Gaia Hypervelocity stars