Google DeepMind - 게임을 통한 협력의 이해
기본적으로 사람은 각자의 이익을 위해 움직인다. 자신의 이익을 해치는 행위는 최대한 자제하려고 하는 본성이 있다. 그렇다면 어느 때 인간은 협력을 할까? 간단하게 생각하면, 당연히, 협력했을 때 보상이 더 클때 협력을 한다. Google DeepMind에서는 강화학습 (Reinforcement Learning)을 통한 두 개의 다른 게임플레이를 통해 이를 확인시켜준다. 첫번째 게임은 "수확게임". 두 명의 플레이어가 보다 많은 과일 (녹색점)을 얻기위해 경쟁하는 게임이다. 과일을 많이 얻을수록 보상도 높아진다. 각 플레이어는 일종의 "광선"으로 상대방이 잠시동안 수확을 못하도록 할수 있다. 하지만 이로 인한 보상은 없다. 자연히, 그렇기에, 과일의 수가 적어질수록 서로를 마비광선으로 방해하려고 한다. 과일이 많은 경우는 수확에 힘을 더 쏟지만 말이다. 이 게임은 "늑대무리게임" 으로 기본적으로 두 늑대가 협력해야 먹잇감을 잡을 가능성이 커지는 게임이다. 따라서 자연히 늑대들은 협력을 하게된다. 원본 문서는: https://deepmind.com/blog/understanding-agent-cooperation/ 위 게임을 통해 간단하지만 쉽게 지나치는 인간사회의 한가지 보편적인 사실을 알 수 있다. "인간은 주어진 규칙 위에서 최대한의 보상을 위해 움직인다." 다른 말로 바꾸자면, 어떤 그룹의 구성원들의 행동양태는 해당 그룹이 규정한 규칙에 따라 바뀐다는 것이다. 그것이, 한 가정이든, 학교든, 연구소든, 기업이든, 심지어는 한 국가이든 상관없이. 홀로 독립적으로 자급자족 생활을 영위하는 로빈손 크루소같은 사람이 아닌 이상, 인간의 모든 행위는 그가 속한 "사회"와 밀접하게 관련이 있다는 매우