본문 바로가기

AI/ML

[9/19] 아이펠 리서치 15기 TIL | 온보딩 퀘스트 (Generative Agents 논문 분석)

반응형

1. 오늘 배운 내용

오늘은 온보딩 마지막 날이고, 아이펠 15기를 하며 앞으로 진행할 퀘스트를 체험해보는 시간을 가졌다.

 

주제: Generative Agents

논문: https://arxiv.org/pdf/2304.03442

 

Sims와 비슷해 보이는 게임을 구현한 논문이고 이 게임 속에는 총 25명의 에이전트가 있는데,

이 에이전트들은 사용자가 입력한 초기 정보(A는 ~을 좋아한다, A는 이웃 B를 잘 알고있다 등)만을 이용해서 하루의 계획을 짜고 그대로 행동한다.

이 과정에서, 한 에이전트가 다른 에이전트와 만나서 상호작용할 경우 자연어와 이모지로 이루어진 대화를 통해 정보 교환이 이루어지고, 이를 기억해서 이후에도 맥락에 맞는 커뮤니케이션이 가능하다. 또한, 요리를 한다던가, 침대에 눕는다던가 하는 사물과의 상호작용도 가능하다.

 

이렇게 에이전트들이 인간처럼 행동할 수 있는 이유는 LLM으로 이루어진 "기억-추론-계획-행동" 구조이기 때문이다.

에이전트 아키텍처

1. Perceive

  • 에이전트가 주변 환경의 정보를 받아들이는 과정
  • 이 정보들은 자연어 형태의 텍스트로 Memory stream에 저장됨

2. Memory Stream

  • 에이전트가 경험하는 모든 것을 시간 순서대로 기록하는 DB
  • 자연어 형태로 기록됨

3. Retrieve

  • 검색 매커니즘
  • 현재 상황과 가장 관련있는 기억을 Memory Stream에서 검색하고 꺼내오는 과정
  • 검색 기준은 Recency(최신성), Importance(중요도), Relevance(관련성) 총 3가지
    • Recency: 최근에 일어난 사건일수록 높은 점수
    • Imprortance: 에이전트에게 중요하다고 판단되는 사건일수록 높은 점수
    • Relevance: 에이전트가 처한 상황이나 질문과 관련된 기억일수록 높은 점수

Retrieval 과정

4. Retrieve Memories

  • Retrieve 과정을 통해 Memory Stream에서 추출된 기억들의 집합
  • 에이전트는 이 기억들을 바탕으로 앞으로의 행동(Act)이나 계획(Plan)을 결정함

5. Act

  • Retrieve Memories와 Plan을 바탕으로 행동 실행

6. Reflect

  • 에이전트가 사물이나 다른 에이전트와 상호작용하며 생기는 관찰들을 종합해서 더 높은 수준의 추론이나 새로운 Reflection(일반화된 결론?) 생성

Reflect 과정

 

7. Plan

  • Reflect를 통해 얻은 생각과 현재 상황을 바탕으로 계획을 수립하는 과정
  • 큰 틀에서 시작해서 구체적인 행동들로 세분화
  • ex: 오후에는 논문을 읽는다 -> 2시에 도서관에 간다 -> 노트북을 켠다 -> 논문을 찾는다

2. 느낀 점, 어려웠던 점

이 논문에서 가장 인상 깊었던 건, 에이전트 아키텍처에 표시된 흐름을 이용해 인간처럼 행동하는(이웃, 사물들과 상호작용하며 지식이 쌓이고 그것을 기반으로 더 깊은 추론을 통해 판단을 내리며 또 상호작용하는) 에이전트를 만들었고, 작은 사회가 형성됐다는 것이다. 발렌타인데이 파티도 상당히 놀라웠다.(에이전트 한 명에게 발렌타인데이 파티를 입력했는데, 시간이 지나며 서로 소통해서 5명이 파티에 참석함)

 

오랜만에 논문을 읽었는데, 기존엔 딱딱한 논문만 읽다가 이번에 재미있는 주제의 논문을 읽는 경험을 해서 재미있었다.

하지만 토익 시험을 본 지 거의 1년이 다 되어가는 만큼, 짧은 시간 안에 영어를 빠르게 읽는 것이 조금 힘들긴 했다.

 

아이펠에 지원하기 전부터 가장 궁금했던 것 중 하나가 수업 방식이었는데, 오늘 드디어 토론형 수업을 해봤다.

기존에는 강사가 일방적으로 강의를 하는 방식에 익숙했었기 때문에 오늘 진행했던 토론형 수업은 낯설고 쉽지 않았다.

6명의 팀을 반으로 나눠서 Teacher, Student 역할을 배정했는데, 나는 Teacher 역할을 배정받았고 이는 제한시간 안에 일정 범위의 논문을 읽고 해당 범위에 포함된 문단별로 요약한 다음, 특정 키워드에 대해 팀원에게 설명하는 방식이었다.

처음이라 그런지 준비 시간은 너무 짧게 느껴졌고 팀원들에게 설명할때도 긴장됐다.

앞으로 이런 토론형 수업을 많이 하게 될텐데, 시간이 갈수록 이런 토론 실력도 늘어갔으면 좋겠다.

 

그리고 아이펠은 ZEP을 이용해서 수업하는데 처음 해봐서 신기했다.

zep 로비


3. 주말에 할 일

  • 논문 끝까지 읽어보기
  • 흥미 있는 연구 분야 찾아보기
반응형