[AI Paper] ๐ Large Language Model based Multi-Agents: A Survey of Progress and Challenges
๐ Large Language Model based Multi-Agents: A Survey of Progress and Challenges
๐ ๋ฉํ ์ ๋ณด
| ํญ๋ชฉ | ๋ด์ฉ |
|---|---|
| ์ ์ | Taicheng Guo, Xiuying Chen, Yaqi Wang, Ruidi Chang, Shichao Pei, Nitesh V. Chawla, Olaf Wiest, Xiangliang Zhang |
| ์์ ๊ธฐ๊ด | University of Notre Dame, King Abdullah University of Science and Technology (KAUST), Southern University of Science and Technology, University of Massachusetts Boston |
| ๋ฐํ์ฒ | IJCAI 2024 (Thirty-Third International Joint Conference on Artificial Intelligence) |
| ๋ฐํ ์ฐ๋ | 2024 |
| arXiv | arXiv:2402.01680 |
| GitHub | LLM_MultiAgents_Survey_Papers |
| ํ์ด์ง | pp. 8048-8057 |
๐ฏ ํ์ค ์์ฝ
LLM ๊ธฐ๋ฐ Multi-Agent ์์คํ ์ ํต์ฌ ๊ตฌ์ฑ์์(ํ๊ฒฝ ์ธํฐํ์ด์ค, ์์ด์ ํธ ํ๋กํ์ผ๋ง, ์ปค๋ฎค๋์ผ์ด์ , ๋ฅ๋ ฅ ํ๋)๋ฅผ ์ฒด๊ณ์ ์ผ๋ก ๋ถ๋ฅํ๊ณ , Problem Solving๊ณผ World Simulation ๋ ๊ฐ์ง ์ฃผ์ ์์ฉ ๋ถ์ผ์ ์ฐ๊ตฌ ๋ํฅ์ ์ข ํฉ์ ์ผ๋ก ์ ๋ฆฌํ ์ต์ด์ ์ฒด๊ณ์ ์๋ฒ ์ด ๋ ผ๋ฌธ.
๐ ์ฐ๊ตฌ ๋ฐฐ๊ฒฝ ๋ฐ ๋๊ธฐ
๊ธฐ์กด ์ํฉ
- LLM์ด ๋ค์ํ ํ์คํฌ์์ ๋๋ผ์ด ์ฑ๊ณผ๋ฅผ ๋ฌ์ฑ
- LLM์ ๋ฐ์ด๋ ๊ณํ(Planning) ๋ฐ ์ถ๋ก (Reasoning) ๋ฅ๋ ฅ์ ํ์ฉํ ์์จ ์์ด์ ํธ ์ฐ๊ตฌ ํ๋ฐ
- ์ด๊ธฐ์๋ ๋จ์ผ ์์ด์ ํธ ๊ธฐ๋ฐ ์์ฌ๊ฒฐ์ /๊ณํ ์์คํ ์ด ์ฃผ๋ฅ
๋ฌธ์ ์
- ๋จ์ผ ์์ด์ ํธ์ ํ๊ณ
- ๋ณต์กํ ๋ฌธ์ ํด๊ฒฐ์ ํ์ํ ๋ค์ํ ์ ๋ฌธ์ฑ๊ณผ ๊ด์ ๋ถ์กฑ
- ํ์ ๊ฐ ์ง์์ด๋ ๋ค๋ฉด์ ๋ฌธ์ ํด๊ฒฐ์ ์ทจ์ฝ
- ์ ๋ณด ๊ต์ฐจ ๊ฒ์ฆ ๋ถ๊ฐ๋ก hallucination ์ํ
- ์ฒด๊ณ์ ๋ถ๋ฅ ๋ถ์ฌ
- Multi-Agent ์ฐ๊ตฌ๊ฐ ๊ธ์ฆํ์ง๋ง ํตํฉ์ ํ๋ ์์ํฌ ๋ถ์กฑ
- ์ฐ๊ตฌ์๋ค์ด ์ ์ฒด ๊ทธ๋ฆผ์ ํ์ ํ๊ธฐ ์ด๋ ค์
์ฐ๊ตฌ ํ์์ฑ
- Multi-Agent ์์คํ ์ ํต์ฌ ๊ตฌ์ฑ์์์ ๋ํ ์ฒด๊ณ์ ๋ถ๋ฅ
- ๋ค์ํ ์์ฉ ๋๋ฉ์ธ๋ณ ์ฐ๊ตฌ ๋ํฅ ์ ๋ฆฌ
- ํฅํ ์ฐ๊ตฌ ๋ฐฉํฅ ์ ์
๐ก ํต์ฌ ์์ด๋์ด
Multi-Agent ์์คํ ์ ์ ์
์ฌ๋ฌ LLM ๊ธฐ๋ฐ ์์ด์ ํธ๊ฐ ํ๋ ฅํ์ฌ ๋จ์ผ ์์ด์ ํธ๋ก๋ ํด๊ฒฐํ๊ธฐ ์ด๋ ค์ด ๋ณต์กํ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๊ฑฐ๋, ์ค์ ์ธ๊ณ๋ฅผ ์๋ฎฌ๋ ์ด์ ํ๋ ์์คํ
4๊ฐ์ง ํต์ฌ ๋ถ์ ์ถ (Four Key Aspects)
โโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโ
โ LLM-MA System โ
โโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโค
โ 1. Agents-Environment Interface (์์ด์ ํธ-ํ๊ฒฝ ์ธํฐํ์ด์ค) โ
โ 2. Agent Profiling (์์ด์ ํธ ํ๋กํ์ผ๋ง) โ
โ 3. Agent Communication (์์ด์ ํธ ์ปค๋ฎค๋์ผ์ด์
) โ
โ 4. Agent Capability Acquisition (์์ด์ ํธ ๋ฅ๋ ฅ ํ๋) โ
โโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโ
ํต์ฌ ์ฐ๊ตฌ ์ง๋ฌธ
- LLM-MA ์์คํ ์ด ์ด๋ค ๋๋ฉ์ธ๊ณผ ํ๊ฒฝ์ ์๋ฎฌ๋ ์ด์ ํ๋๊ฐ?
- ์์ด์ ํธ๋ ์ด๋ป๊ฒ ํ๋กํ์ผ๋ง๋๊ณ , ์ด๋ป๊ฒ ์ปค๋ฎค๋์ผ์ด์ ํ๋๊ฐ?
- ์์ด์ ํธ์ ๋ฅ๋ ฅ ์ฑ์ฅ์ ๊ธฐ์ฌํ๋ ๋ฉ์ปค๋์ฆ์ ๋ฌด์์ธ๊ฐ?
๐๏ธ ๋ถ๋ฅ ์ฒด๊ณ / ํ๋ ์์ํฌ
1. Agents-Environment Interface (์์ด์ ํธ-ํ๊ฒฝ ์ธํฐํ์ด์ค)
์์ด์ ํธ๊ฐ ํ์คํฌ ํ๊ฒฝ๊ณผ ์ํธ์์ฉํ๋ ๋ฐฉ์
ํ๊ฒฝ ์ ํ
| ์ ํ | ์ค๋ช | ์์ |
|---|---|---|
| Sandbox Environment | ๊ฒ์ ๊ท์น, ์๊ฐ ์ ํ ๋ฑ ํ๋ ์์ํฌ ์ค์ | Werewolf Game, Avalon |
| Physical Environment | ์ค์ ๋ฌผ๋ฆฌ์ ํ๊ฒฝ ์๋ฎฌ๋ ์ด์ | ๋ก๋ณดํฑ์ค, IoT |
| Virtual Environment | ์ํํธ์จ์ด ๊ฐ๋ฐ, ์น ํ๊ฒฝ | ChatDev, MetaGPT |
ํ๊ฒฝ ํผ๋๋ฐฑ
- ์์ด์ ํธ๋ ํ๊ฒฝ์ผ๋ก๋ถํฐ ํผ๋๋ฐฑ์ ๋ฐ์ ํ์ฌ ์ํ ํ์
- ํผ๋๋ฐฑ์ ํตํด ์์ฌ๊ฒฐ์ ๋ฐ ํ๋ ์กฐ์
2. Agent Profiling (์์ด์ ํธ ํ๋กํ์ผ๋ง)
์์ด์ ํธ์๊ฒ ํน์ ํ๋ ๋ฐฉ์์ ๋ถ์ฌํ๋ ๋ฐฉ๋ฒ
ํ๋กํ์ผ๋ง ์ ๋ต (3๊ฐ์ง)
โโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโ
โ Agent Profiling Strategies โ
โโโโโโโโโโโโโโโโฌโโโโโโโโโโโโโโโฌโโโโโโโโโโโโโโโโโโโโโโโโโโโค
โ Handcrafted โ LLM-Generatedโ Data-Driven โ
โ (์์์
) โ (LLM ์์ฑ) โ (๋ฐ์ดํฐ ๊ธฐ๋ฐ) โ
โโโโโโโโโโโโโโโโผโโโโโโโโโโโโโโโผโโโโโโโโโโโโโโโโโโโโโโโโโโโค
โ ์ธ๊ฐ์ด ์ง์ โ LLM์ด ์๋ โ ์ค์ ๋ฐ์ดํฐ์์ โ
โ ์ญํ /ํ๋ฅด์๋ โ ์ญํ ์์ฑ โ ํ๋ฅด์๋ ์ถ์ถ โ
โ ์ ์ โ โ โ
โโโโโโโโโโโโโโโโดโโโโโโโโโโโโโโโดโโโโโโโโโโโโโโโโโโโโโโโโโโโ
ํ๋กํ์ผ ๊ตฌ์ฑ์์
- ์ญํ (Role): Product Manager, Engineer, Tester ๋ฑ
- ํ๋ฅด์๋ (Persona): ์ฑ๊ฒฉ, ์ ๋ฌธ ๋ถ์ผ, ํ๋ ์์
- ๋ชฉํ (Goal): ์์ด์ ํธ๊ฐ ๋ฌ์ฑํด์ผ ํ ๋ชฉํ
๋์ ์์ด์ ํธ ์์ฑ
- IAAG (Initial Automatic Agent Generation): ์ด๊ธฐ ์๋ ์์ด์ ํธ ์์ฑ
- DRTAG (Dynamic Real-Time Agent Generation): ์ค์๊ฐ ๋์ ์์ด์ ํธ ์์ฑ
- ํ์คํฌ ์๊ตฌ์ฌํญ์ ๋ฐ๋ผ ์๋ก์ด ์์ด์ ํธ๋ฅผ on-the-fly๋ก ์์ฑ
3. Agent Communication (์์ด์ ํธ ์ปค๋ฎค๋์ผ์ด์ )
์์ด์ ํธ ๊ฐ ๋ฉ์์ง ๊ตํ ๋ฐ ํ๋ ฅ ๋ฐฉ์
Communication Structure (ํต์ ๊ตฌ์กฐ) – 4๊ฐ์ง ์ ํ
โโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโ
โ Communication Structures โ
โโโโโโโโโโโโโโโโโโโฌโโโโโโโโโโโโโโโโโโฌโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโค
โ Centralized โ Decentralized โ Layered/Hierarchical โ
โ (์ค์์ง์คํ) โ (๋ถ์ฐํ) โ (๊ณ์ธตํ) โ
โโโโโโโโโโโโโโโโโโโผโโโโโโโโโโโโโโโโโโผโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโค
โ ์ค์ ์์ด์ ํธ๊ฐ โ P2P ๋คํธ์ํฌ โ ๊ณ์ธต๋ณ ์ญํ ๋ถ๋ฆฌ โ
โ ์ ์ฒด ์กฐ์จ โ ์ง์ ํต์ โ ์ธ์ ๊ณ์ธต๊ณผ ์ํธ์์ฉ โ
โโโโโโโโโโโโโโโโโโโดโโโโโโโโโโโโโโโโโโดโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโ
โโโโโโโโโโโโโโโโโโโโโโโโโโโโโ
โ Shared Message Pool โ
โ (๊ณต์ ๋ฉ์์ง ํ) โ
โโโโโโโโโโโโโโโโโโโโโโโโโโโโโค
โ MetaGPT์์ ์ ์ โ
โ ์์ด์ ํธ๊ฐ ๋ฉ์์ง ๋ฐํ/๊ตฌ๋
โ
โ ์ญํ ๊ธฐ๋ฐ ๋ฉ์์ง ํํฐ๋ง โ
โโโโโโโโโโโโโโโโโโโโโโโโโโโโโ
Communication Paradigm (ํต์ ํจ๋ฌ๋ค์)
| ํจ๋ฌ๋ค์ | ์ค๋ช |
|---|---|
| Message Passing | ์์ฐ์ด ๋๋ ๊ตฌ์กฐํ๋ ๋ฐ์ดํฐ ์ ์ก |
| Speech Act | ๋ฐํ๊ฐ ์ฝ์, ๋ช ๋ น, ์ง์ ์ญํ |
| Blackboard Model | ๊ณต์ ๋ฉ๋ชจ๋ฆฌ/์ปจํ ์คํธ ์ ์ฅ์ |
Network Topology (๋คํธ์ํฌ ํ ํด๋ก์ง)
- Bus, Star, Ring, Tree ๋ฑ ๋ค์ํ ๊ตฌ์ฑ ๊ฐ๋ฅ
- ์กฐ์ ์๊ตฌ์ฌํญ์ ๋ฐ๋ผ ์ต์ ํ
4. Agent Capability Acquisition (์์ด์ ํธ ๋ฅ๋ ฅ ํ๋)
์์ด์ ํธ๊ฐ ๋ฌธ์ ํด๊ฒฐ ๋ฅ๋ ฅ์ ๊ฐ๋ฐํ๋ ๋ฐฉ๋ฒ
Feedback Types (ํผ๋๋ฐฑ ์ ํ)
โโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโ
โ Feedback Sources โ
โโโโโโโโโโโโโโโโโโโฌโโโโโโโโโโโโโโโโโโฌโโโโโโโโโโโโโโโโโโโโโโค
โ Environment โ Human โ Other Agents โ
โ (ํ๊ฒฝ ํผ๋๋ฐฑ) โ (์ธ๊ฐ ํผ๋๋ฐฑ) โ (์์ด์ ํธ ํผ๋๋ฐฑ) โ
โโโโโโโโโโโโโโโโโโโผโโโโโโโโโโโโโโโโโโผโโโโโโโโโโโโโโโโโโโโโโค
โ ์ค์ /๊ฐ์ ํ๊ฒฝ โ ์ฌ์ฉ์ ํ๊ฐ โ ๋๋ฃ ์์ด์ ํธ โ
โ ์์์ ๊ฒฐ๊ณผ โ ๋ฐ ์์ โ ๊ฒ์ฆ ๋ฐ ๋นํ โ
โโโโโโโโโโโโโโโโโโโดโโโโโโโโโโโโโโโโโโดโโโโโโโโโโโโโโโโโโโโโโ
Learning Strategies (ํ์ต ์ ๋ต)
- Memory-based Learning
- Short-term Memory: ํ๋๊ณผ ๊ด์ฐฐ์ ๊ถค์
- Long-term Memory: ์ถ์ ๋ ๊ฒฝํ
- Reflection: ์๊ธฐ ์ฑ์ฐฐ์ ํตํ ๊ฐ์
- Self-Reflection (์๊ธฐ ์ฑ์ฐฐ)
- Reflexion: ํ์คํฌ ์๋ฃ/์คํจ ํ ์ธ์ด์ ๋ถ์ ์์ฑ
- ์ํผ์๋ ๋ฉ๋ชจ๋ฆฌ ๋ฒํผ์ ์ฑ์ฐฐ ์ ์ฅ
- “Verbal Reinforcement Learning”
- Tool-based Feedback
- CRITIC: ๋๊ตฌ ๊ธฐ๋ฐ ํผ๋๋ฐฑ์ผ๋ก ์ถ๋ ฅ ๊ฒ์ฆ/์์
- STE: Trial-and-error ์๋ฎฌ๋ ์ด์ ์ผ๋ก ๋๊ตฌ ํ์ต ๊ฐํ
5. ์์ฉ ๋ถ์ผ ๋ถ๋ฅ
Problem Solving (๋ฌธ์ ํด๊ฒฐ)
| ๋ถ์ผ | ์ค๋ช | ๋ํ ์์คํ |
|---|---|---|
| Software Development | ์ํํธ์จ์ด ๊ฐ๋ฐ ์๋ํ | ChatDev, MetaGPT |
| Scientific Research | ๊ณผํ ์ฐ๊ตฌ ๊ฐ์ํ | ChemCrow |
| Mathematical Reasoning | ์ํ์ ์ถ๋ก | – |
| Code Generation | ์ฝ๋ ์์ฑ | AutoGen |
World Simulation (์ธ๊ณ ์๋ฎฌ๋ ์ด์ )
| ๋ถ์ผ | ์ค๋ช | ์์ |
|---|---|---|
| Social Simulation | ์ฌํ์ ํ๋ ์๋ฎฌ๋ ์ด์ | Generative Agents |
| Game Simulation | ๊ฒ์ ํ๊ฒฝ ์๋ฎฌ๋ ์ด์ | Werewolf, Avalon |
| Economy Simulation | ๊ฒฝ์ ์๋ฎฌ๋ ์ด์ | – |
| Psychology Simulation | ์ฌ๋ฆฌ ์๋ฎฌ๋ ์ด์ | – |
| Policy Making | ์ ์ฑ ๊ฒฐ์ ์๋ฎฌ๋ ์ด์ | – |
| Disease Propagation | ์ง๋ณ ์ ํ ์๋ฎฌ๋ ์ด์ | – |
๐ ์ฃผ์ ์ฐ๊ตฌ๋ค ๋น๊ต
๋ํ Multi-Agent ํ๋ ์์ํฌ ๋น๊ต
| ํ๋ ์์ํฌ | ๊ฐ๋ฐ์ฌ | ํน์ง | GitHub Stars | ์ฃผ์ ์ฉ๋ |
|---|---|---|---|---|
| AutoGen | Microsoft | ์ ์ฐํ ์ํฌํ๋ก์ฐ, ๊ทธ๋ฃน ์ฑํ , ์ค์ฒฉ ๋ํ ์ง์ | ~53K+ | ๋ฒ์ฉ (์ํ, ์ฝ๋ฉ, QA ๋ฑ) |
| MetaGPT | – | SOP ๊ธฐ๋ฐ, ์ํํธ์จ์ด ํ์ฌ ๊ตฌ์กฐ ๋ชจ๋ฐฉ | ~40K+ | ์ํํธ์จ์ด ๊ฐ๋ฐ |
| ChatDev | OpenBMB | Waterfall ๋ชจ๋ธ, ์ญํ ๊ธฐ๋ฐ ํ์ | – | ์ํํธ์จ์ด ๊ฐ๋ฐ |
| CAMEL | – | Role-playing ๊ธฐ๋ฐ ์ด๊ธฐ ํ๋ ์์ํฌ | – | ์ฐ๊ตฌ/์คํ |
์ฑ๋ฅ ๋น๊ต
โโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโ
โ Performance Comparison (Code Generation) โ
โโโโโโโโโโโโโโโโฌโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโค
โ Framework โ ํน์ง โ
โโโโโโโโโโโโโโโโผโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโค
โ ChatDev โ ํ์ง ๋ฉํธ๋ฆญ์์ MetaGPT ๋๋น ์ฐ์ โ
โ โ ์์ฐ์ด + ํ๋ก๊ทธ๋๋ฐ ์ธ์ด ํ๋ ฅ์ ํต์ โ
โโโโโโโโโโโโโโโโผโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโค
โ MetaGPT โ SOP๋ก ์ํฌํ๋ก์ฐ ์ฒด๊ณํ, ์๋ฌ ๊ฐ์ โ
โ โ ๋์ ํต์ ๋น์ฉ (~$10/HumanEval task) โ
โโโโโโโโโโโโโโโโผโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโค
โ AutoGen โ ๊ฐ์ฅ ์ ์ฐํ ๋ํ ํจํด โ
โ โ SOP ์ธ ๋ค์ํ ์๋๋ฆฌ์ค ์ง์ โ
โโโโโโโโโโโโโโโโผโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโค
โ GPT-Engineer โ ๋จ์ผ ์์ด์ ํธ, Multi-Agent ๋๋น ์ฑ๋ฅ ์ ์กฐ โ
โ (Single) โ ๋ณต์กํ ํ์คํฌ์์ ํ๊ณ โ
โโโโโโโโโโโโโโโโดโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโ
ํต์ ๊ตฌ์กฐ๋ณ ๋ํ ์ฐ๊ตฌ
| ํต์ ๊ตฌ์กฐ | ๋ํ ์ฐ๊ตฌ | ํน์ง |
|---|---|---|
| Centralized | AutoGen Supervisor | ๋ช ํํ ์ ์ด, ๋ณ๋ชฉ ๊ฐ๋ฅ์ฑ |
| Decentralized | CAMEL | ๋์ ์ ์์ฑ, ์กฐ์ ๋ณต์ก์ฑ |
| Shared Pool | MetaGPT | ํจ์จ์ ๋ฉ์์ง ๊ด๋ฆฌ |
| Layered | DyLAN | ๋์ ์ํธ์์ฉ, ์กฐ๊ธฐ ์ข ๋ฃ ๋ฉ์ปค๋์ฆ |
๐ช Multi-Agent์ ์ฅ์
Single Agent ๋๋น ํต์ฌ ์ฅ์
1. ํฅ์๋ ๋ฌธ์ ํด๊ฒฐ ๋ฅ๋ ฅ
- ๋ณต์กํ ๋ฌธ์ ๋ฅผ ๊ด๋ฆฌ ๊ฐ๋ฅํ ํ์ ํ์คํฌ๋ก ๋ถํด
- ๊ฐ ์์ด์ ํธ๊ฐ ์ ๋ฌธ ๋ถ์ผ์ ์ง์ค
- ํ์ ๊ฐ ์ง์ ๊ฒฐํฉ ๊ฐ๋ฅ
2. ์ ํ์ฑ ๋ฐ ์ ๋ขฐ์ฑ ํฅ์
- ๊ต์ฐจ ๊ฒ์ฆ: ์ฌ๋ฌ ์์ด์ ํธ๊ฐ ์ ๋ณด ์ํธ ๊ฒ์ฆ
- Hallucination ๊ฐ์: ํ ๋ก , ๊ฒํ , ๊ฒ์ฆ์ ํตํ ์ค๋ฅ ์์
- ๋จ์ผ ์์ด์ ํธ ๋๋น ๋ ์ ํํ๊ณ ๊ฒฌ๊ณ ํ ์๋ฃจ์
3. ํ์ฅ์ฑ (Scalability)
- ์์คํ ์ ์ฒด ์ฌ์์ ์์ด ์์ด์ ํธ ์ถ๊ฐ ๊ฐ๋ฅ
- ๋น์ฆ๋์ค ์๊ตฌ ๋ณํ์ ์ ์ฐํ๊ฒ ๋์
- ์ํฌ๋ก๋ ์ฆ๊ฐ์ ์๋ก์ด ์์ด์ ํธ ํตํฉ ์ฉ์ด
4. ํจ์จ์ฑ (Efficiency)
- ์ํฌ๋ก๋ ๋ถ์ฐ์ผ๋ก ๋ ๋น ๋ฅธ ์คํ
- ๋ณ๋ชฉํ์ ๊ฐ์
- ๋ณ๋ ฌ ์ฒ๋ฆฌ ๊ฐ๋ฅ
5. ํ๋ณตํ๋ ฅ์ฑ (Resilience)
- ํ ์ปดํฌ๋ํธ ์คํจ ์์๋ ์์คํ ์ ์ง
- ํฌ์ค์ผ์ด, ๋ฌผ๋ฅ ๋ฑ ์์ ๊ฐ๋ ํ๊ฒฝ์ ์ ํฉ
6. ์ธ๊ฐ ํ๋ ์๋ฎฌ๋ ์ด์
- ์ ๋ต์ ์ถ๋ก ์๋ฎฌ๋ ์ด์ ์์ Multi-Agent๊ฐ ์ฐ์ (88% vs 50% ์ ํ๋)
- ์ ์ฑ ๊ฒฐ์ ์๋ฅผ ์ํ ์๋น ํ์์ ํ์ฉ ๊ฐ๋ฅ
์ ๋์ ๋น๊ต
| ์ธก๋ฉด | Single Agent | Multi-Agent |
|---|---|---|
| ์ธ๊ฐ ์ ๋ต์ ์ถ๋ก ์๋ฎฌ๋ ์ด์ | 50% ์ ํ๋ | 88% ์ ํ๋ |
| ๋ณต์กํ ํ์คํฌ ์ฒ๋ฆฌ | ์ฑ๋ฅ ์ ํ | ํจ๊ณผ์ ๋ถ์ |
| ์ ๋ณด ๊ฒ์ฆ | ๋ถ๊ฐ | ๊ต์ฐจ ๊ฒ์ฆ ๊ฐ๋ฅ |
โ ๏ธ ํ์ฌ ํ๊ณ์ ๋ฐ ๋ฏธํด๊ฒฐ ๊ณผ์
1. Hallucination (ํ๊ฐ) ๋ฌธ์
- Cascading Hallucinations: ํ ์์ด์ ํธ์ ์ค๋ฅ๊ฐ ์ฐ์์ ์ผ๋ก ํ๋
- Communication Hallucinations: ๋ถ์ ํํ ์ฌ์ค, ์คํด์, ์ค๋ํ๋ ์ถ๋ก ํฌํจ ๋ฉ์์ง ์์ฑ
- LLM ์์ฒด์ Factuality/Faithfulness Hallucination์ด Multi-Agent ํ๊ฒฝ์์ ์ฆํญ
2. ํ์ฅ์ฑ ๋ฐ ํจ์จ์ฑ ๋ฌธ์
- ์ถ๋ก ์๋: LLM์ autoregressive ํน์ฑ์ผ๋ก ๋๋ฆฐ ์ถ๋ก
- ๋ฐ๋ณต ์ฟผ๋ฆฌ: ๋ฉ๋ชจ๋ฆฌ ์ถ์ถ, ๊ณํ ์๋ฆฝ ๋ฑ ๊ฐ ํ๋๋ง๋ค ์ฌ๋ฌ ๋ฒ LLM ์ฟผ๋ฆฌ ํ์
- ํต์ ๋น์ฉ: MetaGPT, ChatDev ๋ฑ ๋๊ท๋ชจ ์์ด์ ํธ ๊ทธ๋ฃน์์ ๋์ ๋น์ฉ (~$10/task)
3. ์กฐ์ ๋ฐ ์ค์ผ์คํธ๋ ์ด์
- Agent Orchestration: ๋ค์ํ ์์ด์ ํธ ๊ด๋ฆฌ์ ๋ณต์ก์ฑ
- ๋ถ์ฐํ ํจ๋ฌ๋ค์์์ ์์ด์ ํธ ์ ์ฆ๊ฐ ์ ํจ์จ์ฑ ์ ํ
- ๋ช ํํ ๊ณํ ์๋ ์์ ๋ก์ด ํต์ ์ ํผ๋ ๋ฐ์
4. ํ๊ฐ ๋ฐ ๋ฒค์น๋งํฌ ๋ถ์ฌ
- ํ์คํ๋ ๋ฒค์น๋งํฌ ๋ถ์กฑ: ๋์ผ ์ข ๋ฅ์ LLM-MAS ๋น๊ต ๋ถ๊ฐ
- ๊ทธ๋ฃน ํ๋ ๊ฐ๊ด์ ๋ฉํธ๋ฆญ ๋ถ์ฌ: ์ง๋จ ์์ค์ ์์ธํ ํ๊ฐ ์งํ ๋ฏธํ๋ฆฝ
- ์ ์ ์ธ๊ฐ ์ฃผ์ ๊ธฐ๋ฐ ํ๊ฐ์ ํ์ฅ์ฑ ํ๊ณ
5. ์กฐ์ง ์ค๊ณ ๋ฌธ์
- ๊ธฐ๋ณธ ๋ชจ๋ธ ์ฑ๋ฅ ํฅ์๋ง์ผ๋ก๋ ๋ชจ๋ ์ด์ ํด๊ฒฐ ๋ถ๊ฐ
- ์กฐ์ง ๊ตฌ์กฐ ๊ฒฐํจ: ์ ๊ตํ ๊ฐ์ธ๋ค์ ์กฐ์ง๋ ๊ตฌ์กฐ ๊ฒฐํจ ์ ์คํจ ๊ฐ๋ฅ
- ๊ฐ๋ณ ์์ด์ ํธ ํ๊ณ๋ณด๋ค ์กฐ์ง ์ค๊ณ์ ์กฐ์ ์ ๋ฌธ์
6. ์์ ์ฑ ๋ฌธ์
- Multi-Agent ์๋๋ฆฌ์ค์์ Emergent Risks ๋ฐ์ ๊ฐ๋ฅ
- ์ ๋์ ์ ๋ ฅ์ ๋ํ ๊ฒฌ๊ณ ์ฑ ๋ถ์กฑ
- ํธํฅ ์ํ ๋ฐ ์ ์ฑ ์ค์ ํ ์คํธ ๋ถ์กฑ
7. ๋๋ฒ๊น ์ด๋ ค์
- ์ถ๋ ฅ ์คํจ ์ ์ด๋ค ์์ด์ ํธ์ ๋ฌธ์ ์ธ์ง ๋ถ๋ช ํ
- 3-์์ด์ ํธ ์ฒด์ธ์ด ๋น์ฉ๊ณผ ์ง์ฐ 3๋ฐฐ ์ฆ๊ฐ ๊ฐ๋ฅ
๐ฎ ํฅํ ์ฐ๊ตฌ ๋ฐฉํฅ
1. ํ๊ฐ ๋ฐฉ๋ฒ๋ก ๊ฐ์
- Agent-as-a-Judge: LLM ๊ธฐ๋ฐ ์์ด์ ํธ๋ฅผ ํ๊ฐ์๋ก ํ์ฉ
- ๋ ํ์ค์ ์ด๊ณ ํ์ฅ ๊ฐ๋ฅํ ํ๊ฐ ์ ๊ทผ๋ฒ ๊ฐ๋ฐ
- ์๋ํ๋ ํ๊ฐ ์์คํ ๊ตฌ์ถ
2. ์์ ์ฑ ๋ฒค์น๋งํฌ ๊ฐ๋ฐ
- Multi-Agent ์๋๋ฆฌ์ค ํนํ ์์ ์ฑ ํ ์คํธ
- ์ค์ ์๋๋ฆฌ์ค ์๋ฎฌ๋ ์ด์
- AgentHarm ๋ฑ ์ด๊ธฐ ๋ ธ๋ ฅ ํ์ฅ
3. ํจ์จ์ฑ ์ต์ ํ
- ์ถ๋ก ์๋ ๊ฐ์
- ํต์ ๋น์ฉ ์ ๊ฐ
- ์กฐ๊ธฐ ์ข ๋ฃ ๋ฉ์ปค๋์ฆ (DyLAN ๋ฑ)
4. ๊ธฐ์ ํนํ ๊ณผ์ ํด๊ฒฐ
- ์ญํ ๊ธฐ๋ฐ ๋ฐ์ดํฐ ์ ๊ทผ
- ์ ๋ขฐ์ฑ ๋ณด์ฅ
- ๋์ /์ฅ๊ธฐ ์ํธ์์ฉ
- ๊ท์ ์ค์
๐ ๊ด๋ จ ํต์ฌ ๋ ผ๋ฌธ
Multi-Agent ํ๋ ์์ํฌ
- AutoGen: Wu et al. – Microsoft์ Multi-Agent ๋ํ ํ๋ ์์ํฌ
- MetaGPT: Hong et al. – SOP ๊ธฐ๋ฐ ์ํํธ์จ์ด ๊ฐ๋ฐ ํ๋ ์์ํฌ
- ChatDev: Qian et al. – ๊ฐ์ ์ํํธ์จ์ด ํ์ฌ ์๋ฎฌ๋ ์ด์
- CAMEL: Li et al. – Role-playing ๊ธฐ๋ฐ ์ด๊ธฐ ํ๋ ์์ํฌ
World Simulation
- Generative Agents: Park et al. – 25๋ช ์์ด์ ํธ์ ์ฌํ ์๋ฎฌ๋ ์ด์
Agent Architecture
- ReAct: Yao et al. – Reasoning + Acting ํตํฉ
- Reflexion: Shinn et al. – ์๊ธฐ ์ฑ์ฐฐ ๊ธฐ๋ฐ ํ์ต
Communication
- DyLAN: Liu et al. – Dynamic LLM-Agent Network
๊ด๋ จ ์๋ฒ ์ด
- A Survey on Large Language Model based Autonomous Agents (2023)
- A survey on LLM-based multi-agent systems: workflow, infrastructure, and challenges
๐ป ์ค๋ฌด ์ ์ฉ ํฌ์ธํธ
์์คํ ์ค๊ณ ์ ๊ณ ๋ ค์ฌํญ
1. ํ๋ ์์ํฌ ์ ํ ๊ฐ์ด๋
| ์ฌ์ฉ ์ฌ๋ก | ๊ถ์ฅ ํ๋ ์์ํฌ |
|---|---|
| ๊ธฐ์ ์ ํ๋ฆฌ์ผ์ด์ | AutoGen, LangGraph |
| ์ํํธ์จ์ด ๊ฐ๋ฐ | MetaGPT, ChatDev |
| ์ฐ๊ตฌ/์คํ | CAMEL |
| ์ ์ฐํ ๋ํ | AutoGen |
2. ํต์ ๊ตฌ์กฐ ์ค๊ณ
- ์ค์์ง์คํ: ๋ช ํํ ์ ์ด ํ์ ์ (๋ณ๋ชฉ ์ฃผ์)
- ๋ถ์ฐํ: ๋์ ์ ์์ฑ ํ์ ์ (์กฐ์ ๋ณต์ก์ฑ ์ฃผ์)
- ๊ณต์ ๋ฉ์์ง ํ: ํจ์จ์ ๋ฉ์์ง ๊ด๋ฆฌ ํ์ ์
3. ์์ด์ ํธ ํ๋กํ์ผ๋ง
- ์ญํ ๊ณผ ์ฑ ์ ๋ช ํํ ์ ์
- ์ ์ ํ ์์ ์์ด์ ํธ ์ ์ง (๊ณผ๋ํ ์์ด์ ํธ๋ ๋น์ฉ ์ฆ๊ฐ)
- ๋์ ์์ด์ ํธ ์์ฑ ๊ณ ๋ ค
4. ๋น์ฉ ์ต์ ํ
- ์ง๋ ฌ ๋ฉ์์ง ์ต์ํ
- ์กฐ๊ธฐ ์ข ๋ฃ ๋ฉ์ปค๋์ฆ ๋์
- ์์ด์ ํธ ์์ ํต์ ๋ณต์ก๋ ๊ท ํ
5. ์ค๋ฅ ์ฒ๋ฆฌ
- ๊ต์ฐจ ๊ฒ์ฆ ๋ฉ์ปค๋์ฆ ๊ตฌํ
- Hallucination ๊ฐ์ง ๋ก์ง ์ถ๊ฐ
- ํด๋ฐฑ ์ ๋ต ์๋ฆฝ
6. ํ๊ฐ ์ ๋ต
- SWE-bench, WebArena, AgentBench ๋ฑ ํ์ค ๋ฒค์น๋งํฌ ํ์ฉ
- TheAgentCompany ๊ฐ์ ํ์ค์ ํ์คํฌ ๋ฒค์น๋งํฌ ๊ณ ๋ ค
- ์์ฒด ํ๊ฐ ๋ฉํธ๋ฆญ ์ ์
์ค๋ฌด ์ฒดํฌ๋ฆฌ์คํธ
โก ๋ฌธ์ ๊ฐ Multi-Agent๊ฐ ํ์ํ ๋ณต์ก์ฑ์ธ๊ฐ?
โก ์ ์ ํ ํ๋ ์์ํฌ๋ฅผ ์ ํํ๋๊ฐ?
โก ์์ด์ ํธ ์ญํ ์ด ๋ช
ํํ ์ ์๋์๋๊ฐ?
โก ํต์ ๊ตฌ์กฐ๊ฐ ์๊ตฌ์ฌํญ์ ๋ง๋๊ฐ?
โก ๋น์ฉ ์ถ์ ์ ์๋ฃํ๋๊ฐ?
โก ์ค๋ฅ ์ฒ๋ฆฌ ์ ๋ต์ด ์๋๊ฐ?
โก ํ๊ฐ ๋ฐฉ๋ฒ์ด ์ ์๋์๋๊ฐ?
โก ํ์ฅ์ฑ์ ๊ณ ๋ คํ๋๊ฐ?
๐ท๏ธ Tags
#AIAgent #MultiAgent #LLM #Survey #IJCAI2024 #AutoGen #MetaGPT #ChatDev #CAMEL #AgentCommunication #AgentProfiling #WorldSimulation #ProblemSolving #SoftwareDevelopment #AI์์คํ ์ค๊ณ #๋ฉํฐ์์ด์ ํธ #๋๊ท๋ชจ์ธ์ด๋ชจ๋ธ
๐ ์ฐธ๊ณ ์๋ฃ
Last Updated: 2024
Note: ์ด ๋
ธํธ๋ ์๋ฒ ์ด ๋
ผ๋ฌธ์ ํต์ฌ ๋ด์ฉ์ ํ์ต ๋ชฉ์ ์ผ๋ก ์ ๋ฆฌํ ๊ฒ์
๋๋ค.