[AI Paper] ๐ ToolLLM: Facilitating LLMs to Master 16000+ APIs
๐ ToolLLM: Facilitating LLMs to Master 16000+ APIs
๐ ๋ฉํ ์ ๋ณด
| ํญ๋ชฉ | ๋ด์ฉ |
|---|---|
| ๋ ผ๋ฌธ ์ ๋ชฉ | ToolLLM: Facilitating Large Language Models to Master 16000+ Real-world APIs |
| ๋ฐํ | ICLR 2024 (Spotlight) |
| ์ ์ | Yujia Qin, Shihao Liang, Yining Ye, Kunlun Zhu ์ธ ๋ค์ |
| ์์ | Tsinghua University, ModelBest Inc., Renmin University of China, Yale University, WeChat AI (Tencent Inc.), Zhihu Inc. |
| arXiv | 2307.16789 |
| GitHub | OpenBMB/ToolBench |
| OpenReview | dHng2O0Jjr |
๐ฏ ํ์ค ์์ฝ
16,000๊ฐ ์ด์์ ์ค์ API๋ฅผ ํ์ฉํ ์ ์๋๋ก ์คํ์์ค LLM์ ๋๊ตฌ ์ฌ์ฉ ๋ฅ๋ ฅ์ ํฅ์์ํค๋ ํ๋ ์์ํฌ๋ก, ToolBench ๋ฐ์ดํฐ์ ๊ตฌ์ถ, DFSDT ์ถ๋ก ์๊ณ ๋ฆฌ์ฆ, ToolEval ์๋ ํ๊ฐ ์์คํ ์ ์ ์ํ์ฌ ToolLLaMA๊ฐ ChatGPT์ ์ ์ฌํ ๋๊ตฌ ํ์ฉ ์ฑ๋ฅ์ ๋ฌ์ฑํจ.
๐ ์ฐ๊ตฌ ๋ฐฐ๊ฒฝ ๋ฐ ๋๊ธฐ
๋ฌธ์ ์ธ์
- ์คํ์์ค LLM์ ํ๊ณ: LLaMA ๋ฑ ์คํ์์ค ๋ชจ๋ธ๋ค์ ๋๊ตฌ ์ฌ์ฉ(Tool-use) ๋ฅ๋ ฅ์ด ํ์ ํ ๋ถ์กฑ
- ๊ธฐ์กด Instruction Tuning์ ํ๊ณ: ๋๋ถ๋ถ ๊ธฐ๋ณธ์ ์ธ ์ธ์ด ์์ ์๋ง ์ง์คํ๊ณ ๋๊ตฌ ์ฌ์ฉ ๋๋ฉ์ธ์ ๋ฌด์
- ํ์ํ ๋ชจ๋ธ๊ณผ์ ๊ฒฉ์ฐจ: ChatGPT, GPT-4 ๋ฑ SOTA ํ์ํ ๋ชจ๋ธ๋ค์ ๋ฐ์ด๋ ๋๊ตฌ ์ฌ์ฉ ๋ฅ๋ ฅ ๋ณด์
๊ธฐ์กด ์ฐ๊ตฌ์ ๋ฌธ์ ์
- ์ ํ๋ API: ์ค์ API(์: REST API)๋ฅผ ํฌํจํ์ง ์๊ฑฐ๋, ๋ค์์ฑ์ด ๋ถ์กฑํ ์์์ API๋ง ๊ณ ๋ ค
- ์ ํ๋ ์๋๋ฆฌ์ค: ๋จ์ํ ๋จ์ผ ๋๊ตฌ ์ฌ์ฉ ์๋๋ฆฌ์ค์ ๊ตญํ
- ์ด๋ฑํ ๊ณํ ๋ฐ ์ถ๋ก : ๋ณต์กํ ๋ค๋จ๊ณ ์ถ๋ก ๋ฅ๋ ฅ ๋ถ์กฑ
์ฐ๊ตฌ ๋ชฉํ
- ์คํ์์ค LLM์ด 16,000๊ฐ ์ด์์ ์ค์ API๋ฅผ ๋ง์คํฐํ ์ ์๋๋ก ์ง์
- ๋ฐ์ดํฐ ๊ตฌ์ถ๋ถํฐ ๋ชจ๋ธ ํ๋ จ, ํ๊ฐ๊น์ง ์ข ํฉ์ ์ธ ๋๊ตฌ ์ฌ์ฉ ํ๋ ์์ํฌ ์ ๊ณต
๐ก ํต์ฌ ์์ด๋์ด
1. ToolBench ๋ฐ์ดํฐ์
ToolBench๋ ๋๊ตฌ ์ฌ์ฉ์ ์ํ ๋๊ท๋ชจ Instruction Tuning ๋ฐ์ดํฐ์ ์ผ๋ก, ChatGPT๋ฅผ ํ์ฉํด ์๋ ๊ตฌ์ถ๋จ.
3๋จ๊ณ ๊ตฌ์ถ ๊ณผ์
โโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโ
โ ToolBench ๋ฐ์ดํฐ์
๊ตฌ์ถ โ
โโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโค
โ 1๋จ๊ณ: API ์์ง โ
โ โโโ RapidAPI Hub์์ 16,464๊ฐ ์ค์ RESTful API ์์ง โ
โ โโโ 49๊ฐ ์นดํ
๊ณ ๋ฆฌ (๊ธ์ต, ์์
๋ฏธ๋์ด, ๋ ์จ, ์์
๋ฑ) โ
โ โ
โ 2๋จ๊ณ: ๋ช
๋ น์ด ์์ฑ โ
โ โโโ ChatGPT๋ฅผ ํ์ฉํด ๋ค์ํ ๋ช
๋ น์ด ์๋ ์์ฑ โ
โ โโโ Single-tool ์๋๋ฆฌ์ค โ
โ โโโ Multi-tool ์๋๋ฆฌ์ค โ
โ โโโ Intra-category (๋์ผ ์นดํ
๊ณ ๋ฆฌ ๋ด ๋ค์ค ๋๊ตฌ) โ
โ โโโ Intra-collection (๋์ผ ์ปฌ๋ ์
๋ด ๋ค์ค ๋๊ตฌ) โ
โ โ
โ 3๋จ๊ณ: ์๋ฃจ์
๊ฒฝ๋ก ์ฃผ์ โ
โ โโโ DFSDT ์๊ณ ๋ฆฌ์ฆ์ผ๋ก ๋ณต์กํ ๋ช
๋ น์ด์ ๋ํ ํด๋ต ๊ฒฝ๋ก ์์ฑ โ
โโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโ
๋ฐ์ดํฐ์ ๊ท๋ชจ
- API ์: 16,464๊ฐ
- ์นดํ ๊ณ ๋ฆฌ: 49๊ฐ
- (๋ช ๋ น์ด, ์๋ฃจ์ ๊ฒฝ๋ก) ์: 126,486๊ฐ
2. DFSDT (Depth-First Search-based Decision Tree)
LLM์ ๊ณํ ๋ฐ ์ถ๋ก ๋ฅ๋ ฅ์ ๊ฐํํ๊ธฐ ์ํ ์๋ก์ด ์์ฌ๊ฒฐ์ ํธ๋ฆฌ ์๊ณ ๋ฆฌ์ฆ.
DFSDT vs ReACT ๋น๊ต
| ํน์ฑ | ReACT | DFSDT |
|---|---|---|
| ํ์ ๋ฐฉ์ | ๋จ์ผ ๊ฒฝ๋ก | ๋ค์ค ๊ฒฝ๋ก ํ์ |
| ์ค๋ฅ ์ฒ๋ฆฌ | ์ค๋ฅ ์ ์ค๋จ | ๋ฐฑํธ๋ํน์ผ๋ก ๋ณต๊ตฌ |
| ํ์ ๊ณต๊ฐ | ์ ํ์ | ํ์ฅ๋ ํ์ ๊ณต๊ฐ |
| ๋ณต์กํ ์์ | ๋ฎ์ ์ฑ๊ณต๋ฅ | ๋์ ์ฑ๊ณต๋ฅ |
DFSDT ์๋ ์๋ฆฌ
[Root: ์ฌ์ฉ์ ๋ช
๋ น์ด]
โ
โโโโโโโโโโโโโโผโโโโโโโโโโโโโ
โผ โผ โผ
[๋
ธ๋ 1] [๋
ธ๋ 2] [๋
ธ๋ 3]
API ํธ์ถ A API ํธ์ถ B API ํธ์ถ C
โ โ โ
โโโโโโดโโโโโ ์คํจโํฌ๊ธฐ โโโโโโดโโโโโ
โผ โผ โผ โผ
[์ฑ๊ณต] [์คํจ] [๋
ธ๋ 3-1] [๋
ธ๋ 3-2]
โ ๋ฐฑํธ๋ํน โ โ
โผ โ [์ฑ๊ณต] [์คํจ]
[์๋ฃ] ์ ๊ฒฝ๋ก ํ์ โ ๋ฐฑํธ๋ํน
[์๋ฃ]
ํต์ฌ ๋ฉ์ปค๋์ฆ
- ๋ค์ค ์ถ๋ก ๊ฒฝ๋ก ํ๊ฐ: ์ฌ๋ฌ ์ถ๋ก ๊ฒฝ๋ก๋ฅผ ๋์์ ๊ณ ๋ ค
- ์ ํ์ ์งํ/ํํด: ์ ๋งํ ๊ฒฝ๋ก๋ก ์งํํ๊ฑฐ๋, ๋งํ ๊ฒฝ๋ก์์ ํํด
- “Finish by Giving Up” ํจ์: ํ์ฌ ๋ ธ๋ ํฌ๊ธฐ ํ ์ ๋ ธ๋ ํ์ฅ
- DFS ์ ํธ ์ด์ : ์ ํจํ ๊ฒฝ๋ก ํ๋๋ง ์ฐพ์ผ๋ฉด ์ฃผ์ ์๋ฃ (BFS๋ณด๋ค API ํธ์ถ ๋น์ฉ ์ ๊ฐ)
3. ToolEval ํ๊ฐ ์์คํ
ChatGPT ๊ธฐ๋ฐ ์๋ ํ๊ฐ ์์คํ ์ผ๋ก, AlpacaEval์ ๋ฐฉ์์ ๋ฐ๋ฆ.
ํ๊ฐ ์งํ
| ์งํ | ์ค๋ช | ์ธก์ ๋ฐฉ์ |
|---|---|---|
| Pass Rate | ๋ช ๋ น์ด ์ฑ๊ณต์ ์๋ฃ ๋น์จ | ์ ํ๋ API ํธ์ถ ๋ด ์์ ์๋ฃ ์ฌ๋ถ |
| Win Rate | ์๋ฃจ์ ๊ฒฝ๋ก ์ ํธ๋ | ๋ ์๋ฃจ์ ๋น๊ต ์ ์ ํธ๋๋ ๋น์จ |
Pass Rate ํ๊ฐ ๊ธฐ์ค
- Pass: ์์ ์ฑ๊ณต์ ์๋ฃ
- Fail: ์์ ์คํจ
- Unsure: ํ๋จ ๋ถ๊ฐ
์ ๋ขฐ๋ ๊ฒ์ฆ
- Pass Rate: ์ธ๊ฐ ํ๊ฐ์์ 87.1% ์ผ์น
- Win Rate: ์ธ๊ฐ ํ๊ฐ์์ 80.3% ์ผ์น
๐๏ธ ์ํคํ ์ฒ / ๋ฐฉ๋ฒ๋ก
์ ์ฒด ์์คํ ์ํคํ ์ฒ
โโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโ
โ ToolLLM Framework โ
โโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโค
โ โ
โ โโโโโโโโโโโโโโโโ โโโโโโโโโโโโโโโโ โโโโโโโโโโโโโโโโ โ
โ โ ์ฌ์ฉ์ ๋ช
๋ น์ด โโโโโถโ API Retriever โโโโโถโ ToolLLaMA โ โ
โ โโโโโโโโโโโโโโโโ โโโโโโโโโโโโโโโโ โโโโโโโโโโโโโโโโ โ
โ โ โ โ โ
โ โ ๊ด๋ จ API ์ถ์ฒ DFSDT ์ถ๋ก โ
โ โ โ โ โ
โ โผ โผ โผ โ
โ โโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโ โ
โ โ API ์คํ ํ๊ฒฝ โ โ
โ โ โโโโโโโโโโโ โโโโโโโโโโโ โโโโโโโโโโโ โโโโโโโโโโโ โ โ
โ โ โ API 1 โ โ API 2 โ โ API 3 โ โ ... โ โ โ
โ โ โ(RapidAPI)โ โ(RapidAPI)โ โ(RapidAPI)โ โ(16,464๊ฐ)โ โ โ
โ โ โโโโโโโโโโโ โโโโโโโโโโโ โโโโโโโโโโโ โโโโโโโโโโโ โ โ
โ โโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโ โ
โ โ โ
โ โผ โ
โ โโโโโโโโโโโโโโโโ โ
โ โ ์ต์ข
์๋ต โ โ
โ โโโโโโโโโโโโโโโโ โ
โ โ
โโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโ
API Retriever
- ๋ชฉ์ : ๋๊ท๋ชจ API ํ์์ ๊ด๋ จ API ์๋ ์ ํ
- ํ์ต: Neural API Retriever ํ๋ จ
- ๊ธฐ๋ฅ: ๋ช ๋ น์ด ์ ๋ ฅ ์ ๊ด๋ จ API ์ธํธ ์ถ์ฒ
- ์ฑ๋ฅ: ์ค์ ์ฌ์ฉ API์ ๋์ ์ ๋ฐ๋๋ก ์ผ์น
ToolLLaMA ํ๋ จ
- ๋ฒ ์ด์ค ๋ชจ๋ธ: LLaMA
- ํ๋ จ ๋ฐ์ดํฐ: ToolBench 126,486๊ฐ (๋ช ๋ น์ด, ์๋ฃจ์ ๊ฒฝ๋ก) ์
- ๋ฐฉ์: Supervised Fine-tuning (SFT)
- ๊ต์ฌ ๋ชจ๋ธ: ChatGPT (gpt-3.5-turbo-16k)
๐ ์คํ ๋ฐ ๊ฒฐ๊ณผ
์ฃผ์ ์ฑ๋ฅ ๋น๊ต
| ๋ชจ๋ธ | Pass Rate | Win Rate |
|---|---|---|
| Text-Davinci-003 | 22.6% | 16.5% |
| Claude-2 | 34.4% | 40.8% |
| ToolLLaMA + DFSDT | 66.7% | 67.3% |
| ChatGPT | ~70% | ~70% |
| GPT-4 + DFSDT | ์ต๊ณ ์ฑ๋ฅ | ์ต๊ณ ์ฑ๋ฅ |
DFSDT ํจ๊ณผ
๋ชจ๋ ํ ์คํธ๋ LLM์์ DFSDT๋ ReACT ๋๋น Pass Rate์ Win Rate ๋ชจ๋์์ ์ ์๋ฏธํ ์ฑ๋ฅ ํฅ์์ ๋ณด์.
์ผ๋ฐํ ์ฑ๋ฅ
| ์๋๋ฆฌ์ค | ์ค๋ช | ToolLLaMA + DFSDT Pass Rate |
|---|---|---|
| I1-Inst. | ์๋ก์ด ๋ช ๋ น์ด (๊ธฐ์กด ๋๊ตฌ) | 77.0% |
| I1-Tool | ์๋ก์ด ๋๊ตฌ (๊ธฐ์กด ์นดํ ๊ณ ๋ฆฌ) | 62.0% |
| I1-Cat. | ์๋ก์ด ์นดํ ๊ณ ๋ฆฌ | 58.0% |
| I2-Inst. | ์ ๋ช ๋ น์ด + ์ ๋๊ตฌ | 52.0% |
| I2-Cat. | ์ ๋ช ๋ น์ด + ์ ์นดํ ๊ณ ๋ฆฌ | 48.0% |
| I3-Inst. | ๊ฐ์ฅ ์ด๋ ค์ด ์๋๋ฆฌ์ค | 45.0% |
OOD (Out-of-Distribution) ํ ์คํธ
- APIBench ๋ฒค์น๋งํฌ์์ ToolLLaMA๋ ํ๋ จ์ ์ฌ์ฉ๋์ง ์์ API์ ๋ช ๋ น์ด์๋ ๋ถ๊ตฌํ๊ณ , APIBench ์ ์ฉ ๋ชจ๋ธ์ธ Gorilla์ ๋๋ฑํ ์ฑ๋ฅ ๋ฌ์ฑ
๐ช ๊ฐ์ ๋ฐ ๊ธฐ์ฌ
1. ๋๊ท๋ชจ ๊ณ ํ์ง ๋ฐ์ดํฐ์
- 16,464๊ฐ ์ค์ API ํฌํจ (๊ธฐ์กด ์ฐ๊ตฌ ๋๋น ์๋์ ๊ท๋ชจ)
- ์๋ํ๋ ๋ฐ์ดํฐ ๊ตฌ์ถ ํ์ดํ๋ผ์ธ (์ต์ํ์ ์ธ๊ฐ ๊ฐ๋ )
- ๋ค์ํ ์๋๋ฆฌ์ค (๋จ์ผ/๋ค์ค ๋๊ตฌ) ์ปค๋ฒ
2. ํ์ ์ ์ธ ์ถ๋ก ์๊ณ ๋ฆฌ์ฆ (DFSDT)
- ๊ธฐ์กด ReACT์ ํ๊ณ ๊ทน๋ณต
- ๋ณต์กํ ๋ค๋จ๊ณ ์ถ๋ก ๊ฐ๋ฅ
- ๋ฐฑํธ๋ํน์ ํตํ ์ค๋ฅ ๋ณต๊ตฌ ๋ฉ์ปค๋์ฆ
3. ํ์คํ๋ ํ๊ฐ ์ฒด๊ณ (ToolEval)
- ์๋ํ๋ ํ๊ฐ ์์คํ
- ์ธ๊ฐ ํ๊ฐ์ ๋์ ์๊ด๊ด๊ณ (87.1%, 80.3%)
- ์ฌํ ๊ฐ๋ฅํ ๋ฒค์น๋งํน
4. ์คํ์์ค ์ํ๊ณ ๊ธฐ์ฌ
- ๋ชจ๋ ์ฝ๋, ๋ฐ์ดํฐ, ๋ชจ๋ธ ๊ณต๊ฐ
- ์คํ์์ค ๋ชจ๋ธ(LLaMA) ๊ธฐ๋ฐ์ผ๋ก ChatGPT๊ธ ๋๊ตฌ ์ฌ์ฉ ๋ฅ๋ ฅ ๋ฌ์ฑ
โ ๏ธ ํ๊ณ์
1. ํฉ์ฑ ๋ฐ์ดํฐ ์์กด์ฑ
- ChatGPT๋ฅผ ํตํ ํฉ์ฑ ๋ฐ์ดํฐ ์์ฑ์ผ๋ก ์ํํ์ ํ๋น์ฑ ์ ํ
- ์ค์ ์ฌ์ฉ์ ๋ก๊ทธ ๊ธฐ๋ฐ ๋ฐ์ดํฐ ๋ถ์ฌ
2. ๋ณต์กํ ๋ค์ค ๋๊ตฌ ์ํฌํ๋ก์ฐ
- ๋๋ถ๋ถ ๋จ์ผ ๋๊ตฌ ๋๋ ์์ฐจ์ ๋ค์ค ๋๊ตฌ ์ฌ์ฉ์ ์ง์ค
- ํ์ดํ๋ผ์ธ ์์ค์ ๋ค์ค ๋ผ์ด๋ ์ํฌํ๋ก์ฐ๋ ์ถฉ๋ถํ ํ๊ตฌ๋์ง ์์
3. ํ๊ฐ ๋ชจํธ์ฑ
- ์ฌ๋ฌ ์ ํจํ ๋๊ตฌ ์ฌ์ฉ ์ ๋ต ์กด์ฌ
- ํ์์ ์ ํ์ฑ์ ๋ชจํธํจ์ผ๋ก ์งํ ํ์คํ ์ด๋ ค์
4. ๋์ API ํ๊ฒฝ ๋์
- ์ธ๋ถ ๋๊ตฌ ๋ชฉ๋ก์ด ์งํํจ์ ๋ฐ๋ผ ์ง์์ ์ธ ์ ์ ํ์
- API ๋ณ๊ฒฝ ์ ์ฌํ๋ จ ํ์
5. ๋๊ตฌ ๊ฒ์์ ์ ํ์ฑ
- ๋๊ท๋ชจ API ํ์์ ์ ํํ ๋๊ตฌ ๊ฒ์์ด ์ฌ์ ํ ๋์ ์
- LLM์ ์ ํ๋ ๋๊ตฌ ๊ธฐ๋ฅ ์ดํด
๐ ๊ด๋ จ ๋ ผ๋ฌธ
์ ํ ์ฐ๊ตฌ
| ๋ ผ๋ฌธ | ์ค๋ช |
|---|---|
| Toolformer (Schick et al., 2023) | API ํธ์ถ ์์ /๋ฐฉ๋ฒ ํ์ต ๋ชจ๋ธ |
| API-Bank | 73๊ฐ API ๋๊ตฌ ํฌํจ ํ๊ฐ ๋ฒค์น๋งํฌ |
| Gorilla | API ํธ์ถ ํนํ LLM |
| ReACT | Reasoning + Acting ํตํฉ ํ๋ ์์ํฌ |
ํ์ ์ฐ๊ตฌ
| ๋ ผ๋ฌธ | ์ค๋ช |
|---|---|
| AnyTool (2024) | ์๊ธฐ ๋ฐ์ฑ์ , ๊ณ์ธต์ ์์ด์ ํธ |
| PEToolLLM (Xu et al., 2025) | ๊ฐ์ธํ๋ ๋๊ตฌ ํ์ต |
| TL-Training (Ye et al., 2024) | ์์ -ํน์ฑ ๊ธฐ๋ฐ ๋๊ตฌ ํ์ต ํ๋ ์์ํฌ |
| ToolQA | ๋๊ตฌ ์ฌ์ฉ QA ํ๊ฐ ๋ฐ์ดํฐ์ |
๊ด๋ จ ์๋ฒ ์ด
- LLM-Based Agents for Tool Learning: A Survey (2025, Springer)
๐ป ์ค๋ฌด ์ ์ฉ ํฌ์ธํธ
1. API ํตํฉ ์์ด์ ํธ ๊ฐ๋ฐ
# ToolLLM ์คํ์ผ์ API ํธ์ถ ํจํด
1. ์ฌ์ฉ์ ๋ช
๋ น์ด ๋ถ์
2. API Retriever๋ก ๊ด๋ จ API ์ ํ
3. DFSDT๋ก ๋ค๋จ๊ณ ์ถ๋ก ์คํ
4. API ์คํ ๋ฐ ๊ฒฐ๊ณผ ํตํฉ
5. ์ต์ข
์๋ต ์์ฑ
2. ๋๊ตฌ ์ฌ์ฉ ๋ฐ์ดํฐ์ ๊ตฌ์ถ
- RapidAPI ๊ฐ์ API ๋ง์ผํ๋ ์ด์ค ํ์ฉ
- ChatGPT/GPT-4๋ก ๋ช ๋ น์ด ์๋ ์์ฑ
- DFSDT๋ก ๋ณต์กํ ์๋ฃจ์ ๊ฒฝ๋ก ์ฃผ์
3. ํ๊ฐ ์์คํ ๊ตฌ์ถ
- Pass Rate: ์์ ์๋ฃ ์ฌ๋ถ ์ธก์
- Win Rate: A/B ํ ์คํธ ์คํ์ผ ๋น๊ต ํ๊ฐ
- LLM ๊ธฐ๋ฐ ์๋ ํ๊ฐ ํ์ดํ๋ผ์ธ
4. ํ๋ก๋์ ๊ณ ๋ ค์ฌํญ
- API ๊ฒ์ ์ต์ ํ: ๋๊ท๋ชจ API ํ์์ ๋น ๋ฅธ ๊ฒ์
- ์ค๋ฅ ์ฒ๋ฆฌ: DFSDT์ ๋ฐฑํธ๋ํน ๋ฉ์ปค๋์ฆ ๊ตฌํ
- API ๋ฒ์ ๊ด๋ฆฌ: ๋์ API ๋ณ๊ฒฝ์ ๋์
5. ํ์ฉ ๊ฐ๋ฅํ ๋๋ฉ์ธ
- ๊ณ ๊ฐ ์๋น์ค: ๋ค์ํ ์ธ๋ถ ์๋น์ค API ์ฐ๋
- ์ ๋ฌด ์๋ํ: ๋ณต์กํ ๋ฉํฐ์คํ ์ํฌํ๋ก์ฐ
- ๋ฐ์ดํฐ ์์ง/๋ถ์: ์ฌ๋ฌ API ์กฐํฉ ๋ฐ์ดํฐ ํ์ดํ๋ผ์ธ
๐ท๏ธ Tags
#ToolLLM #ToolBench #DFSDT #ToolEval #API #Tool-Use #LLM #Agent #ICLR2024 #OpenBMB #LLaMA #ChatGPT #ReACT #Instruction-Tuning #RapidAPI #Neural-Retriever #Decision-Tree #Multi-Tool #AI-Agent #Function-Calling