🏠︎ | #️⃣ 💾 📃 🔗 | ✏️ 🗑

(번역) AI 에이전트를 이해하지 못합니다.

모든 곳에 있습니다. 우리 모두는 하나를 만들고 있습니다. 영업, 인사, 재무 등의 분야에서 최고의 AI 에이전트를 구축하고 있다고 주장하는 기업들로부터 매일 엄청난 가치 평가를 받고 있습니다.... 하지만 AI 에이전트란 무엇일까요? 왜 중요한가요?

그리고 왜 대부분의 엔지니어와 제품 리더들이 이를 이해하지 못하는 것일까요?

저는 AutoGPT가 출시되던 날을 분명히 기억합니다. 프로젝트를 복제하고 명령을 실행했더니 이런 화면이 나왔어요:

정말 놀라웠어요. 저는 능동적이고 자율적인 머신을 보고 있었죠.

저는 이런 유형의 소프트웨어에 집착하게 되었습니다. 처음에는 ChatGPT와 같이 기계와 대화할 수 있을 뿐만 아니라 기계가 저를 대신해 조치를 취하도록 할 수 있었기 때문에 저는 이를 "부작용이 있는 채팅"이라고 불렀습니다.

AutoGPT는 최초의 AI 에이전트였습니다.

AI 에이전트를 이해하려면 먼저 기존 소프트웨어를 이해해야 합니다. 2023년 4월, 그리고 GPT-4가 출시되기 전까지는 사용자가 애플리케이션이 능동적으로 자신을 위해 조치를 취해줄 것이라고 기대하는 것은 흔하지 않았습니다.

사용자는 매우 명시적인 사용자 인터페이스를 통해 웹 애플리케이션과 상호 작용했습니다.

그리고 이것은 훌륭했습니다. 하지만 사용자 인터페이스에서 같은 작업을 반복적으로 수행하는 데 많은 시간을 소비하기도 했습니다.

이 문제를 해결하기 위해 소프트웨어 엔지니어를 고용했습니다. 그들은 우리의 일상적인 작업을 워크플로우로 변환하는 비즈니스 로직을 작성했습니다. 그런 다음 버튼 하나만 클릭하면 모든 작업이 클라우드 어딘가에서 자동으로 수행되었습니다.

하지만 모든 사람이 엔지니어를 고용할 수 있는 것은 아니었습니다. 그리고 때로는 한 번만 해야 할 일이 있는데 엔지니어에게 요청할 필요가 없는 경우도 있었죠.

다행히도 워크플로 엔진도 있었습니다. 재피어 @뮬소프트 @n8n_io @윈드밀데브 같은 것들 말이죠.

덕분에 비교적 코드가 적은 인터페이스를 사용하여 이러한 워크플로를 구축할 수 있었습니다.

하지만 이러한 인터페이스는 여전히 상당히 기술적인 부분이 많았기 때문에 여전히 불편했습니다. 그리고 대부분의 지식 근로자들은 사용법을 잘 몰랐습니다. 또한 한 번만 수행하는 작업에는 여전히 적합하지 않았습니다.

전반적으로 수동 작업의 자동화는 언제나 소프트웨어의 성배였습니다.

2017년 | '야생의 시대'의 스크래핑

리드 생성 계약업체들은 일상적으로 LinkedIn을 스크래핑하는 파이프라인을 구축했는데, 당시에는 데이터 마이닝이 용이할 정도로 느슨한 상태였습니다. 주요 병목 현상은 코드가 아니라 정리, 수작업 편집, 고객 이메일 등 작고 반복적인 잡무가 산더미처럼 쌓여 있었으며, 이러한 잡무는 결코 사라지지 않았습니다. LinkedIn에서 UI를 한 번만 조정해도 하룻밤 사이에 많은 스크레이퍼가 고장 났고, 수작업으로 따라잡는 작업은 혼자서 감당할 수 없을 만큼 많았습니다. 교훈은 분명했습니다. 깨지기 쉬운 스크립트와 사람의 접착제는 확장되지 않습니다.

텍스트-다빈치-003: Redica와 같은 회사 내부에서 실험하는 엔지니어들은 초기 GPT 모델을 더 똑똑한 자동 완성기로 취급했습니다. 도움이 되긴 했지만, 출력을 다시 입력으로 연결하려고 하면 여전히 드리프트가 발생하기 쉬웠습니다.
GPT-3.5: 안정성이 뛰어나고 프롬프트가 더 쉬워졌지만 몇 홉보다 긴 자동 루프는 여전히 무너졌습니다. 업계의 풀리지 않는 숙제인 자체 유한 상태 머신을 실시간으로 작성하는 시스템은 여전히 남아있었습니다 .

GPT-4의 0314 체크포인트는 갑작스러운 일관성 향상을 가져왔습니다. 프롬프트가 복잡해지지 않고 단순화되었으며, 여러 단계의 추론이 긴 체인에 걸쳐 하나로 묶였습니다. 실무자들은 장난감 프로젝트를 며칠 만에 끝냈고(사실상 퇴행이 사라진 셈), 마침내 '자비스급' 어시스턴트를 사용할 수 있게 되었다는 이야기에 힘을 실어주었습니다.

이러한 이정표는 오늘날의 에이전트 환경을 위한 무대를 마련하고 '결정하고 행동하는 시스템'이 단순한 UX 유행이 아닌 차세대 플랫폼 전환으로 취급되는 이유를 설명합니다.

다음은 제가 생각하는 AI 에이전트의 정의입니다. 이 글의 마지막 부분에서 이 정의를 사용하는 이유를 설명하겠습니다:

AI 시스템의 맥락에서 에이전트는 자율적이고 능동적으로 행동할 수 있는 시스템입니다.

에이전트가 중요한 이유를 이해하기 위해 한 가지 예를 들어 보겠습니다.

여기서는 RAG, 메모리, 멀티 에이전트, 루프, LLM, AI, 사고의 나무에 대해 이야기하지 않겠습니다.

AI 에이전트를 설명하기 위해 이러한 용어는 필요하지 않습니다. 제가 항상 사랑해 왔고 애초에 소프트웨어 엔지니어가 된 이유인 비즈니스 프로세스에 대해 이야기하기만 하면 됩니다.

Anna에 대해 이야기해 보겠습니다.

Anna는 코카콜라의 채용 담당자입니다. 그녀는 뉴욕 사무실에서 팀에 합류할 선임 제품 관리자를 찾고 있습니다. 하지만 Anna에게는 문제가 있습니다. 경험이 없는 지원자들로부터만 지원서를 받고 있다는 것입니다.

AI 에이전트를 사용하기 전에는 Anna는 ATS를 사용하여 문제를 해결했습니다. 시간 낭비일 뿐 아니라 큰 도움이 되지 않을 것이기 때문에 ATS에 문제를 알리지 않았습니다.

하지만 ATS가 에이전트 기능을 제공하면 Anna는 높은 수준의 문제를 표현하고 ATS가 문제를 해결한 다음 진단 결과를 다시 가져올 수 있습니다.

이제 Anna는 ATS와 수동으로 상호 작용하지 않고도 문제를 해결할 수 있습니다. 시간을 절약하고 있습니다.

이 예에서 ATS는 에이전트입니다.

이러한 개선은 이미 그 자체로도 가치가 있습니다. 하지만 에이전트에는 한계가 없습니다. ATS는 Anna가 연공 문제를 파악하기 전에 이를 발견하고 문제를 해결한 다음 Anna에게 다시 보고할 수 있었을 것입니다. 이렇게 하면 시간을 훨씬 더 절약할 수 있을 것입니다(하지만 지나친 자율성이 항상 좋은 것은 아닙니다. 아래 참조).

이 시점에서 가장 흥미로운 질문은 다음과 같습니다:

ATS를 에이전트로 만드는 방법은 무엇인가요?

답은 "상황에 따라 다르다"입니다. 사람마다 에이전트를 구축하는 방식이 다르기 때문입니다. 게다가 에이전트 기능을 갖추기 위해 AI가 필요하지 않을 수도 있습니다. 때로는 유한 상태 머신이 그 일을 할 수 있습니다. 그래서 저는 "AI 에이전트"라는 용어를 좋아하지 않습니다. "에이전트"가 더 합리적입니다.

더 흥미로운 질문은 다음과 같습니다:

A- Anna는 무엇이 문제가 있다는 것을 깨닫게 되었나요?
B- 진단이 정확하다는 것을 어떻게 알 수 있나요?
C- 해결 방법은 직급이 아닌 연공서열을 변경하는 것임을 어떻게 알았나요? 생각해 보세요. 그녀는 직무 설명이 선임 엔지니어를 위한 것이라는 것을 알고 있습니다. 하지만 그녀의 업무를 완전히 자동화하려면 그녀의 최초 의도를 알아야 합니다.

이 세 가지 질문에 대한 답은 3가지 평가입니다:

A- 직책에 '시니어'가 언급된 직무 설명에 지원한 지원자 중 40% 이상이 주니어인 경우 Anna는 사건을 보고해야 합니다.
B- 진단에서 두 분야 간의 불일치가 언급되어 있고 이 두 분야 사이에 불일치가 없는 경우 Anna는 진단에 만족하지 않아야 합니다. 그 반대의 경우에는 진단에 만족해야 합니다.
C- 진단이 두 필드 간에 불일치인 경우 에이전트는 Anna에게 개입을 요청해야 하며, Anna가 거부하지 않는 한 계속 경고해야 합니다.

이제 이 세 가지 평가를 실행하여 벤치마킹할 수 있으므로 올바른 에이전트를 구축할 가능성이 훨씬 높아졌습니다.

그렇기 때문에 이 에이전트 혁명에서 가장 중요한 것은 에이전트 프레임워크가 아닙니다. 바로 Anna입니다. 평가를 작성하면 누구보다 Anna를 더 잘 이해할 수 있습니다. 그리고 Anna를 이해하면 최고의 에이전트를 구축할 수 있습니다. 최고의 에이전트는 Anna와 동일한 보상 시스템을 갖춘 기계일 뿐이니까요.

참고: C 평가는 Anna와 상담원이 다르게 행동하기 때문에 상담원에 대해 이야기할 수밖에 없는 유일한 평가입니다. Anna는 수정 사항이 무엇인지 알고 있지만 상담원은 알기가 더 어렵습니다. 그래서 상담원이 Anna에게 알려주기로 결정했습니다. 어떤 사람은 무엇을 고쳐야 하는지 알 수 있는 방법이 있다고 주장할 수도 있습니다. 직급이 분명히 주니어를 위한 것이라면 직급을 변경하고, 그렇지 않다면 연차 필드를 변경하면 됩니다. 하지만 바로 이 지점에서 안나를 알아야 합니다. 에이전트 합격에 가장 유용한 평가는 무엇일까요? 저는 A와 B를 주장하고 싶습니다. 그녀는 진단에 동의하면 직무 설명을 매우 쉽게 편집 할 수 있습니다. 그렇다면 이 부분을 자동화하고 애초에 이 평가까지 작성하는 것이 정말 가치가 있을까요? 여기서 중요한 점이 강조됩니다. 평가 C는 아마도 벤치마크에서 더 낮은 순위를 차지해야 할 것입니다. 에이전트가 A와 C를 통과하는 것보다 A와 B를 통과하는 것이 더 낫기 때문입니다. 이를 통해 평가와 벤치마크의 차이점을 이해할 수 있기를 바랍니다.

AI 에이전트는 자율적 또는 능동적으로 작동하는 시스템입니다. AI 에이전트에서 가장 흥미로운 부분은 기술입니다. AI 에이전트에서 가장 흥미로운 측면은 Anna입니다.

Anna는 비즈니스 프로세스를 따르려는 최종 사용자입니다.

Anna는 이미 에이전시를 가지고 있습니다. Anna는 능동적이며 자율성을 가지고 있습니다. 무에서 '에이전트'를 만들 필요가 없습니다. Anna의 봇 버전, 즉 에이전트를 만들기만 하면 됩니다. Anna는 보상 시스템입니다.

Anna와 Anna가 일하는 조직의 성공, 즉 평가가 무엇을 의미하는지 이해하기 전까지는 에이전트를 이해할 수 없습니다.

AI 상담원에게 관심을 가져야 하는 이유는 무엇인가요?

제가 AI 상담원에게 관심을 갖는 이유는 제가 Anna이기 때문입니다. 여러분도 저와 같을 수도 있습니다. 매일 수행하는 모든 수작업에 좌절감을 느끼실 수도 있습니다.

하지만 AI 에이전트에 관심을 가져야 하는 더 실용적인 이유는 Anna가 비싸기 때문입니다. 그리고 경쟁업체가 Anna를 구축하면 경쟁업체가 당신을 이길 것입니다.

AI 에이전트를 사용하면 비용만 절약할 수 있다는 말인가요? 아니요. 애초에 많은 기업이 Anna를 고용할 수 없습니다. 따라서 더 저렴한 버전을 구매하기로 결정하면 결국 제공되는 가치의 대가로 더 많은 비용을 지출하게 될 것입니다.

AI 에이전트는 현재 사람이 하는 일만 할 수 있다는 말인가요? 아니요. 하지만 인간이 이미 하고 있는 비즈니스 프로세스에서 시작하는 것이 더 쉽습니다. 기존 패턴에서 비즈니스 프로세스를 생성하는 것은 더 어렵습니다.

'인간 안나'가 쓸모없어진다는 말인가요? 아니요, 에이전트가 올바르게 행동했는지 여부를 평가할 수 있도록 그녀를 루프에 넣어야 합니다. 그리고 에이전트가 이전에 하던 모든 작업을 수행하더라도 이러한 에이전트를 모니터링하기 위해서는 여전히 인간 안나가 필요할 것입니다.

그러나 이러한 생산성 향상은 일자리 이동으로 이어질 수 있습니다. Anna가 "너무 생산적"이면 할 일이 남아 있지 않아 동료가 해고될 수 있기 때문입니다.

이 글이 가볍고 명확하게 이해되기를 바라기 때문에 정의를 빠르게 건너뛰었습니다. 정의는 항상 매우 학문적입니다. 하지만 분명히 매우 중요합니다. 다시 이 정의로 돌아와 보겠습니다:

AI 시스템의 맥락에서 에이전트는 자율적이고 능동적으로 행동할 수 있는 시스템입니다.

먼저 사전을 사용해보겠습니다. "에이전트"에는 이미 의미가 있습니다. 굳이 이 단어에 새로운 의미를 부여하지 않는 것이 가장 이상적입니다. 안타깝게도 그렇게 해야 할 것 같습니다.

메리엠-웹스터 사전에 따르면 에이전트는 행동하거나 힘을 행사할 수 있는 능력, 상태 또는 상태입니다. 따라서 에이전트는 "행동할 수 있는 시스템"이라고 말할 수 있습니다. 하지만 이는 매우 모호합니다.

아주 멍청한 웹 서버도 웹 클라이언트에서 호출하면 데이터베이스에 무언가를 삽입하는 '행동'을 할 수 있습니다. 따라서 소프트웨어 애플리케이션의 맥락에서는 "행동할 수 있는 능력"만으로는 충분하지 않습니다.

오늘날 에이전트 시스템의 핵심은 자율적으로 행동할 수 있는 능력입니다.

하지만 자율성에는 문제가 있습니다. 예를 들어, 제가 AutoGPT를 사용할 때 가장 좋아했던 모드는 매 사이클마다 AutoGPT를 올바른 방향으로 움직이고 경로를 변경할 수 있는 수동 모드였습니다. 자동 모드는 어느 쪽이든 단말기를 보고 있었기 때문에 그다지 유용하지 않았고, AutoGPT는 자주 실수를 저질렀습니다. 그래서 차라리 제가 직접 제어하는 편이 낫다고 생각했어요. 단점은 없습니다.

요즘은 에이전트가 자율적으로 작동할 수 있을 만큼 정확하지 않습니다. 하지만 정확도가 어느 정도 임계치에 도달하면 자율 에이전트가 우위를 점하게 될 것입니다.

제가 능동성을 정의에 추가한 이유는 오늘날 가장 유용한 AI 에이전트가 능동적이지만 자율적이지 않다는 것을 알 수 있기 때문입니다.

이것이 바로 제가 에이전트에 대해 이 정의를 사용하는 이유입니다:

AI 시스템의 맥락에서 에이전트는 자율적이고 능동적으로 행동할 수 있는 시스템입니다.

특정 기술이나 디자인 패턴에 의존하는 AI 에이전트의 정의는 제 생각에는 그다지 유용하지 않습니다. 네, AI 에이전트는 LLM을 사용하기도 합니다. 때로는 여러 에이전트, 벡터 검색, RAG, 목표 분해 등을 사용하기도 합니다.

하지만 에이전트를 구축할 때 이러한 기술에 너무 집중해서는 안 됩니다. 가장 큰 위험은 일반적인 에이전트 패턴을 무시하는 것이 아니라 안나를 무시하는 것입니다.

제가 함께 일했던 최고의 에이전트 빌더들은 결과 지향적이고 매우 실용적이었습니다. 그리고 그들은 결국 재현 가능한 기술을 찾아내고 그 프레임워크를 전 세계에 공유합니다.

하지만 이러한 기법이 여러분에게 맞지 않을 수도 있으므로 성공을 보장할 수 있는 유일한 방법은 Anna에 집중하는 것입니다. 그러기 위해서는 자신과 조직에 성공이 무엇을 의미하는지 아는 안나의 부분, 즉 평가를 구축해야 합니다.

좋은 소식은 우리 모두가 애나이고, 우리 모두는 가려운 곳을 긁어줄 수 있다는 것입니다.