AI 에이전트는 비개발자의 생산성을 어디까지 끌어올릴 수 있나

코딩을 모르는 콘텐츠 제작자가 AI 에이전트를 실무에 투입한 한 달의 기록. 반복 업무 자동화, 중단된 기능 복원, 존재하지 않던 도구 제작까지 가능해졌다. 그러나 에이전트는 생산성만큼이나 새로운 비용과 압박도 함께 가져왔다.

2025년 2월, 오픈AI의 초기 멤버인 안드레이 카르파시(Andrej Karpathy)는 X에 이렇게 적었다. “코드가 존재한다는 사실조차 잊어버리고, 바이브에 완전히 몸을 맡기는 새로운 코딩 방식.” 이 말은 곧 업계의 화제가 됐고, ‘바이브 코딩(vibe coding)’이라는 표현도 빠르게 확산됐다. 이후 콜린스 사전은 ‘vibe coding’을 2025년 올해의 단어로 선정했다. 낙관론은 분명하다. 그러나 숙련된 개발자조차 AI 코딩 도구를 사용할 때 작업 완료 시간이 오히려 19% 늘어났다는 연구 결과도 있다. 그렇다면 코딩을 전혀 모르는 비개발자에게 에이전트는 실제로 어떤 일을 가능하게 할까?

먼저 필자의 입장을 분명히 해두고 싶다. 필자는 AI에 대해 적지 않은 거부감과 경계심을 갖고 있다. 콘텐츠 기획자, 작가, 영상 제작자로 9년간 쌓아온 전문성이 AI로 잠식되고 있다는 생각이 하루에도 몇 번씩 머릿속을 스쳐 지나간다. 이런 감정은 단순히 막연한 불안감 때문이 아니다. 필자가 제작한 유튜브 영상 링크를 제미나이에 입력하면, 제미나이는 요약은 물론 전체 대본에 가까운 텍스트까지 빠르게 생성해낸다. 또한 주요 LLM 기업 상당수가 저작권 소송에 연루돼 있거나 부적절하게 수집된 데이터로 모델을 학습했다는 의혹을 받고 있다.

그럼에도 불구하고 완전히 등을 돌리는 것은 현실적으로 불가능하다. 필자는 2022년부터 AI 도구를 제한적으로 활용해 왔다. 다만 데이터 주권에 대한 우려 때문에 외부 서버로 데이터가 전송되지 않는 로컬 모델 위주로 사용해 왔다. 그러나 2025년 말까지 사용해 본 수십 종의 로컬 모델은 실제 작업 환경에서 요구되는 수준의 자율적 작업 수행 능력을 갖추지 못했고, 필자의 컴퓨터는 전자레인지와 맞먹는 전력을 소모하며 초당 한 글자를 간신히 출력해내기에 이르렀다.

결국 올해 초, 필자는 한 가지 선택을 했다. 데이터 일부와 컴퓨터 제어권을 양보하는 대신, 고성능 에이전트 ‘클로드 코드(Claude Code)’를 도입하기로 한 것이다. 이는 월 200달러의 Max 플랜 구독료를 감수해야 하는 선택이었다.

이 글은 클로드 코드 선택 이후 한 달간의 경험을 정리한 기록이다. 여기서는 이른바 ‘AI 슬롭’ 같은 저품질 콘텐츠 문제는 일단 논외로 하겠다. 여기서 다루는 것은 코딩 비전문가인 콘텐츠 기획자·영상 제작자가 에이전트를 통해 ‘무엇을 실질적으로 달성할 수 있는가’이다.

바이브에 완전히 몸을 맡기다

생산성의 문제를 개인 단위로 들여다보면, 많은 창작자와 프리랜서들이 직면한 구조적 장벽이 보인다. 반복 패턴이 있는 작업의 상당수는 원칙적으로 자동화할 수 있다. 그러나 여기에는 세 가지 현실적 제약이 존재한다. 전문 코딩 역량의 부재, 기성 솔루션 구매에 따른 비용, 그리고 시장 규모가 너무 작아 솔루션 자체가 존재하지 않는 경우다.

필자가 운영하는 유튜브 채널을 예로 들겠다. 해외 채널을 따로 운영하며 AI 더빙 프로젝트를 진행하던 중, 구조적 비효율이 곧바로 드러났다. 수백 개 문장의 영어 번역은 LLM이 처리했지만, 번역된 대사를 한 문장씩 음성으로 변환하는 작업은 인간이 200여 차례 반복 수행해야 했다. 어려운 번역은 AI가 처리하고, 단순 반복 작업은 사람이 떠맡는 역설적인 구조다.

해법은 자동화 코드 작성에 있었다. 전체 문장이 담긴 파일 하나만 주면, 문장을 자동으로 나눠 TTS 서비스에 차례로 보내고 이 과정을 200번 반복하는 코드가 필요했다. 그리고 이 요구사항을 자연어로 설명하자, 에이전트는 곧바로 구현 방안을 제시했다. 사용자는 문제를 정의하고 작업 흐름을 설계하고, 구현은 에이전트가 맡았다. 카르파시가 제안한 ‘바이브 코딩’이다.

물론 바이브 코딩에는 분명한 한계가 있다. 과정의 어느 한 단계만 문제가 생겨도 전체 구현이 실패할 수 있다. 에이전트가 문제를 오해하거나, 해결 방안을 잘못 짜거나, 자연어 지시를 코드로 정확히 옮기지 못하면 구현은 기대한 결과에 이르지 못한다. 그러나 2025년 말부터 LLM의 성능이 유의미하게 향상되면서, 에이전트 기반 코딩은 실제로 써먹을 수 있는 수준의 결과를 내기 시작했다. 필자는 영어 스크립트 파일 하나를 입력하면 수백 개의 더빙 오디오를 순차 생성하는 워크플로우를 단 하루 만에 구현했다. 원하는 주제의 뉴스 기사를 자동으로 수집해 저장하는 기능도 일주일 안에 완성했다.

n8n으로 구현한 순차 더빙 워크플로우.
에이전트가 자바스크립트로 프로그래밍했다.

지원 중단? 나만의 지원을 시작하다

더빙 워크플로우 구현의 성공에 힘입어, 다음으로 시도한 것은 지원이 중단된 플러그인(프로그램 확장 기능)을 되살리는 작업이었다.

오늘날 많은 소프트웨어는 플러그인 생태계를 기반으로 작동한다. 구글 크롬이 대표적이다. 크롬은 핵심 기능을 제공하고, 서드파티 개발자가 화면 캡처, 다크 모드 등 다양한 기능을 확장 프로그램으로 배포한다. 그러나 이 생태계는 구조적으로 취약하다. 소프트웨어가 업데이트되면 플러그인이 작동을 멈추고, 개발자가 관심을 잃으면 후속 지원도 사라진다.

필자가 사용하는 루프덱(Loupedeck)이라는 보조 키보드가 이 상황에 처해 있었다. 물리 버튼과 소형 LED 액정을 갖춘 이 장치는 단축키 등록과 시스템 상태 표시 기능을 겸한다. 그런데 그래픽카드 사용량 등을 표시하는 플러그인이 소프트웨어 업데이트 이후 작동을 멈췄고, 이후로도 후속 지원 소식은 한동안 없었다.

기존이라면 선택지는 기약 없이 기다리거나, 포기하거나 두 가지뿐이었다. 에이전트의 등장은 제3의 선택지를 만들어냈다. 필자는 에이전트에게 기존 플러그인의 실행 파일을 제공해 작동 방식을 분석하게 하고, 새 버전 루프덱 소프트웨어에서도 작동하는 플러그인을 새로 구축하도록 지시했다. 새로 만드는 김에 필자의 미적 기준에 맞는 인터페이스도 덧붙였다. 이 작업은 하루 만에 완료됐다.

결과물을 온라인 커뮤니티 사이트 레딧(Reddit)에 공유하자, 같은 문제를 겪던 사용자들의 반응이 이어졌다. 필자는 처음으로 소프트웨어 개발 협업 플랫폼 깃허브(GitHub)에 플러그인을 업로드했다. 실제 다운로드와 사용이 이어졌고, 기능 추가 요청도 들어왔다.

이는 한 가지 중요한 변화를 보여준다. 개발자의 업데이트를 기다리지 않아도, 기업이 제품 지원을 종료하더라도, 전문가가 아닌 일반 사용자가 시스템을 유지·보수하고 기능을 개선할 수 있는 가능성이 열린 것이다. 루프덱은 이후 다른 기업에 인수된 뒤 생산이 중단됐다.

에이전트와 함께 개발한 모니터링 플러그인.
시스템 사용량을 실시간 확인할 수 있다.

없다면, 직접 만든다

여러 프로젝트를 병행하다 보면, 프로젝트 사이의 짧은 공백이 전체 일정을 무너뜨리는 상황을 마주하게 된다. 이 문제를 해결하기 위해 필자는 수많은 일정 관리 도구를 거쳐, 현재는 노트 앱 옵시디언(Obsidian)에 정착했다. 옵시디언은 수천 개의 커뮤니티 플러그인을 통해 기능을 자유롭게 확장할 수 있다는 것이 특징이다.

‘확장’이라는 개념은 유연성을 약속하는 것처럼 보이지만, 실제로는 새로운 복잡성을 낳는다. 일정을 막대 그래프로 시각화하는 간트 차트를 보려면 A 플러그인, 캘린더 기능에는 B 플러그인, 카드 형태로 업무를 관리하는 칸반 보드와 태스크 관리에는 C 플러그인이 필요하다. 각기 다른 개발자가 만든 플러그인들은 디자인 언어도, 데이터 관리 형식도 제각각이라 유기적으로 통합하기가 사실상 어렵다.

필자와 에이전트의 가장 긴 협업 프로젝트는 이 문제에서 출발했고 현재도 진행 중이다. 수년간의 프로젝트 경험, 기존 플러그인을 쓰면서 쌓인 불만, 일정 관리 실패에서 얻은 교훈을 모두 녹여 단 하나의 통합 플러그인을 만드는 작업이었다. 코드가 1만 줄을 넘어서던 시점, 이것이 기존 플러그인들의 조합이 아닌 전혀 다른 무언가라는 확신이 들었다. 따로 놀던 복수의 플러그인 시스템은 하나의 일관된 프로젝트 운영 환경으로 대체됐다. 도구에 사용자를 맞추던 방식에서, 사용자에게 도구를 맞추는 방식으로의 전환이었다.

개발한 프로젝트 지원 도구.
Weniversal Task라 이름 붙였다.

생산성은 향상된 걸까?

기존 작업의 자동화, 지원이 끊긴 기능의 복원, 존재하지 않던 도구의 창조. 한 달 동안 AI 에이전트와 함께 이뤄낸 결과물이다.

그러나 이 성과에는 세 가지 구조적 대가가 따른다.

모델 성능의 비대칭성. 수십 개의 모델을 써본 끝에 내린 결론은 단순하다. 저렴한 모델은 아직 실용적 수준에 미치지 못한다. 클로드는 명령 수행 능력에서 강점을 보이지만, 토큰 소비량이 만만치 않다. 20달러 요금제는 턱없이 부족하고, 100달러 요금제는 그럭저럭 쓸 만하지만 아쉬움이 남는다. 200달러 요금제에 이르러야 비로소 안정적인 사용이 가능하다. 코딩 비전문가는 오류가 발생했을 때 문제를 스스로 해결하기 어렵기 때문에, 저렴한 모델을 선택할수록 그 한계가 더 크게 체감된다.

가능성의 역설. 에이전트는 기존에 불가능하던 일을 가능하게 만든다. 그런데 ‘가능하다’는 사실은 때로 ‘해야 한다’는 압박으로 이어진다. “코딩을 못 한다”는 제약이 사라진 자리에, 해결 가능한 문제들이 끊임없이 눈에 밟히기 시작한다. 문제를 해결하는 행위 자체가 중독성을 띨 수 있다는 점에서, 이는 집중력 분산의 위험을 내포한다.

경쟁 진입 장벽의 소멸. 경쟁 진입 장벽의 소멸도 주목할 지점이다. 하루 만에 더빙 워크플로우를 구축할 수 있다면, 동일한 결과물을 만들어내는 데 걸리는 시간은 누구에게나 비슷하다. 코딩이라는 진입 장벽이 낮아지면 사업 기회가 넓어지는 것처럼 보이지만, 경쟁 또한 그만큼 빠르게 형성된다. 결과적으로 새로운 사업의 차별화 기간은 예상보다 짧아질 수 있다.

이 맥락에서 주목할 만한 수치들이 있다. 2025년 공개된 한 연구에 따르면, 숙련된 개발자가 AI 도구를 사용할 때 작업 완료 시간이 오히려 19% 늘어났다. 기업 단위의 AI 도입 효과가 기대에 미치지 못한다는 조사 결과도 잇따르고 있다. 이런 압박은 개인 차원에 그치지 않는다. 실제로 일부 실리콘밸리 스타트업은 AI 경쟁에 대응한다는 명목으로 주 72시간에 가까운 근무 문화를 공공연히 조장하기도 했다. 에이전트는 단순히 작업 속도를 높이는 도구가 아니라, 가능성의 범위 자체를 확장하는 도구다. 그리고 가능성의 범위가 넓어질수록, 수행해야 할 작업의 범위 역시 함께 늘어난다.

이 글을 쓴 김종성 대표는 ‘우리와 세상을 아는 것은 즐겁다’는 메시지를 전하기 위해 과학 콘텐츠 제작사 ‘위니버스’를 운영하며 칼럼과 강연 활동을 이어가고 있다. 저서로 <수학은 알고 있다>, <라파엘로가 사랑한 철학자들>이 있다.

The post AI 에이전트는 비개발자의 생산성을 어디까지 끌어올릴 수 있나 appeared first on MIT 테크놀로지 리뷰 | MIT Technology Review Korea.