Composer Agent의 YOLO Mode와 자동 코드 개발 실험
요즘 AI 기반 자동 코드 작성 도구들이 급격히 발전하고 있다. 특히, "Composer Agent"의 YOLO Mode를 활용해 완전 자동화된 코드 개발 환경을 만들어본 실험을 공유하려 한다. 이틀 정도 AI 둘을 서로 대화하게 만들어 본 결과, 소프트웨어가 완벽히 구현되진 않았지만 상당히 신박한 경험이었다.
YOLO Mode란?
Composer Agent에는 기본적으로 프롬프트 기반 자동 코드 작성 및 코드 파일 생성 기능이 포함되어 있다. 그런데 여기에 YOLO Mode라는 기능이 존재한다. 이 모드를 활성화하면 **"여기서부터 여기까지 구현해"**라고 명령했을 때, AI가 스스로 코드를 작성하고 디버깅까지 수행하는 것이다.
그러나 어느 순간부터 AI가 상상력을 발휘하기 시작했다. 즉, 사용자의 요청을 단순 실행하는 것이 아니라 자체적으로 로직을 추가하거나 변형하는 모습을 보이기 시작했다. 이를 제어하면서 좀 더 안정적으로 활용하는 방법을 찾는 과정이 흥미로웠다.
YOLO Mode + GPT-4o 코드 리뷰 감시자 조합
이 문제를 해결하기 위해 두 개의 AI 모델을 연동하는 방식으로 접근했다:
- Sonnet 3.5 (Composer Agent): "todo" 목록을 작성
- GPT-4o: "응 해"라고 응답
- Sonnet: 실제 코드 작성
- Sonnet: 코드 리뷰 요청
- GPT-4o: 코드 보안 문제, 메모리 누수 등 검토 후 피드백 제공
- Sonnet: 피드백 반영하여 코드 수정
- GPT-4o: "ㅇㅋ 이번 코드는 괜찮네, 다음 작업 뭐할래?"
- 1번부터 반복
이 방식으로 코드를 자동 생성하고 피드백을 적용하는 구조를 만들었다. 결과적으로 AI가 서로 대화하며 지속적으로 코드의 질을 개선하는 시스템이 되었다.
음성 기반 코드 개발 & 실시간 로깅 웹페이지
프롬프트를 직접 입력하는 것조차 귀찮아지기 시작하면서, Python으로 간단한 웹페이지를 만들어 음성 명령을 추가했다.
실험한 기능:
- 음성 명령 지원 (PC/모바일 마이크 이용)
- 실시간 코드 작성 결과 및 진행 상황 로깅
- todo 기반 마일스톤 관리
- 버그 리포팅 시스템 추가
현재 진행 중인 실험은 AI에게 개발 철학, 목적, 목표, 기능 명세 등 문서화된 정보를 학습시켜 더욱 자율적으로 코드를 생성하게 만드는 것이다. 이를 통해 AI 기반 자동 개발 환경을 더욱 발전시키는 것이 목표다.
예상보다 어려운 점들
몇 가지 추가 실험도 진행했는데, 생각보다 문제가 많았다.
- Git 코드 커밋 연동은 비효율적: AI가 너무 자주 코드를 재작성하여 용량이 감당이 안 됨.
- Discord Webhook 연동: API 요청이 너무 많아 3시간 만에 한도 초과.
- Git Hook 연동: 로깅이 지나치게 많아 비효율적.
Cursor 결제 이유와 Ollama 실험
처음에는 Ollama를 학습시켜 Void와 연동하는 방법을 시도했지만, AI가 너무 자주 코드를 재작성하는 바람에 Append-Only 방식으로 캐싱하면 스토리지 용량이 감당이 안 됐다. 결국 Cursor를 결제하는 방향으로 선회했다.
결론
이번 실험을 통해 AI 기반 자동 코드 개발이 가능하다는 것을 확인했지만, 실용적으로 사용하기 위해서는 몇 가지 해결해야 할 문제들이 많다는 점도 발견했다. 특히, AI의 상상력을 적절히 제어하고, 코드 수정이 너무 잦아지는 문제를 해결하는 것이 관건이다.
혹시 나와 같은 실험을 진행하고 있는 사람이 있다면, 함께 경험을 나누어 보고 싶다!