Opus 4.8 dynamic workflows, 큰 작업에 써본 노트
지난달 말 나온 Claude Opus 4.8의 dynamic workflows를 큰 리팩토링에 써본 작업 노트입니다. 무엇이 달라졌는지, 모델이 좋아질수록 왜 사람의 검수와 적용 노하우가 더 중요해지는지 적었습니다.
방금 큰 리팩토링을 하나 돌리다가 Opus 4.8의 dynamic workflows를 처음 제대로 썼다. 지난달 말(5월 28일)에 나온 모델이다. 베비투스랩은 클라이언트 작업이든 사내 시스템이든 Claude Code로 작업한다. 모델이 바뀌면 작업 방식도 조금씩 바뀐다.
뭐가 달라졌나
dynamic workflows는 한 번에 처리하기엔 큰 작업을 스스로 단계로 쪼개 진행하는 기능이다. 예전엔 큰 리팩토링을 사람이 미리 잘게 나눠 시켜야 했다. 이제는 목표만 주면 중간 단계를 알아서 설계한다. effort를 조절하는 옵션도 생겼다. 가벼운 작업엔 힘을 덜 주고 어려운 작업엔 더 주는 식이다. 컨텍스트 창은 기본 100만 토큰이라 웬만한 레포 한 덩어리를 통째로 넣어도 버틴다.
가격은 직전 버전과 같다. 입력 100만 토큰당 5달러, 출력 25달러다. 그런데 같은 작업을 토큰을 덜 쓰고 끝내는 경우가 늘었다. 단가는 같아도 실효 비용은 내려간 셈이다.
그래도 사람이 검수한다
여기서 솔직해야 한다. 모델이 좋아졌다고 알아서 다 맡겨도 되는 건 아니다. dynamic workflows가 단계를 잘 쪼개도 방향이 틀어지면 틀어진 채로 끝까지 간다. 큰 작업일수록 중간에 한 번씩 멈춰 확인하는 게 더 중요해졌다. 이전에 카파시의 'march of nines'를 글로 정리한 적이 있다. 마지막 몇 퍼센트의 정확도를 채우는 비용은 모델이 좋아져도 사라지지 않는다.
AX에는 뭐가 바뀌나
모델이 좋아질수록 "툴을 쓸 줄 안다"는 차별점은 빠르게 평준화된다. 누구나 좋은 모델을 같은 단가에 쓴다. 그래서 남는 차이는 "이걸 회사 업무 어디에 어떻게 붙이느냐"다. 베비투스랩이 사내 시스템에 직접 적용하며 쌓는 건 모델 성능이 아니라 그 붙이는 노하우다. 모델은 몇 주마다 바뀌어도 노하우는 쌓인다.
Opus 4.8은 분명 한 단계 나아갔다. 다만 나아간 만큼 사람이 할 일이 '직접 짜기'에서 '방향 잡고 검수하기'로 옮겨갈 뿐이다.
공유