OKR의 역설: 구글의 목표 설정 프레임워크가 왜 스스로의 적이 되었나
세상에서 가장 성공한 경영 도구가 ‘기업식 카고 컬트(겉모양만 따라 하는 신앙)’가 될 때
2022년 7월, 실리콘밸리에서 한 트윗이 바이럴을 탔다. 벤처캐피털리스트 벤 베어(Ben Bear)가 “당신이 믿는 스타트업 음모론은?”이라고 물었고, 스스로 이렇게 답했다.
“OKR은 사실 구글이 초기 경쟁사를 느리게 만들려고 벌인 심리전(psyop)이었다.”
몇 시간 뒤, 순다르 피차이(Sundar Pichai) 구글 CEO가 그 트윗을 리트윗하며 의미심장하게 답했다.
“Oops. Finally someone figured it out:)” (“앗. 드디어 누가 알아챘네:)”)
농담이 웃겼던 이유는, 그게 ‘신경’을 건드렸기 때문이다. 인텔에서 구글로, 존 도어(John Doerr)가 1999년에 전파한 목표 설정 프레임워크 OKR(Objectives and Key Results)은 이후 전 세계 수천 개 기업으로 퍼져나갔다. 하지만 지금의 OKR은 창시자들이 의도했던 것과는 전혀 다른 모습이 되어버렸다.
정렬과 집중을 위한 도구로 시작했던 OKR은, 시간이 흐르며 **관리자의 시간을 잡아먹고, 우선순위를 왜곡하며, 많은 경우 조직에 실질적인 해를 끼치는 ‘성과 연극(performance theater)’**으로 변질됐다.
새로운 연구는 그 문제가 얼마나 광범위한지 보여준다. 2024년 가트너(Gartner) 연구에 따르면, 조직의 70%가 OKR 도입 첫해에 실행에 어려움을 겪고, 절반 이상은 중도에 포기한다. 그런데도 OKR을 둘러싼 산업—컨설턴트, 소프트웨어 벤더, 교육 프로그램—은 계속 성장한다. “구글에서 됐다면 우리도 되지 않을까”라는 매혹적인 서사가 그 연료가 된다.
하지만 현실은 훨씬 더 복잡하고, 더 불편하다.
측정의 함정
영국 경제학자 찰스 굿하트(Charles Goodhart)는 1975년에 이렇게 말했다.
“측정치가 목표가 되는 순간, 그 측정치는 더 이상 좋은 측정치가 아니다.”
이 원칙은 굿하트의 법칙(Goodhart’s Law)으로 알려져 있고, 전 세계 OKR 도입을 조용히 죽이는 ‘킬러’가 되어버렸다.
수백 건의 실패한 OKR 도입을 검토한 성과관리 컨설턴트들은, 약 70%가 ‘대체(surrogation)’ 문제를 겪는다고 말한다. 즉, 조직이 핵심 결과(Key Results)를 달성하는 것과 목표(Objectives)를 달성하는 것을 혼동해버린다는 뜻이다. 팀은 성과(Outcome)보다 지표(Metric)를 최적화하고, 전 베인(Bain) 컨설턴트 출신 한 인물은 이를 “지표 조작의 악순환”이라고 부른다.
이 패턴은 산업과 국가를 가리지 않고 반복된다. 2023년, 13개국에서 약 500명의 비즈니스 리더를 대상으로 한 설문에서는 **65%의 팀이 ‘우리 OKR이 회사 목표와 직접 연결되어 있지 않다’**고 인정했다. 더 의미심장한 사실도 있다. OKR을 3년 이상 운영해본 기업이 신규 도입 기업보다 유의미하게 더 좋은 성과를 보고했다는 점이다. 이는 많은 조직이 프레임워크를 제대로 쓰는 법을 익히기도 전에 포기해버린다는 뜻일 수 있다.
이건 단순한 실행 문제만은 아니다. OKR 프레임워크 자체에 내재된 근본적 긴장이다.
한국의 경험: 동양의 위계가 서양의 프레임워크를 만났을 때
이런 문제는 특히 위계가 강하고 성과 평가 문화가 뚜렷한 조직에서 더 날카롭게 드러난다. 한 국내 대기업(익명 요청)은 2020년 모든 사업부에 OKR 도입을 의무화했다. 교육은 철저했고, 소프트웨어도 엔터프라이즈급이었으며, 경영진의 의지도 강했다.
그런데 1분기 말, 상황이 심상치 않게 흘러갔다.
리뷰 미팅에서 관리자들은 핵심 결과 달성률을 ‘대략 70% 정도’로 조정하라는 지시를 받기 시작했다. 너무 높으면 ‘특별 발표(베스트 프랙티스 공유)’ 같은 추가 업무가 생기고, 너무 낮으면 성과에 문제가 있다는 신호가 되니, 그 사이 어딘가가 안전하다는 논리였다.
한 팀 리드의 회고는 이렇다.
“실제로 목표를 달성했다면 100%라고 쓰면 안 되냐고 물었어요. 돌아온 답은, 100%면 조직 전체에 ‘우리의 베스트 프랙티스’를 발표해야 해서 오히려 부담이라는 거였죠. 뛰어난 결과보다 그럭저럭한 결과를 보고하는 게 더 안전했습니다.”
성공이 짐이 되고, 평범함이 피난처가 되는—이 뒤틀린 인센티브 구조는 OKR 지지자들이 말하는 모든 원칙을 정면으로 위배한다. 하지만 이런 현상은 결코 희귀하지 않다. 여러 국내 대기업의 관리자들이 유사한 역학을 보고했고, 결국 OKR은 모두가 연기하지만 아무도 믿지 않는 조직적 가부키(의식적 연극)가 된다.
반대로, 한국에서 성공적으로 OKR을 운영한 사례도 있다. 의료미용 플랫폼 힐링페이퍼(강남언니)는 2020년 일본 자회사에서 OKR을 먼저 도입한 뒤 국내로 확장했는데, 접근 방식이 근본적으로 달랐다. 힐링페이퍼는 OKR을 성과 평가 시스템으로 취급하지 않고, “Sync & Align and Sprint(싱크 & 얼라인, 그리고 스프린트)”—즉 통제를 위한 도구가 아니라 조율을 위한 도구로 사용했다.
회사 블로그 글에서 한 임원은 이렇게 설명한다.
“한때 잘 맞던 PMF(Product-Market Fit)는 성장하면서 쉽게 어긋날 수 있다는 걸 배웠습니다. OKR은 내부 지표가 아니라 고객 가치 중심으로 계속 재정렬하게 도와줬어요.”
2017년에 한 차례 흑자를 달성했고, 공격적인 확장 이후 2023년에 다시 수익성을 회복한 이 회사는 주간 체크인을 유지하면서도 OKR과 성과평가를 명확히 분리한다. 많은 대기업이 하는 방식과 정반대다.
또 다른 예로 비바리퍼블리카(토스)를 보자. 2천만 명 이상의 사용자를 가진 국내 대표 핀테크 슈퍼앱인 토스는 단순 송금 서비스에서 종합 금융 플랫폼으로 확장하면서도 조직의 집중을 유지해왔다. 토스는 목표 설정 방법론을 자세히 공개하진 않지만, 확장 과정에서 전략적 적자를 감수해온 끝에 2024년에 첫 연간 흑자를 달성했다는 사실은, 성장 이니셔티브와 운영 완성도를 균형 있게 다루는 규율이 있었음을 시사한다. 이는 제대로 구현된 OKR이 본래 제공하려 했던 전략적 명료함과 맞닿아 있다.
구글의 역설
흥미롭게도, 구글 내부에서 OKR은 정석과는 다른 방식으로 진화해왔다. 2019년 CEO가 된 직후, 순다르 피차이는 중요한 변화를 단행한다. 분기 OKR을 아예 없애고, 연간 목표만 두되 분기별 진척 보고에 집중하기로 한 것이다.
이 결정은 존 도어가 ‘단기 목표의 힘’을 강조해온 것과 정반대의 선택이었다. 하지만 이유는 단순했다. 구글은 더 이상 스타트업이 아니었다. 분기 단위의 기민함보다 장기적 전략 집중이 필요해진 것이다. 한 전직 구글 임원은 링크드인에서 이렇게 말했다.
“성숙한 조직에서는 ‘평시 운영(BAU, Business As Usual)’이 OKR 교리보다 더 존중받을 가치가 있다.”
아이러니는 깊다. 많은 회사가 “구글이 하니까” OKR을 도입하지만, 정작 구글은 교과서식 OKR 운영을 넘어선 지 오래다. 그리고 2022년 피차이가 남긴 ‘OKR이 경쟁사 발목 잡는 무기일 수도 있다’는 농담은 또 다른 사실을 드러낸다. 구글 리더십조차 이 프레임워크의 한계를 알고 있고, 언제 정석을 무시해야 하는지 아는 것이 경쟁우위가 될 수 있다는 점을 알고 있다는 것이다.
카고 컬트식 경영이 만들어내는 비용
실패한 OKR 도입이 초래하는 재무적 피해는 정량화하기 어렵지만, 경고 신호는 뚜렷하다. 브리지스 비즈니스 컨설턴시(Bridges Business Consultancy)에 따르면, 조직의 48%는 전략 목표의 절반도 달성하지 못한다. 그 실패의 상당 부분은 가치보다 오버헤드가 큰 목표 설정 프레임워크에서 비롯된다.
인간적 비용은 더 직접적이다. OKR이 잘못 구현된 회사들은 직원 몰입이 낮고, 고성과자의 이탈이 높으며, 경영진의 새로운 이니셔티브에 대한 냉소가 커진다고 보고한다. 유능한 직원들이 자신들의 목표가 정치적 목적을 위해 ‘조정’되는 것을 보거나, 의미 있는 일이 아니라 지표가 더 중요해지는 것을 보면, 출구를 찾기 시작한다.
문제는 개별 회사에 그치지 않는다. OKR 소프트웨어, 교육, 컨설팅의 확산은, 프레임워크의 이점을 과장하고 한계는 축소하는 자기강화적 생태계를 만들었다. 한 포춘 500 기업과 일한 맥킨지 파트너는 이렇게 말한다.
“회사들이 OKR을 만능탄환처럼 취급하는 걸 봅니다. OKR만 도입하면 정렬, 책임, 전략 실행이 해결될 거라 생각하죠. 그렇지 않습니다. OKR은 문제를 해결하는 게 아니라, 원래 있던 문제를 더 선명하게 드러낼 뿐이에요.”
진짜로 효과가 있는 것들
연구는 무엇이 성공과 실패를 가르는지에 대해 어느 정도의 단서를 준다.
-
타이밍이 중요하다. 목표를 성과 평가와 연결하기 전에 3~5회 OKR 사이클을 운영한 기업이 훨씬 좋은 결과를 보고한다. OKR은 측정 도구가 되기 전에 조직에 ‘뿌리내릴 시간’이 필요하다.
-
커뮤니케이션 강도가 핵심이다. 주간 OKR 체크인을 하는 조직은 분기별로만 리뷰하는 조직보다 목표 달성률이 2.4배 높다. 지속적인 대화가 없으면 OKR은 누구도 믿지 않는 정적 문서가 된다.
-
맥락이 전부다. WorkBoard 데이터에 따르면 OKR을 가장 잘 쓰는 기업들의 공통점은 하나다. 조직 성숙도, 산업의 속도, 문화에 맞춰 **프레임워크를 ‘각색’**했다는 것. 그대로 베끼지 않았다.
힐링페이퍼의 성공은 이를 잘 보여준다. 조직 가치로서 투명성(“extreme openness”)과 솔직한 대화(“extreme candor”)를 강조하고, OKR을 평가가 아니라 조율을 위해 사용함으로써 OKR을 원래 모습으로 되돌렸다. 즉, 통제가 아니라 명료함과 정렬을 위한 도구로 만든 것이다. 게다가 이 회사는 PR-FAQ(미래 보도자료를 미리 쓰는 방식), 제품 제안서, 리더십 리뷰 같은 보완 방법론도 함께 사용한다. OKR만으로는 전략 실행이 충분치 않다는 걸 인정한 셈이다.
앞으로의 길
OKR 자체가 망가진 건 아니다. 다만 대부분의 조직이 그것을 망가뜨리는 방식으로 구현할 뿐이다. 해결책은 OKR을 완전히 버리는 것이 아니라, 한계를 정직하게 인정한 상태에서 접근하는 것이다.
첫째, OKR은 만병통치약이 아니라 조율(co-ordination) 도구임을 분명히 해야 한다. OKR이 가장 잘 작동하는 조건은 대체로 이렇다.
- 리더십이 이미 전략적 명료함을 어느 정도 구축해두었고
- 조직 문화가 투명성과 실험을 지지하며
- 성과 평가는 별도의 메커니즘으로 이뤄지고
- 팀이 접근 방식을 스스로 정할 실질적 자율성을 가질 때
둘째, 경영진은 OKR을 성과관리 시스템으로 쓰고 싶은 유혹을 버려야 한다. 핵심 결과가 보상·승진의 근거가 되는 순간, 굿하트의 법칙이 발동하고 프레임워크 전체가 썩기 시작한다.
마지막으로, 기업들은 가장 중요한 신호를 봐야 한다. 구글이 ‘말하는 것’이 아니라, 구글이 ‘실제로 하는 것’ 말이다. OKR을 유명하게 만든 회사는, 필요에 맞춰 프레임워크를 실용적으로 바꿔왔고 더 이상 도움이 되지 않는 요소는 과감히 제거했다. 그 유연함—교과서적 원칙에 대한 맹목적 충성보다—가 어쩌면 가장 중요한 교훈일지 모른다.
한 실리콘밸리 베테랑 임원은 이렇게 정리했다.
“OKR로 성공하는 회사는 OKR을 종교가 아니라 출발점으로 봅니다. 각색하고, 실험하고, 안 되는 걸 인정할 줄 알죠. 실패하는 회사는 남들이 하니까 따라 하면서, 리더십·전략·문화 변화가 필요한 문제를 프레임워크가 해결해주길 바랍니다.”
존 도어가 OKR을 구글에 소개한 지 25년이 지난 지금, OKR은 갈림길에 서 있다. 컨설팅 주도의 유행으로 남아 피상적으로 도입됐다가 조용히 버려질 수도 있고, 아니면 원래 의도대로 각 조직이 필요에 맞게 조정해 쓰는 실용 도구로 진화할 수도 있다.