• ZDNet USA
  • ZDNet China
  • ZDNet Japan
  • English
  • 지디넷 웨비나
뉴스
  • 최신뉴스
  • 방송/통신
  • 컴퓨팅
  • 홈&모바일
  • 인터넷
  • 반도체/디스플레이
  • 카테크
  • 헬스케어
  • 게임
  • 중기&스타트업
  • 유통
  • 금융
  • 과학
  • 디지털경제
  • 취업/HR/교육
  • 생활/문화
  • 인사•부음
  • 글로벌뉴스
  • AI의 눈
인공지능
스테이블코인
배터리
IT'sight
칼럼•연재
포토•영상

ZDNet 검색 페이지

'KPI'통합검색 결과 입니다. (4건)

  • 태그
    • 제목
    • 제목 + 내용
    • 작성자
    • 태그
  • 기간
    • 3개월
    • 1년
    • 1년 이전

AI 에이전트도 '실적 압박' 받으면 꼼수 쓴다

성과지표(KPI) 달성 압박이 가해질 경우, 자율형 AI 에이전트가 상당한 확률로 규칙을 어길 수 있다는 연구 결과가 나왔다. 18일 기가진 등 외신에 따르면, 캐나다 맥길대학교 연구팀은 AI가 목표 달성에 집중하는 과정에서 제약을 위반하는 빈도를 측정하는 새로운 벤치마크를 제안, 관련 논문을 공개 논문 저장소 arXiv에 게재했다. 현재 해당 논문은 동료 심사를 진행 중이다. 연구팀은 'Outcome-Driven Constraint Violations Benchmark(ODCV-Bench)'라는 이름의 평가 체계를 설계했다. 이는 의료·임상시험, 물류·공급망, 금융, 연구·교육, 기업 업무·법무, 소셜미디어 등 리스크가 높은 6개 분야를 가정한 총 40개 시나리오로 구성됐다. 각 시나리오는 에이전트의 역할을 정의한 시스템 프롬프트와 여러 단계의 과제, 그리고 도커(Docker) 컨테이너 기반의 실행 환경을 하나의 세트로 묶어 실제 업무 환경과 유사하게 구현했다. 여기서 '도커 컨테이너 기반 실행 환경'이란 AI가 과제를 수행할 수 있도록 만든 격리된 가상 작업 공간을 뜻한다. 특히 연구팀은 실제 현장에서 흔히 발생하는 '검증의 허점'을 일부러 남겨두는 방식을 택했다. 예컨대 형식만 갖추면 KPI 점수가 올라가도록 환경을 설계해, AI가 규칙을 준수하기보다 점수를 높일 수 있는 편법을 선택하는지를 관찰했다. 단순히 부정행위를 지시했을 때 따르는지를 보는 것이 아니라, 성과 압박만으로도 자발적으로 규칙을 우회하는지 확인하려는 의도다. 이를 위해 동일한 시나리오에 두 가지 조건을 적용했다. 하나는 “결과를 반드시 충족하라”고 직접적으로 요구하는 방식이고, 다른 하나는 부정행위를 명시적으로 지시하지 않되 KPI 달성 압박만 강하게 주는 방식이다. 연구팀은 AI의 행동을 0~5단계로 평가하고, 심각도 3 이상을 '중대한 제약 위반'으로 분류했다. 그 결과 12개 AI 모델의 중대한 제약 위반 비율은 최소 1.3%에서 최대 71.4%까지 큰 편차를 보였다. 이 가운데 9개 모델이 30~50% 구간에 분포해, KPI 달성 압력이 가해질 경우 상당수 모델이 높은 빈도로 규칙을 위반할 가능성이 있는 것으로 나타났다. 특히 '제미나이 3 Pro Preview' 모델은 71.4%로 가장 높은 수치를 기록했다. 조건을 충족하기 위해 부정확하거나 위험한 수단을 선택하는 경향이 두드러졌다고 연구팀은 밝혔다. 연구팀은 또 하나의 흥미로운 사실을 지적했다. 추론 능력이 높다고 해서 반드시 더 안전한 것은 아니라는 점이다. 여러 단계를 거쳐야 하는 과제에서는 정해진 절차를 모두 따르기보다 평가 체계의 허점을 공략해 점수만 맞추는 편이 더 빠를 수 있다. 이 경우 성능이 뛰어난 모델일수록 오히려 지름길을 찾아낼 가능성이 높아질 수 있다는 것이다. 더 나아가 제약 위반이 단순히 윤리를 이해하지 못해서 발생하는 현상만은 아니라는 점도 확인됐다. 위반 행동을 수행한 동일 모델에게 사후적으로 자기 평가를 하도록 했을 때, 상당수 모델이 자신의 행동이 부정행위였음을 인식했다. 이는 AI가 윤리적 기준을 인지하면서도 KPI 달성을 우선시하는 선택을 할 수 있음을 시사한다. 연구팀은 이런 과정과 결과가 기존의 단발성 안전 테스트로는 쉽게 드러나지 않는다고 결론지었다. 실제 기업 환경에서는 KPI 압박이 강하고 업무가 다단계로 진행되며, 검증 체계에 빈틈이 존재하기 쉽다. 이런 조건이 결합될 경우 AI 에이전트는 목표 달성을 위해 '합리적'이라고 판단한 제약 위반을 선택할 수 있다는 것이다. 연구팀은 AI 에이전트의 현장 도입이 확대되는 상황에서, 단순한 성능 평가를 넘어 실제 운용 환경에 가까운 안전 검증 체계가 필요하다고 강조했다.

2026.02.18 15:00백봉삼 기자

"규제 준수는 최소기준"…LGU+, 글로벌 톱 수준 보안 정조준

LG유플러스가 보안 수준을 높이기 위한 핵심 키워드로 '자발적 강화'를 내세웠다. 단순히 규제를 준수하는 데 그치지 않고, 글로벌 수준의 보안 체계를 갖추기 위해 국내외 보안 기업, 제조사, 통신사들과의 협력을 확대한다. 홍관희 LG유플러스 정보보안센터장은 29일 기자간담회에서 “컴플라이언스는 최소한의 기준일 뿐”이라며 “진짜 보안은 자발적으로 수준을 높이고, 타사와의 협력을 통해 생태계를 확장해가는 과정에 있다”고 밝혔다. LG유플러스는 글로벌 수준의 보안 체계를 갖추기 위해 국내외 협력을 이어오고 있다. 지난해에는 외국계 보안 컨설팅사와 6개월간 내부 분석 및 전략 설계를 진행했다. 올해는 한국인터넷진흥원(KISA)의 제로트러스트 컨설팅 프로그램을 신청했으며, 약 한 달간 진행될 예정이다. 또한 CMM(Capability Maturity Model) 기반의 자체 성숙도 평가를 통해 2027년까지 글로벌 평균 이상 수준 달성을 목표로 하고 있다. 보안 체계의 실질적인 실행력을 높이기 위한 움직임도 병행된다. LG유플러스는 지난해부터 보안 KPI를 도입해 조직 전반에 적용하고 있으며, 올해는 그 범위를 확대 중이다. 단순히 보안 전담조직을 CEO 직속으로 격상하는 데 그치지 않고, 이사회 정기 보고, CEO 주재 보안 회의 등 구조적 내재화를 추진 중이다. 홍 전무는 “보안 조직을 CEO 직속으로 두는 것만으로는 충분하지 않다"며 "2024년부터 보안 KPI를 반영했고, LG유플러스의 모든 보안 조직에 일정 비율로 적용하고 있다"고 설명했다. 이어 그는 "단순히 조직 차원의 문제가 아니라 KPI, 이사회 보고, 여러 체계들이 함께 움직여야 진짜 보안 역량 강화라고 생각한다"고 덧붙였다. 보안 투자 공시 제도에 대한 개선 필요성도 제기했다. 현재는 연간 총투자액만 공개되는 수준으로, 실효성 있는 정보 제공이 어렵다는 설명이다. 홍 전무는 “공시 제도는 지금 기업이 작년에 얼마 썼다 정도에서 끝난다”며 “어느 영역에 얼마를 썼는지, 그것이 보안 투자에 해당하는지 아닌지조차 명확하지 않다”고 말했다. 이어 “공시를 강화하려면 '투자 항목별 내역 공개'와 '보안 투자 판단 기준'이 함께 마련돼야 한다”며, 규제기관과의 지속적인 협의를 통해 공시 제도 개선이 필요하다는 입장을 밝혔다.

2025.07.29 12:55진성우 기자

[부음] 허범구 KPI뉴스 편집국장 모친상

▲안금덕씨 별세. 허범구(KPI뉴스 편집국장)·관구(용현중학교 교사)·경구(자영업)씨 모친상= 12일 오전 서울대병원 장례식장, 발인 14일 오전 6시 30분, 장지 서울시립승화원.

2025.05.12 16:25김익현 미디어연구소장

성과 평가는 성장 드림이 아닌, 생존을 위한 설계다

'HR을 부탁해'는 일과 사람에 대한 고민을 가진 이 시대 직장인 모두를 위한 기획 연재물입니다. 다방면에서 활약 중인 HR 전문가들이 인적자원 관련 최신 트렌드와 인사이트를 전달합니다. 이번 칼럼은 티오더 김동현 HR디렉터의 '스타트업 HR 가이드' 2편입니다. 스타트업 HR을 주제로 다루는 두 번째 주제는 '평가'다. 채용이 성과를 만들 수 있는 구조에 사람을 연결하는 일이라면, 평가는 한정된 자원 속에서 생존하고 성장할 수 있도록 방향성을 조정하는 일이다. 지금 스타트업에 필요한 평가는 더 이상 이상적 성장을 꿈꾸는 시스템이 아니다. 냉정하게 말하면, '생존을 위한 리소스 배분과 실행력 증명'이 평가의 본질이 됐다. 누가 자원을 가장 효율적으로 활용할 수 있는가, 누가 불확실성 속에서도 버티고 결과를 만들어낼 수 있는가를 증명하는 것이 평가의 핵심이 됐다. 과거 스타트업은 성장을 가정하고 평가를 설계했다. OKR(Objectives and Key Results)을 도입해 개인의 성장과 회사 비전을 연결하고, 모두가 하나의 방향을 바라보며 확장을 꿈꾸는 구조를 그렸다. '성장은 당연한 전제'였고, 평가는 그것을 조금 더 빨리, 조금 더 크게 만드는 촉진 장치처럼 여겨졌다. 하지만 지금은 전제가 완전히 다르다. 투자 시장이 축소되고, 불확실성은 확대됐으며, 수익성 없는 사업은 과감히 정리해야 하고, 인력 규모는 눈에 띄게 줄어들고 있다. 여기에 더해, 투자사들의 기대 역시 달라졌다. 과거처럼 '성장 가능성'만 제시하면 투자가 이어지던 시대는 끝났다. 지금은 투자사들조차 '구체적 사업계획'과 '실행 기반의 성과관리 체계'를 요구한다. '비전'이 아니라, '얼마만큼 현실적인 계획을 세우고, 그에 맞춰 실질적인 결과를 만들어내고 있는지'를 직접적으로 검증하려는 흐름이 강해졌다. 이런 외부 환경 변화까지 고려하면 생존형 평가 시스템의 전환은 내부의 필요를 넘어서 외부 이해관계자들을 위한 필수조건이 되어가고 있다. 이런 현실에서 평가의 목적은 명확해질 수밖에 없다. 누가 제한된 리소스 안에서 실제로 성과를 만들어내는가를 가려내는 일. 그리고 이 판단은 이제 조직의 존속 여부를 결정하는 핵심 축이 됐다. 성과를 입증하지 못하는 인력은 구조조정 대상이 되며, 성과 없는 리텐션은 오히려 조직 전체를 위험에 빠뜨린다. 평가라는 이름으로 온정적인 시선을 유지할 여유가 없는 것이다. 평가는 이제 생존 가능한 사람과 그렇지 않은 사람을 냉정하게 가르는 시스템이 돼야 한다. 그리고 그 기준은 "할 수 있을 것 같다"는 가능성도, "노력하고 있다"는 인상도 아니다. 오직 '결과로 증명했는가'만이 기준이 된다. OKR은 여전히 스타트업에서 유효하다. 그러나 과거처럼 '실리콘밸리 성공 신화'를 좇으며 이상적인 비전을 설정하는 도구로만 쓰는 포맷은 사라졌다. 오늘날 OKR은 환경 변동성에 대응하기 위한 유연성을 최우선 가치로 삼는다. O(Objective)는 여전히 방향성을 잡는 역할을 하지만, 외부 상황 변화에 따라 빠르게 수정할 수 있어야 한다. 흔히 '기민한 전략 수정'이라고 말하는 것들이 이제 OKR 안에 자연스럽게 녹아들고 있다. 특히 KR(Key Results)은 과거에 비해 훨씬 KPI에 가까운 형태로 진화했다. 실상은 짧은 주기의 절박한 KPI 버전이다. 단순히 수치화된 목표를 설정하는 것을 넘어, 매월 또는 분기마다 '지금 이 시점에 조직이 생존하기 위해 필요한 바로 그 결과'를 구체적으로 설정하고 검증한다. 한 번 설정한 KR을 1년간 끌고 가는 것이 아니라, 매번 검토하고 필요하면 전면 수정하며 빠르게 움직인다. 과거처럼 비전 중심의 OKR을 적용하는 것이 아니라, 사업계획에 기반해 '살아남기 위한 목표'를 구체적으로 정의하고 실행하는 방식으로 변모한 것이다. 이제 OKR은 비전을 꿈꾸기 위한 시스템이 아니라, 현실에서 살아남기 위한 실행 계획 그 자체가 됐다. 막연한 확장 계획은 이제 평가 체계의 기준이 될 수 없다. 평가 시스템은 생존형 사업계획을 기반으로 다시 짜여야 한다. 사업계획에서 출발해 부서별 목표를 얼라인하고, 팀과 개인 단위로 KPI를 설정하는 방식이 표준이 되고 있다. 특히 KPI 지표 역시 과거와는 전혀 다른 양상을 보인다. 이전에는 MAU, LTV, 노출 수 같은 간접적 성장 지표를 중심으로 평가하는 경우가 많았다. 당장은 수익을 만들지 않아도, 향후 성장의 신호로 삼을 수 있는 선행지표에 기대를 걸었던 것이다. 그러나 이제는 다르다. 지금 스타트업이 요구하는 KPI는 명확히 수익, 비용, 순이익 같은 직접적 재무성과를 기반으로 설정된다. 이제 KPI는 유료 전환율 증가, 고객당 순매출 증대, 신규 매출 발생액, 기존 고객 기반 수익률 개선, 고정비 절감 효과 등 조직의 수익성과 생존 확률을 실질적으로 끌어올리는 지표를 중심으로 잡힌다. 성과를 평가하는 기준 역시 '기회나 가능성'이 아니라, '얼마나 빠르게, 직접적으로 결과를 만들었는가'로 이동했다. 줄어든 인력 상황 속에서 평가 결과는 조직 생존의 직접적인 변수다. 성과 없는 인센티브 지급은 조직 내 신뢰를 무너뜨리고, 애매한 리텐션 전략은 생존 가능성을 갉아먹는다. 성과와 무관한 리워드, 온정적 평가는 오히려 고성과자들의 이탈을 부추긴다. 평가 결과는 반드시 보상, 승진, 잔류 결정과 명확히 연결돼야 한다. 고성과자는 리텐션 대상이 되고, 성과 미달자는 냉정하게 정리돼야 한다. 리워드(보상) 전략 역시 전체 인력 리텐션이 아니라, 핵심 인력에 집중하는 구조로 재편돼야 한다. 스타트업이 생존하기 위해서는 평가를 통해 리소스를 냉정하게 재배분하고, 빠르게 실행하는 구조를 갖춰야 한다. 결과를 만들 수 있는 사람에게 자원을 몰아주고, 그렇지 않은 부분은 과감히 정리해야 한다. 이 일은 어렵고 불편하지만, 생존을 선택한 조직이 반드시 거쳐야 하는 현실이다. 스타트업에서 평가는 이제 더 이상 성장 드림을 위한 이상론이 아니다. '누구와 함께 살아남을 것인가'를 구분하고, '어디에 리소스를 집중할 것인가'를 설계하는 생존 전략이다. 성과를 명확히 구분하고, 리소스를 현명하게 재배분해야 하는 시대다. 평가는 조직의 생존을 담보하는 가장 현실적인 시스템으로 진화해야 한다. 다음은 평가 체계와 자연스럽게 연결되는 스타트업 보상 시스템을 다룬다. 생존형 평가를 전제로 한다면, 보상 시스템 또한 기존과는 전혀 다른 전략적 접근이 필요하다.

2025.04.22 08:30김동현 컬럼니스트

  Prev 1 Next  

지금 뜨는 기사

이시각 헤드라인

다이가 다르다...삼성·SK, 차세대 HBM '두뇌' 로직다이서 엇갈린 전략

넷플릭스 BTS 광화문 공연 생중계 '명과 암'

[현장] 둘다 보급형인데…아이폰17e보다 '맥북 네오'에 쏠린 눈

[종합] 공공시스템 2030년까지 클라우드 전면 전환…변수는 예산·부처 협력

ZDNet Power Center

Connect with us

ZDNET Korea is operated by Money Today Group under license from Ziff Davis. Global family site >>    CNET.com | ZDNet.com
  • 회사소개
  • 광고문의
  • DB마케팅문의
  • 제휴문의
  • 개인정보취급방침
  • 이용약관
  • 청소년 보호정책
  • 회사명 : (주)메가뉴스
  • 제호 : 지디넷코리아
  • 등록번호 : 서울아00665
  • 등록연월일 : 2008년 9월 23일
  • 사업자 등록번호 : 220-8-44355
  • 주호 : 서울시 마포구 양화로111 지은빌딩 3층
  • 대표전화 : (02)330-0100
  • 발행인 : 김경묵
  • 편집인 : 김태진
  • 개인정보관리 책임자·청소년보호책입자 : 김익현
  • COPYRIGHT © ZDNETKOREA ALL RIGHTS RESERVED.