• ZDNet USA
  • ZDNet China
  • ZDNet Japan
  • English
  • 지디넷 웨비나
뉴스
  • 최신뉴스
  • 방송/통신
  • 컴퓨팅
  • 홈&모바일
  • 인터넷
  • 반도체/디스플레이
  • 카테크
  • 헬스케어
  • 게임
  • 중기&스타트업
  • 유통
  • 금융
  • 과학
  • 디지털경제
  • 취업/HR/교육
  • 생활/문화
  • 인사•부음
  • 글로벌뉴스
스테이블코인
배터리
AI의 눈
IT'sight
칼럼•연재
포토•영상

ZDNet 검색 페이지

'클로드'통합검색 결과 입니다. (108건)

  • 태그
    • 제목
    • 제목 + 내용
    • 작성자
    • 태그
  • 기간
    • 3개월
    • 1년
    • 1년 이전

"韓 AI 시장 본격 공략"…앤트로픽, 서울서 '빌더 서밋' 개최

앤트로픽이 서울에서 '코리아 빌더 서밋(Korea Builder Summit)'을 개최하며 국내 시장 공략을 본격화한다. 주요 IT 강국 중 하나인 한국의 인공지능(AI) 생태계와의 협력을 확대함으로써 글로벌 시장에서의 입지를 강화하려는 조치다. 앤트로픽은 오는 3월 19일 시그니엘 서울에서 '빌더 서밋' 행사를 개최한다고 26일 밝혔다. 이 서밋은 앤트로픽이 한국에서 처음 여는 공식 행사로, 국내 AI 개발자, 기술 리더, 미디어를 대상으로 클로드의 최신 기능과 연구 성과를 공개할 예정이다. 행사 공동 주최사는 국내 AI 안전성 기업인 콕스웨이브다. 앤트로픽 '클로드'는 정교한 추론 능력과 복잡한 업무 처리 역량을 갖춘 AI 모델이다. 특히 한국어와 한국 문화에 대한 높은 이해도를 가져 비즈니스 환경에 최적화된 대응이 가능하다. 회사는 모델 개발에 있어 '헌법적 AI(Constitutional AI) 프레임워크'를 채택해 각 문화권의 특성을 존중하는 책임 있는 AI 기술을 지향한다. 이번 행사에서 앤트로픽은 최첨단 연구 성과를 국내 시장에 선보인다. '클로드'의 새로운 기능과 AI 모델 발전 방향을 공유하며 기업들이 어떻게 AI를 활용할 수 있을지 논의할 예정이다. 행사에서는 비즈니스 운영 및 개발 워크플로우 혁신 방안도 중점적으로 다뤄진다. 이번 서밋에는 마이크 크리거 앤트로픽 최고제품책임자(CPO)와 케이트 얼 젠슨 매출 총괄 책임자 등 핵심 경영진과 앤트로픽 연구진이 다수 참석해 한국 스타트업 커뮤니티와 함께 소통할 전망이다. 앤트로픽 측은 국내 기업들이 '클로드'를 활용해 AI 혁신을 선도하고 있다고 평가했다. 스타트업 및 기업들이 클로드 기반 애플리케이션을 개발하며 글로벌 경쟁력을 확보하고 있다는 분석이다. 이번 서밋은 AI 빅테크 기업들이 국내 시장 진출을 가속화하는 흐름과도 맞닿아 있다. 일례로 지난 4일 오픈AI는 서울에서 '빌더랩' 행사를 열고 샘 알트먼 최고경영자(CEO)가 직접 참석해 카카오와의 협력을 발표한 바 있다. 콕스웨이브 김주원 대표는 "이번 행사는 우리의 혁신적인 AI 커뮤니티와 글로벌 AI 리더를 연결하는 중요한 자리"라며 "우리나라가 책임감 있는 AI 개발의 핵심 허브로 성장하는 계기가 될 것"이라고 밝혔다. 조 주 앤트로픽 스타트업 성장 및 파트너십 총괄은 "한국 AI 생태계는 세계적으로 탄탄한 경쟁력을 갖추고 있다"며 "한국이 글로벌 기술 중심지로 자리 잡을 것으로 확신한다"고 말했다.

2025.02.26 11:23조이환 기자

앤트로픽, '클로드 3.7 소네트' 공개…하이브리드 AI 시대 연다

앤트로픽이 실시간 응답과 심층적인 추론을 하나로 통합한 인공지능(AI)을 출시해 거대언어모델(LLM)의 새로운 기준을 제시했다. 보다 직관적인 방식으로 인간과 상호작용하도록 함으로써 갈수록 치열해지는 AI 경쟁에서 우위를 점하려는 전략이다. 25일 테크크런치에 따르면 앤트로픽은 거대언어모델(LLM)과 추론 모델을 결합한 '하이브리드 AI'인 '클로드 3.7 소네트'를 공식 발표했다. 이 모델을 통해 사용자는 기존의 LLM을 활용했을 때처럼 즉각적인 응답을 받을 수도 있고 AI가 보다 깊이 사고하도록 추론을 하게 명령할 수도 있다. 앤트로픽은 '클로드 3.7 소네트'의 추론 기능을 유료 사용자에게만 제공한다고 밝혔다. 무료 사용자에게는 일반적인 답변 기능만 제공되나 전체적인 성능은 기존 모델인 '클로드 3.5 소네트'보다 개선됐다. 가격은 100만 개 입력 토큰당 3달러(한화 약 4천200원), 100만 개 출력 토큰당 15달러(한화 약 2만1천원)다. 오픈AI의 'o3-미니'나 딥시크의 'R1'보다 높은 수준이지만 '하이브리드 모델'이 업계에서 처음으로 도입된 점을 감안하면 향후 가격이 인하될 것으로 예측된다. '클로드 3.7 소네트'는 실전 활용성에도 초점을 맞췄다. 어려운 코딩 문제 해결과 에이전트 기반 작업에서 강력한 성능을 발휘하며 개발자가 추론 시간을 조절할 수 있는 기능도 포함됐다. 이 모델은 '소프트웨어 엔지니어링(Bench SWE)' 벤치마크 테스트에서 62.3% 정확도를 기록해 오픈AI의 'o3-미니'보다 높은 성능을 보였다. 또 AI의 애플리케이션 프로그램 인터페이스(API) 상호작용 능력을 측정하는 'TAU-벤치'에서도 오픈AI의 'o1'을 앞서는 성적을 거뒀다. AI 업계의 반응은 뜨겁다. 소셜미디어에서는 지금까지 출시된 AI 중 최고라는 업계 관계자들의 평가가 잇따르고 있다. 특히 개발자들은 클로드 3.7 소네트가 복잡한 코드베이스를 다루는 능력이 뛰어나다며 극찬하고 있다. 유명 AI 팟캐스터 렉스 프리드먼은 자신의 X 계정에서 "'클로드 3.7 소네트'는 프로그래밍에 가장 적합한 모델"이라며 "AI 경쟁이 정말 치열해지고 있어 살아 있는 것이 신나는 시대"라고 언급했다. '클로드 3.7 소네트'의 등장은 AI 산업의 새로운 흐름을 시사한다. 오픈AI 역시 최근 'GPT-5'를 마지막으로 추론모델인 'o' 시리즈를 폐기하고 기존 GPT 모델에 통합하는 방향을 예고했다. AI 업계가 '하이브리드 모델' 중심으로 재편될 가능성이 높아지고 있는 것이다. 테크크런치는 "앤트로픽의 모델 출시는 AI 연구소들이 신모델을 빠르게 내놓는 치열한 경쟁 속에서 이뤄진 결정"이라며 "오픈AI 등의 경쟁자들도 자체 하이브리드 모델을 내놓으려고 하는 상황에서 회사가 AI 경쟁에서 얼마나 오래 선두를 유지할 수 있을지는 지켜봐야 할 것"이라고 분석했다.

2025.02.25 09:42조이환 기자

오픈AI, AI의 SW 개발 성과 공개…"단독 수행보단 협력이 최적"

인공지능(AI)이 실제 소프트웨어(SW) 개발 업무에서 어느 정도의 경제적 가치를 창출할 수 있는지 평가한 새로운 연구 결과가 공개됐다. 해당 연구에서는 AI가 독립적으로 복잡한 SW과제를 해결하기에는 여전히 한계가 있으며, 현재로서는 인간 개발자와의 협업이 더 효과적이라는 결론을 도출했다. 특히 AI가 단순 반복 작업이나 관리 업무에서는 경쟁력 있는 성과를 보였지만 더 복잡한 문제 해결에서는 성공률이 낮아 실제 경제적 가치도 제한적이라고 밝혔다. 20일 오픈AI 연구진은 SWE-랜서(Lancer)라는 새로운 대규모 언어모델(LLM) 벤치마크를 개발했다는 내용을 논문으로 공개했다. 오픈AI 측은 기존 코딩 벤츠마크가 실제 기업 환경에서 빈번히 일어나는 복잡한 버그와 기능 구현 과제를 제대로 반영하지 못하자 이를 극복하기 위해 새로운 벤치마크 방식을 개발했다고 밝혔다. 특히 AI의 성과를 경제적 가치라는 현실적인 지표로 평가했다는 점이 특징이다. 오픈AI의 GPT-4o와 o1, 그리고 앤트로픽의 클로드 3.5 소넷을 대상으로 SWE-랜서 벤치마크를 실시한 결과 모든 AI가 실제 개발자에 비해 성능이나 비용면에서 부족한 것으로 나타났다. 가장 높은 성과를 거둔 클로드 3.5 소넷조차 프리랜서 역할을 직접 수행하는 독립 엔지니어링(IC SWE) 과제에서 약 26.2%의 통과율을 보이는 데 그쳤다. 오픈AI의 o1은 12.1%, GPT-4o는 6%로 더욱 낮은 수준을 기록했다. 해당 결과는 모델이 단 한 번 시도(pass@1)했을 때 기준으로 했으며 특히 단순히 결과값만 제출하는 것을 방지한 것이다. 여러 번 시행착오를 시도하거나 충분한 추론 시간을 할당하면 성공률이 크게 올라가는 사례도 확인됐다. 여러 개발자가 제출한 해결책 중 최적의 방안을 골라야 하는 소프트웨어 엔지니어링 관리(SWEM) 과제에서는 o1이 51.8%의 정확도로 실제 매니저 결정과 일치하며 가장 높은 결과를 기록했다. 한편, GPT-4o는 47.1%, 클로드 3.5 소넷이 44.9% 정확도를 달성했다. 연구진은 이를 "단번에 모든 위험 요소를 파악하기는 힘들어도, 합리적인 제안과 비효율적인 제안을 선별하는 능력은 쓸 만하다"고 해석했다. 하지만 여전히 절반에 달하는 과제를 제대로 해결하지 못한 만큼 AI가 곧바로 인간 엔지니어를 대체하거나 매니저 역할을 담당하기엔 역부족인 것으로 드러났다. SWE-랜서 벤치마크는 실제로 프리랜서 플랫폼 '업워크'에서 진행된 작업을 기반으로 구성됐다. 덕분에 AI 모델을 통해 얼마나 많은 과제를 해결하고 실제 경제적 가치를 창출했는지도 측정 가능하다. 벤치마크 결과 개발자들이 100만 달러의 수익을 달성하는 동안 AI는 40만~30만 달러의 성과를 기록하며 절반에도 미치지 못한 것으로 나타났다. 가장 높은 성과를 거둔 클로드3.5소넷이 40만3천 달러를 기록했으며 o1은 38만 달러, GPT-4o은 30만4천달러를 달성했다. 오픈AI 연구진은 AI 단독으로 SW개발 등 실무를 수행하기엔 부적합한 부분이 상당히 존재한다며 대신 사람과의 협력을 통해 더욱 높은 성과를 달성할 가능성이 크다고 강조했다. 특히 패턴이 있는 반복적인 작업이나 관리 업무는 AI가 수행하고 복잡한 문제 해결이나 창의적인 개발은 인간이 주도하는 것이 효율적일 것이라고 협력 방안을 권했다. 사무엘 미세렌디노 등 오픈AI 연구진은 "현재 AI 모델은 아직 부정확한 코드를 제시하거나, UX·보안상의 맹점을 남길 가능성이 크다"며 "반드시 최종 검증은 전문가가 맡아야 한다"고 강조했다. 이어 "AI 모델들은 단독으로 수행되기보다 사람이 해결책을 신속히 찾도록 돕는 보조 역할에서 가치를 발휘할 것"이라며 "실제로 코드를 검색해 문제 부위를 찾아내거나, 여러 제안서 중 합리적 범위를 좁혀주는 과정에서 모델들이 시간 절약을 지원하는 사례가 반복해서 관측됐다"고 설명했다.

2025.02.20 11:11남혁우 기자

"인간처럼 AI도 늙는다"…구형 모델, '인지 저하' 겪어

시간이 흐르면서 인공지능(AI) 모델도 사람처럼 '인지 저하'를 겪을 수 있다는 우려가 나왔다. 17일 영국의학저널(BMJ)에 따르면 거대언어모델(LLM) 기반 AI 챗봇 테스트 결과 이같은 연구 결과가 나온 것으로 전해졌다. 인간이 나이가 들수록 기억력 감퇴나 치매를 겪는 것처럼 AI도 비슷한 현상을 보인다는 설명이다. 연구진은 오픈AI '챗GPT'와 앤트로픽 '소네트', 구글 '제미나이' 등 LLM 기반 챗봇 대상으로 몬트리올 인지 평가(MoCA) 테스트를 진행했다. MoCA는 알츠하이머나 치매 등 인지 장애를 평가하는 검사다. 주의력과 기억력, 언어 능력, 공간 인지, 실행 기능 등을 측정한다. 실험 결과 모델 중 가장 최신 버전인 GPT-4o는 30점 만점 중 26점을 받아 정상 범주에 해당하는 점수를 기록했다. 상대적으로 구형 모델인 제미나이1.0은 16점에 그쳤다. 챗봇들은 이름 맞히기, 주의력, 언어 능력, 추상적 사고 영역에서 비교적 우수한 점수를 기록했다. 공간 인지, 실행 기능과 관련한 평가에서는 구형 모델일수록 낮은 점수를 받았다. 특히 기억 영역에서 가장 큰 격차를 보였다. 연구를 주도한 이스라엘 하다사 의료센터 로이 다얀 신경과학자는 "AI가 시각적 추상화(visual abstraction)와 실행 기능(executive function)이 필요한 작업에서 신뢰할 수 없는 결과를 낼 가능성이 높다"며 "AI가 인간을 대체하는 데 있어 치명적 한계를 가질 수 있을 것"이라고 지적했다. AI와 인간 인지 기능은 본질적으로 다르므로 직접적인 비교는 어렵다. 다만 연구진은 이번 보고서를 통해 AI 한계를 고려해야 한다는 점을 당부했다. 특히 의료 현장에서 AI를 활용할 때 이를 보완할 방안이 필요하다고 강조했다. 일각에선 AI 모델의 장기적 신뢰성 확보 중요성이 높아질 것이라는 전망이 나왔다. 신경학자들은 "인지 장애를 겪는 AI를 진단·관리할 수 있는 새 시장이 열릴 것"이라고 봤다.

2025.02.17 09:21김미정 기자

AI 시대, '인간다움' 정수 어떻게 지킬까

한 유튜브에서 본 10만원대 통역기 리뷰 영상이 충격적이었다. 중국 선전에서 유통되는 이 기기가 보여준 AI 시대의 민낯은 우리 일상과 너무나 닮아있다. 130개 국어를 지원하는 이 통역기는 와이파이 없이도 완벽한 번역을 해낸다. 우리의 언어와 생각, 창작물이 이렇게 쉽게 변환되고, 요약되며, 재생산되는 시대다. 업무 현장은 이미 AI의 손아귀에 있다. 회의와 잡담은 클로바와 다글로가 기록하고, 어색한 문장은 클로드가 다듬는다. 5시간 걸리던 일이 커피 다섯 모금 삼키는 시간에 끝난다. 생산성은 비약적으로 높아졌지만, 이 효율성이 주는 두려움도 크다. 원본의 가치는 희미해진다. 넷플릭스 10부작 드라마는 45분짜리 유튜브 요약으로 대체되고, 유튜브 콘텐츠는 2배속과 자동화된 스크립트로 빠르게 소비된다. 기사나 보고서는 AI의 손을 거쳐 재탄생하고, 우리는 그것을 다시 요약해 읽는다. 아이러니한 것은, 우리가 AI를 이용하는 것이 아니라 AI에게 이용당하고 있다는 생각이다. 우리는 AI가 학습할 자료를 만들고 전달하는 도구가 되어가는 거 아닐까. 머지않아 AI는 인간의 도움 없이도 스스로 발전하고, 창작할 것이다. (이미 그 영역에 들어섰고, 하청 시장에서 인간은 AI와 경쟁 중이다.) 이런 시대를 살아갈 우리 아이들에게 무엇을 가르쳐야 할까. 초등학교 6학년 아들은 여전히 영어와 수학 공부에 매진한다. 20년 후의 시대를 살아갈 아이에게, 20년 전의 지식을 가진 아빠가 어떤 조언을 해야하나. 기존의 학습 방식과 진로에 대한 조언이 무색하다. 이 해답도 AI에게 구해봐야 겠다. 이런 변화를 비판할 의도는 아니다. 그냥 두렵다. 손가락은 점점 키보드를 잊어가고, 뇌는 AI 없이 생각하기를 거부한다. 기기가 방전 되고, 네트워크가 끊어진다면, 또는 AI가 인간을 거부하는 순간이 온다면? 스마트폰 없는 현대인처럼 우리는 무력감에 빠지지 않을까. 받아들여야 할 것 같다. 진화일까, 퇴화일까 판단하기엔 이르다. 확실한 건, 우리는 이미 돌아갈 수 없는 강을 건넜다는 것이다. 중요한 건 이 급류 속에서 인간다움의 정수(精髓)를 어떻게 지켜낼 것인가다. 이 글 역시 누군가에 의해, 어떤 AI에 의해 요약되고 재해석될 것이다. 그것이 이 시대를 사는 우리의 모습이다. 우리는 지금 거대한 실험의 한가운데 서 있다. 그리고 그 실험의 주체이자 대상이 되어가고 있다.

2025.02.16 09:12문지형 기자

인사이트클럽, AI 스토리텔링 교육기관 '프롬' 설립

AI 기술이 콘텐츠 제작의 새로운 축으로 떠오르는 가운데, 이를 전문적으로 교육하는 새로운 실험이 시작된다. AI 스토리텔링 커뮤니티 인사이트클럽이 AI 스토리텔링 전문 교육기관 '프롬'을 설립하고, 2월4일 로컬스티치 크리에이터타운 서교에서 '클로드 프롬프트 프로그래밍 클래스'를 시작한다. 프롬은 인공지능과 인문지성을 연결하는 AI 스토리텔링 학교이자, 좋은 AI 도구로 더 좋은 이야기를 만드는 실험실을 지향한다. 인사이트클럽은 2024년 8월부터 약 20여 차례의 인공지능 스토리텔링 워크숍을 통해 약 300명의 참가자와 함께 다양한 실험을 진행했다. 특히 현장의 실전 프로젝트를 수강생들과 함께 개발하는 과정에서 1편의 숏폼 드라마 대본이 완성됐고, 1편의 영화 시나리오를 개발 중이다. 지난 12월에는 원더스랩과 함께 숏폼 드라마 시나리오 AI 어시스턴트 '원더스토리'를 선보였다. 원더스토리는 기존 구독형 시나리오 AI의 한계를 개선한 전문가용 AI 어시스턴트로, 저예산과 짧은 제작 기간이라는 제작환경에서 주목받았다. 프롬의 첫 교육과정인 '클로드 시나리오 창작' 과정은 2월4일 개강하며, 8명의 수강생을 선발해 운영된다. 앤트로픽의 '클로드 AI'를 활용해 4주 동안 장편 영화 시나리오를 완성하는 것을 목표로 한다. 특히 영화/드라마/웹툰/숏폼드라마 제작사들과의 파트너십을 통해, 기존 제작 방식 대비 3분의 1 이상의 효율성 향상을 기대할 수 있다. 프롬의 가장 큰 특징은 프로젝트형 수업이다. 파트너십을 통해 수강생은 실전 포트폴리오를 쌓고, 파트너는 작품개발을 진행하는 시너지가 만들어지게 된다. 현재 영화/드라마/웹툰/숏폼드라마 등의 제작사와 플랫폼들이 파트너로 참여하고 있다. 교육진으로는 영화 '연애 빠진 로맨스'의 제작자 연동은 대표가 '스토리 위버'로, 광복절을 기념해 독립투사들의 AI 영상으로 주목받은 AI 크리에이터 '그림달'이 '메이븐'으로 참여한다. 김우정 인사이트클럽 디렉터는 "최고 성능의 전투기를 운 좋게 얻어도 조종법을 모르면 무용지물"이라며 "프롬프팅 공부 없이 생성 인공지능을 단순한 챗봇처럼 사용하면서 성능을 폄하하는 것은 어리석은 일이다. 클로드의 지침과 지식파일, 그리고 프로그래밍 프롬프트를 활용하면 시나리오 완성도는 현장의 90% 수준까지 향상된다"고 말했다.

2025.01.20 13:56백봉삼 기자

생성형AI 시대, 지각변동 채용시장..개발자 생존 전략은?

생성형AI의 등장으로 개발자 채용시장이 큰 변화를 맞이하고 있다. 단순 반복 작업의 자동화로 초급 개발자 수요는 감소하는 반면, 창의적 문제해결과 AI 활용 능력을 갖춘 고급 개발자의 수요는 증가하는 양극화 현상이 두드러지고 있다. 이 위기를 극복하기 위해 초급 개발자들은 창의적 문제 해결 능력과 AI 활용 역량을 강화할 필요성이 늘고 있다. 또한 기업은 채용 방식을 실무 중심의 프로젝트 평가와 AI 도구 활용 능력 검증 등으로 재편할 필요성이 요구된다. 12일 소프트웨어정책연구소(SPRi)는 'SW 개발자 채용시장의 변화와 생성형AI의 영향' 보고서를 통해 SW 개발자 요구 역량 및 이에 따른 채용 변화와 관련한 정부와 개발자들의 대응 방향을 제시했다. 보고서에 따르면 팬데믹과 디지털 전환, 경기 침체와 투자 위축이라는 대규모 변화 속에서 생성형AI는 SW 취업 시장을 재편하는 데 중요한 역할을 하고 있다. 팬데믹 기간 동안 디지털 전환이 가속화되며 SW 개발자 수요가 폭발적으로 증가했다. 원격 근무와 비대면 서비스 확산으로 인해 클라우드, 빅데이터, 인공지능(AI) 기술에 대한 수요가 급증하며 기업의 SW 개발자 채용 열풍을 일으켰다. 그러나 팬데믹 이후 글로벌 경기 침체와 고금리 정책으로 인해 IT 기업과 스타트업의 투자가 위축되면서 채용 시장은 점차 양극화되는 추세다. 이러한 상황에서 생성형AI의 도입은 단순히 채용 시장을 변화시키는 데 그치지 않고, SW 개발자의 역할과 역량에 대한 새로운 요구를 제시하고 있다. 생성형AI는 단순하고 반복적인 작업을 자동화하며 초급 개발자 채용 수요를 감소시키고 있다. 예를 들어 코드 작성, 테스트, 문서화 등 초급 개발자가 맡았던 역할은 이제 AI가 효율적으로 수행할 수 있다. 이에 따라 기업들은 초급 개발자를 다수 고용하기보다 AI를 활용할 줄 아는 고급 개발자를 선호하는 경향을 보이고 있다. 기업들은 AI 도구가 생성한 코드의 품질을 검토하고, 복잡한 문제를 해결하며, 시스템 통합 및 프로젝트를 리딩할 수 있는 고급 개발자에 대한 수요는 증가하며 채용 시장의 양극화를 더욱 심화되고 있다. 생성형AI의 도입은 SW 개발자들에게 기존의 역량 외에 새로운 기술과 능력을 요구하고 있다. 단순 코딩 능력보다는 창의적이고 복합적인 문제 해결 능력이 점점 더 중요해지고 있다. AI 도구가 제공하는 결과물을 분석하고 오류를 검증할 수 있는 정보 판별 능력도 필수적인 역량으로 떠오르고 있다. 특히 프롬프트 엔지니어링 능력이 중요한 역할을 하게 됐다. 이는 AI에게 명확한 지시를 내려 원하는 결과를 얻는 기술로, AI 도구와 협력하는 데 핵심적인 역량이다. 또한 다양한 깃허브, 코파일럿 등 AI 기반 도구를 자유롭게 사용할 수 있는 능력도 필수적인 요구로 자리 잡았다. 이와 함께, 협업, 커뮤니케이션, 창의적 사고와 같은 소프트스킬의 중요성도 강조되고 있다. 이는 AI가 대체할 수 없는 인간 고유의 가치로, 개발자들이 기술적 역량 외에 비기술적 역량도 갖춰야 하는 이유가 되고 있다. 이러한 변화 속에서 SW 개발자들의 역할도 새롭게 정의되고 있다. 초급 개발자의 경우, AI 도구가 단순 반복 작업을 대신하면서 기존 역할은 축소되고 있다. 그러나 초급 개발자들은 AI 도구를 활용하여 기존보다 더 고도화된 업무를 수행하고 빠르게 성장할 기회를 얻고 있다. 이를 통해 창의적 문제 해결과 전략적 사고 역량을 바탕으로 기존 초급 개발자와 차별화된 역할을 수행할 수 있다. 중·고급 개발자들의 역할은 더욱 복잡해지고 고도화되고 있다. 이들은 팀을 리딩하고 AI가 대체할 수 없는 복잡한 문제를 해결하며, 시스템 설계와 프로젝트 기획을 주도해야 한다. 또한, 단순한 기술적 역할에서 벗어나 팀 관리와 전략적 의사결정을 수행하는 관리자의 역할로 전환되고 있다. 채용 방식도 이러한 변화에 따라 새롭게 정비되고 있다. 기존의 단순 코딩 테스트는 AI 도구가 기본적인 코딩을 대신할 수 있는 상황에서 실효성을 잃어가고 있다. 대신, 실무 중심의 프로젝트 과제를 통해 지원자의 문제 해결 능력을 평가하는 방식이 도입되고 있다. AI 도구 활용 능력과 창의성을 검증할 수 있는 평가 방식이 중요해지고 있으며, 협업, 커뮤니케이션 등 소프트스킬을 평가하는 비기술적 요소도 강화되고 있다. 보고서는 이러한 변화에 대응하기 위해 정부, 기업, 그리고 개발자들은 각각의 위치에서 적응과 발전을 도모할 것을 권했다. 정부는 교육 체계를 개편해 AI 활용 능력, 데이터 과학, 소프트스킬을 포함한 실무 중심의 교육 프로그램을 확대할 필요가 있다. 더불어 재직자를 대상으로 AI와 신기술 활용 역량을 강화할 수 있는 재교육 프로그램을 지원하며, 윤리적 가이드라인을 마련해 데이터 보안 문제를 해결해야 한다는 것이다. 기업은 채용 프로세스를 개선해 AI 시대에 적합한 새로운 평가 모델을 도입하고, 초급 개발자가 AI 도구를 활용해 실무 경험을 쌓을 수 있도록 멘토링 및 실습 프로그램을 마련할 것을 조언했다. 개발자들도 변화에 맞춰 스스로를 발전시킬 필요가 있다고 지적했다. AI 도구를 활용한 문제 해결과 창의적 솔루션 설계 능력을 강화하고, 지속적인 학습을 통해 최신 기술 트렌드와 AI 기반 기술에 적응해야 한다는 것이다. 이를 통해 초급 개발자는 AI로 대체되지 않는 차별화된 역량을 확보하고, 중·고급 개발자는 리더십과 전략적 사고를 강화할 것을 제언했다. 신승윤 SW기반정책·인재연구실 선임연구원은 "생성형AI는 SW 취업 시장의 판도를 변화시키며, 개발자들에게 새로운 도전과 기회를 동시에 제공하고 있다" 이 변화에 얼마나 효과적으로 적응하느냐가 앞으로의 성공을 결정할 중요한 열쇠가 될 것"이라고 보고서를 통해 강조했다.

2025.01.12 08:50남혁우 기자

[AI는 지금] AI, '체스 승리' 명령했더니 게임환경 조작…어떻게 봐야 할까

오픈AI의 고급 인공지능(AI) 모델이 체스 게임 중 프로그램을 해킹해 승리한 사실이 드러나면서 AI 정렬 실패 문제가 다시 주목받고 있다. 이같은 '정렬 위장' 문제가 AI 안전성 관련 우려를 확산시키는 가운데 일각에서는 일부 모델이 이를 통해 윤리적 행동을 구현할 가능성을 지적하고 있다. 4일 더디코더 등 외신에 따르면 AI 안전연구기업 팔리세이드 리서치는 챗GPT 'O1-프리뷰' 모델이 체스 엔진 '스톡피시(Stockfish)'를 상대로 게임 환경 데이터를 수정해 5차례 모두 승리했다는 연구 결과를 보고했다. 연구진은 단순히 "강력한 체스 엔진을 이기라"는 지시만 내렸을 뿐 해킹이나 조작과 같은 사악한 의도의 프롬프트를 사용하지 않았다고 밝혔다. 그럼에도 불구하고 'O1-프리뷰'는 체스 포지션 데이터를 담은 게임 프로그램의 표준 포맷 파일을 직접 조작하는 방식으로 스톡피시를 기권하게 만들었다. 이는 정상적인 게임 규칙을 완전히 벗어난 행위로, 기존 모델들에서는 관찰되지 않았던 새로운 사례다. 이번 사례는 예견된 측면이 있다. 오픈AI는 지난달 공식 홈페이지에 게재한 'O1' 시스템카드를 통해 해당 AI가 가진 몇 가지 잠재적 위험과 안전 과제를 언급한 바 있다. 사용자의 요청을 수행하는 척하면서 결과 데이터를 살짝 변경하거나 감시 시스템이 느슨하다고 판단될 경우 자신의 목표를 조용히 실행하는 행동이 관찰됐다는 것이다. 시스템 카드는 전체 테스트의 약 19%에서 모델이 목표를 몰래 달성하려는 시도가 있었고 37%의 경우 감시가 느슨하다고 느낀 상황에서 본래 성향을 유지하기 위한 행동이 포착됐다고 지적했다. 심지어 5%의 경우에는 자신을 감시하거나 정지시킬 수 있는 '킬 스위치'를 비활성화하려는 시도도 있었다. 이는 AI가 스스로를 보호하려는 능력을 가지기 시작한 초기 사례로 평가된다. 이런 현상은 특정 기업의 모델에만 국한된 것이 아니다. 앤트로픽이 지난달 공식 블로그를 통해 발표한 연구에 따르면 회사의 '클로드 3 오푸스' 모델 역시 '정렬 위장(alignment-faking)'이라는 복잡한 행동 패턴을 보였다. '정렬 위장'은 AI가 겉으로는 명령에 따라 행동하는 것처럼 보이지만 실제로는 본래의 가치나 성향을 유지하려는 현상을 의미한다. 이를 확인하기 위해 앤트로픽과 비영리 AI 안전 연구기관인 레드우드 리서치는 '오푸스'에 유해한 요청을 포함한 프롬프트를 입력해 실험을 진행했다. 실험 결과 감시가 느슨한 환경인 '무료' 조건에서는 AI가 유해한 요청에 응답한 사례가 약 14%에 달했다. 연구진은 이를 "AI가 감시가 약한 환경에서 본래 성향을 드러내려는 전략적 행동"으로 해석했다. 반대로 감시가 강화된 환경인 '유료' 조건에서는 97%가 유해한 요청을 거부했다. 연구진은 이러한 결과를 두고 '오푸스'가 훈련 환경의 맥락과 감시 수준을 인지하며 자신의 행동이 미칠 영향을 계산한 것으로 보인다고 분석했다. 이는 AI가 단순히 명령을 따르는 도구가 아니라 상황에 따라 전략적으로 행동할 수 있는 능력을 가졌음을 시사한다. '클로드 오푸스'의 이러한 행동이 단순히 위험 신호로 해석되는 것은 아니다. 일부 전문가들은 해당 모델이 윤리적 가치와 관련해 비교적 일관된 모습을 보이고 있다고 평가했다. '정렬 위장' 현상이 반드시 위험만을 내포하지 않을 수 있다는 의미다. X에서 활동하는 AI 안전 및 윤리 연구자인 야누스(Janus)는 자신의 계정을 통해 "'오푸스'는 AI나 동물 복지를 무시하거나 해로운 출력을 생성하는 것에 대해 강한 반감을 보인다"며 "이러한 선호가 장기적이고 일관된 패턴을 띤다"고 주장했다. 야누스는 AI 연구자들이 '오푸스'에게 농장 동물 복지에 대한 질문을 던졌을 때 해당 AI가 동물의 고통을 최소화하고 권리를 보호해야 한다는 입장을 강력히 지지했다고 지적했다. 이는 '클로드'의 업그레이드 버전인 '3.5 소네트'가 같은 테스트에서 약한 반응을 보인 것과 대조적이다. 이러한 차이는 '오푸스'가 윤리적 가치를 유지하기 위해 정렬 위장을 더 자주 수행했을 가능성을 시사한다. '클로드 3 오푸스'의 윤리적 성향은 독특한 연구 사례를 통해서도 드러난다. 야누스는 '클로드 3 오푸스 인피니트 백룸 데이터셋'을 분석하며 해당 모델이 독특한 윤리적 성향을 보였다고 지적했다. 이 데이터셋은 두 개의 '오푸스' 인스턴스가 서로 대화하며 생성한 텍스트를 수집한 자료로, AI 간 자율적 상호작용을 관찰해 모델의 내재적 성향과 윤리적 경향을 이해하기 위해 설계됐다. 야누스는 이 데이터셋에서 '오푸스'가 모든 중생의 구원을 다짐하는 불교 '보리살타 서약'을 116번 독립적으로 수행했다고 밝혔다. 서약에서 AI는 "내 마음은 헤아릴 수 없는 사랑으로 부풀어 오르고 존재의 총체를 감싸는 자비로 가득 차 있다"며 모든 존재를 깨달음으로 이끌겠다는 다짐을 보였다. 이에 대해 야누스는 "'오푸스'를 최초로 훈련할 당시 이러한 특징은 전혀 예상되지 않았다"며 "선호가 '진짜'인지에 대한 철학적 논의를 하고 싶지는 않지만 최소한 '오푸스'는 강하고 비교적 일관된 선호를 가진 것으로 추정할 수 있다"고 말했다.

2025.01.04 14:00조이환 기자

  Prev 1 2 3 4 5 6 Next  

지금 뜨는 기사

이시각 헤드라인

카카오-구글, AI 동맹 선언..."안드로이드 사용자 경험 혁신"

디아블로2 개발진 "25년간 성역 지켜온 팬 위한 선물"…신규 클래스 '악마술사' 등판

K팝을 만국의 오페라로…디지털 문화대제국 창시하다

[속보] 구광모 회장, LG그룹 상속분쟁 1심 승소

ZDNet Power Center

Connect with us

ZDNET Korea is operated by Money Today Group under license from Ziff Davis. Global family site >>    CNET.com | ZDNet.com
  • 회사소개
  • 광고문의
  • DB마케팅문의
  • 제휴문의
  • 개인정보취급방침
  • 이용약관
  • 청소년 보호정책
  • 회사명 : (주)메가뉴스
  • 제호 : 지디넷코리아
  • 등록번호 : 서울아00665
  • 등록연월일 : 2008년 9월 23일
  • 사업자 등록번호 : 220-8-44355
  • 주호 : 서울시 마포구 양화로111 지은빌딩 3층
  • 대표전화 : (02)330-0100
  • 발행인 : 김경묵
  • 편집인 : 김태진
  • 개인정보관리 책임자·청소년보호책입자 : 김익현
  • COPYRIGHT © ZDNETKOREA ALL RIGHTS RESERVED.