• ZDNet USA
  • ZDNet China
  • ZDNet Japan
  • English
  • 지디넷 웨비나
뉴스
  • 최신뉴스
  • 방송/통신
  • 컴퓨팅
  • 홈&모바일
  • 인터넷
  • 반도체/디스플레이
  • 카테크
  • 헬스케어
  • 게임
  • 중기&스타트업
  • 유통
  • 금융
  • 과학
  • 디지털경제
  • 취업/HR/교육
  • 생활/문화
  • 인사•부음
  • 글로벌뉴스
  • AI의 눈
반도체
인공지능
AI의 눈
IT'sight
칼럼•연재
포토•영상

ZDNet 검색 페이지

'DGX-A100 GPU'통합검색 결과 입니다. (496건)

  • 태그
    • 제목
    • 제목 + 내용
    • 작성자
    • 태그
  • 기간
    • 3개월
    • 1년
    • 1년 이전

장석복 IBS 원장 "30대 연구단장 뽑아 '돌파형' 연구할 것"

한국기초과학연구원(IBS)이 연구 단장급 연령대를 10년 정도 앞당기는 파격적인 인사를 예고했다. 돌파형 연구를 위한 프로그램도 준비 중이다. 장석복 한국기초과학연구원(IBS) 원장은 지난 1일 기관 운영 방향을 설명하는 기자간담회를 갖고, 이같이 말했다. 장 원장은 "젊은 개척가형 연구자를 모셔, 돌파형 연구가 시작될 수 있도록 계획하고 있다. 독일 막스프랑크나 헬름홀츠 연구소는 노벨상 수상자가 31명이 나왔다. 그들 임용시기가 평균 41~44세고, 일을 처음 시작한 것이 보통 37~38세다"라며 "우리도 연구의 중심 축인 연구단장 임용 시기를 10년 정도 점진적으로 당길 계획"이라고 말했다. 이를 위해 장 원장은 혁신적인 30~40대 연구자가 주도하는 개척가형 연구단을 5년 내 10개 이상 출범시킬 계획이다. "노벨상 수상이 우리가 추구하는 목표는 아니지만, 의미는 있다. 10년 이내 우리도 받을 것으로 기대한다." 장 원장은 우리나라 노벨상 수상에 대해 "통계적으로 보거나 외국에서 노벨상을 받는 잣대 등을 평가해보면, 국내에도 후보자들이 여러 명 있다. 단장급 중에서도 있다. 지금은 조명받지 못할지 몰라도 순식간에 각광받는 인물이 나올 수 있다"며 "조금만 호흡을 갖고 기다려달라. 10년 정도면 기대할 수 있지 않겠나"라며 조심스럽게 전망했다. 개방형 연구생태계 조성에도 목소리에 힘을 실었다. IBS가 그동안 기초연구만 하도록 하는 경직된 연구 방향을 갖고 있었는데, 이를 전면 오픈해 대학이나 출연연구기관, 기업, 병원 등의 연구주체와 협력 연구를 확대할 방침이다. 기초과학 범주를 중요시 하되, 연구단 특성에 맞게 유연하게 가져간다는 것. 장 원장은 "기관운영 기본철학은 '사람이 우선'이다. 사람이 연구분야를 창출하는 관점에서 접근할 것"이라며 "정책이나 연구 방향에 맞춰 연구단장을 임용하는 것이 아니라, 우수한 사람을 먼저 발굴할 것이다. 그가 어떤 연구하든 자율성을 부여할 것"이라고 말했다. 장 원장은 또 "최근 하사비스 구글 딥 마인드 CEO가 노벨상을 받았듯 과학기술이 기초과학을 앞서는 경우도 종종 발생한다"며 "연구분야 역시 기초과학만 고집하지 않고 유연 확장형으로 기관을 운영해 나갈 것"이라고 말했다. 예시로 장 원장은 양자과학, 합성생물학, 신소재, 유전자 치료, 뇌-컴퓨터 인터페이스 등 차세대 연구 분야를 집중 발굴, 육성할 뜻을 내비쳤다. 인공지능(AI)도 강조했다. 장 원장은 "AI가 전 분야에 혁신을 가져오고 있다. 기초과학 분야도 마찬가지다. 효율성과 집중도 면에서 이미 AI역할이 벅찰 정도로 쇄도하고 압도하고 있다. IBS도 AI를 기초과학에 접목하는 방향으로 연구를 이끌어 갈 것"이라고 덧붙였다. 인프라도 확충 문제도 거론했다. 본원 2차 청사를 중심으로 연구 성과 축적과 함께 UNIST, GIST, DGIST 캠퍼스를 순차로 건립해 나갈 계획이다. 또 중이온 가속기(라온) 신임 소장 조기 선임으로 내실화를 기할 방침이다. 장 원장은 "현재 라온은 빔라인이 잘 작동하고 있다"며 "많은 이용자들이 높은 수준의 빔을 이용해 연구를 수행하고, 사용자 중심의 시설로 발전시켜 나갈 것"이라고 언급했다. GPU 1천장 도입 계획…연구영역 확대가 응용분야 한다는 말은 아냐" 이외에 장원장은 질의 응답에서 "돌파형 연구 의미는 그라운드브레이킹(혁신적인)이다. 새로운 지형을 돌파하거나 만드는, 연구영역을 새로 개척하는 것이다. 유명 저널에 연구결과 발표하는 것도 좋지만, 새로운 영역을 만들고 이끌어 내는 연구가 훨씬 더 중용한 일로 여기고, 평가해야 한다"고 강조했다. AI접목과 관련해서는 GPU 1,000장 정도를 도입할 계획이라고 언급했다. 조만간 UNIST에 AI를 기반으로 하는 합성 생물학 분야 연구단이 출범한다는 말도 덧붙였다. IBS 연구영역 확장과 관련 장 원장은 "출연연까지 영구 영역을 넓히려는 것은 아니다"라며 "인위적인 확장이 아니다. 현재는 IBS가 다른 분야 연구진과 협력도 제한적인 상황이다. 이 규제 높이를 좀 들어올려 임상 등의 협업이 원활하게 진행되게 하겠다는 것이다. IBS가 응용 연구를 한다는 건 아니다"라고 못박았다.

2026.07.05 13:13박희범 기자

사이오닉AI, 건물 절반을 데이터센터로 만든 이유는

서울 강남구의 한 건물. 입구에 들어서자 복도 어딘가에서 희미하게 웅웅거리는 진동음이 들려왔다. 의식하지 않으면 지나칠 정도의 미세한 소리였다. 지하 1층부터 지상 7층까지, 총 8개 층으로 이루어진 이 건물은 일반 사무실과 자체 데이터센터가 더해진 통합 AI센터다. 창립 4주년을 앞둔 3년 차 스타트업 사이오닉AI가 빌딩 내부를 직접 개조해 구축한 것이다. 왜 사이오닉AI는 외부 인프라를 활용하는 대신 직접 사내에 데이터센터를 도입하는 선택을 했을까. 3일 사옥에서 만난 고석현 사이오닉AI 대표는 과감한 인프라 투자를 감행한 비전과 숨겨진 기술력을 소개했다. 엔비디아 B300과 HAC 공랭 구조로 이뤄진 데이터센터 안내를 받아 들어간 GPU 센터 내부는 소음을 막고 보안을 강화하기 위해 2단계 격벽을 거쳐 들어가야 했다. 차단문이 열리자 데이터센터 특유의 대규모 장비들이 거세게 돌아가는 소리가 들렸다. 엔비디아(NVIDIA)의 블랙웰 기반 최신 장비인 'B300 GPU' 서버가 탑재된 총 10개의 랙(Rack)이 자리잡고 있었다. 랙당 가격만 수억 원을 호가하는 장비를 스타트업이 어떻게 대량 확보했을까. 고 대표는 오랜 신뢰 관계에 있었다고 답했다. 그는 "네이버 재직 시절부터 엔비디아의 핵심 인프라 코드를 함께 개발하고 글로벌 AI 생태계에서 긴밀히 협력해 온 딥테크 파트너로 활동했다"며 "덕분에 높은 수준의 지원을 받아 구축할 수 있었다"고 설명했다. 냉각 방식은 구조가 공랭식을 선택하되 효율을 극한으로 끌어올리는 '고온 핫아일 컨테인먼트(HAC)' 구조를 적용했다. 서버랙에서 발생하는 고온 열기가 차가운 냉기와 섞이지 않도록 통로를 밀폐·격리해 상부로 뽑아내는 방식이다. 공간이 컴팩트할수록 격리 냉각 효율이 높아지는 원리를 이용해 좁은 사옥 내에서도 기업용으로 충분한 약 0.3메가와트(MW)의 전력 부하를 제어하고 있었다. 건축가 출신 대표'가 설계한 구조 …1년 외부 임대료보다 저렴하게 구축 사이오닉AI 사옥은 건물 전체가 하나의 거대한 'AI 유기체'처럼 맞물려 돌아가도록 치밀하게 설계되어 있다. 고석현 대표가 직접 팔을 걷어붙이고 공간을 레이아웃한 결과물이다. 고 대표는 "네이버 재직 당시 AI 인프라 활용 등의 경험이 구축에 많은 도움을 줬다"고 설명했다. 그 결과 비용 측면에서도 이례적인 성과를 거뒀다. 그는 "기존 경험을 바탕으로 외부 데이터센터를 1년 임대하는 비용보다 더 저렴하게 내부 데이터센터를 구축할 수 있었다"며 "이미 투자 회수는 1년을 넘어선 수준"이라고 밝혔다. 건물의 구조를 살펴보면 인프라 효율과 직원 소통 동선을 고려한 것이 직관적으로 드러난다. 건물 옥상에는 서버에서 발생하는 막대한 열을 외부로 방출하는 대형 냉각 장비들이 쉴 새 없이 돌아가고 있다. 옥상 아래 층에는 데이터센터실이 자리 잡았으며 데이터센터 바로 아랫단에는 간이 회의실이 연결된다. 이어 아래로 내려오면 임직원이 근무하기 위한 사무실과 휴게게공간이 마련됐다 고 대표는 "데이터센터의 진동이나 환경 요소가 업무에 영향을 줄 수 있어 바로 아래층은 회의실로 마련해 실제 업무공간과 분리하려 했다"고 설명했다. 건물의 하층부는 소통과 개방의 공간으로 이뤄졌다. 1층은 외부 손님을 맞이하는 미팅 룸이자 캐주얼하게 담소를 나눌 수 있는 소규모 바(Bar)로 꾸며져 자유로운 분위기를 자아낸다. 건물 가장 아래인 지하 1층은 전 직원이 모이는 전체 회의(올핸즈 미팅)는 물론, 외부 파트너사 교육, AI 관련 세미나, 대외 방송 송출까지 가능한 대형 무대와 강연장이 마련됐다. 고 대표는 "전사 직원을 대상으로 공지를 하거나 이벤트를 할 떄를 비롯해 AI 교육을 위한 전용 공간이 필요해 지하1층에 넓은 공간을 마련했다"며 "사내에 전용공간이 마련된 만큼 민감한 정보 등도 안전하게 공유할 수 있는 장점이 있다"고 설명했다. 사이오닉AI…인프라부터 서비스까지 직접 구축 사이오닉AI는 2023년 고석현 대표가 창업한 AI 스타트업이다. 고 대표는 2017년 네이버가 인수한 컴퍼니AI 공동창업자 출신으로, 이후 네이버 클로바 SW 플랫폼 리더를 거쳐 하이퍼클로바 개발에 참여했다. 대형 언어모델을 처음부터 설계하고 학습시킨 경험이 회사의 핵심 자산이다. 공동창업자들 역시 네이버 AI 연구개발 조직 출신으로, 창업 초기부터 모델·인프라·서비스를 모두 자체 역량으로 구축하는 방향을 택했다. 회사가 표방하는 방향은 'AI 풀스택'이다. 데이터센터(인프라)부터 파운데이션 모델, AI 플랫폼, 에이전트 서비스까지 전 구간을 직접 구축한다는 구상이다. 현재 금융·제조·공공·국방 분야 기업을 대상으로 에이전트 개발과 RAG 기반 솔루션을 공급하고 있으며, 대출 심사·계약 검토·시설 정보 조회 등 반복 업무를 지원하는 AI 에이전트가 주력 제품이다. 지난해 12월 네이버클라우드·IBK기업은행·에이티넘인베스트먼트·삼성벤처투자 등으로부터 250억원 규모의 시리즈A 투자를 유치해 누적 투자금 300억원을 넘겼다. 자체 데이터센터를 구축한 것도 이 풀스택 전략의 연장선이다. 외부 클라우드에 의존하지 않고 폐쇄망에서도 운영 가능한 AI 시스템을 고객에게 공급하기 위해서다. 국방, 안보 관련 사업을 진행할 수 있는 배경도 여기에 있다. 그는 "국방이나 금융 쪽 사업은 외부 클라우드를 쓸 수가 없다"며 "완전히 격리된 환경에서 AI를 구현하고 작동하는 모습을 보여주기 위해선 직접 구축한 것이 상당히 중요한 포인트라 할 수 있다"고 설명했다. 제조·국방으로 사업 확장, 국내 넘어 글로벌 목표 향후 사업 확대의 핵심 축은 제조와 국방이다. 제조 분야에서는 경남·경북 산단과 연계해 피지컬 AI 사업을 추진 중이다. 카메라와 장갑 등 모션 캡처 장비로 사람의 동작 데이터를 수집·학습시키는 시스템을 자체 개발하고 있으며 내년부터 산업부와 연계해 본격 드라이브를 걸 계획이다. 고석현 대표는 "탱크를 매일 운용하거나 비행기를 기동할 수 없는 만큼 시뮬레이션으로 학습하고 이를 실제 필드에 적용하고 데이터를 확보해 보완하는 것이 효율적"이라며 "앞으로 이런 사례가 더욱 늘어나는 만큼 자체 구축한 데이터센터 역할이 더욱 커질 것"이라고 설명했다. 이어 "한국 내수 시장에서 경쟁하는 것만으로는 한계가 있는 만큼 일본을 시작으로 글로벌 시장에서 성과를 내고, 제조·국방·금융 등 산업 전반에 AI를 실질적으로 녹여내는 회사로 성장하겠다며 "모델부터 인프라, 서비스까지 모든 걸 직접 쥐고 있는 것이 우리의 가장 큰 무기로 이를 바탕으로 본격적인 성장에 나설 것"이라고 포부를 밝혔다.

2026.07.03 10:58남혁우 기자

[AI 고속도로] "AI칩 독주 지켜라"…엔비디아, GPU 고객사에 돈줄 댄다

엔비디아가 인공지능(AI) 클라우드 업체에 재무 보증을 제공하고 매출 일부를 공유받는 방식으로 그래픽처리장치(GPU) 판매 생태계를 넓히고 있다. 고가 GPU 구매 부담을 줄여 신생 클라우드 업체의 자금 조달을 돕고, 칩 판매 이후 임대 매출 일부까지 확보하는 구조다. 2일 디인포메이션에 따르면 엔비디아는 자사 GPU를 임대해 수익을 내는 소규모 클라우드 업체를 대상으로 재무 보증 프로그램을 운영하고 있다. 이 프로그램은 엔비디아 내부에서 'AI 컴퓨트 파트너십'으로 불린다. 이는 클라우드 업체가 GPU 임대 수요를 충분히 확보하지 못할 경우 엔비디아가 미사용 GPU를 다시 임대하겠다고 약속하는 방식이다. 대신 참여 업체는 매출 일부를 엔비디아와 공유한다. 엔비디아가 가져가는 비중은 계약 기간이 지날수록 낮아지는 구조로 전해졌다. 디인포메이션은 GPU 클라우드 업체 퍼머스와 샤론AI, 엔비디아와 거래하는 다른 기업 임원 3명이 이 같은 내용을 전했다고 보도했다. 엔비디아 대변인도 해당 프로그램의 존재를 이 매체에 확인해줬다. AI 클라우드 업체 입장에선 GPU 확보가 사업 확장의 주요 변수다. GPU는 AI 데이터센터에서 가장 비싼 부품으로 꼽히는데, 엔비디아 보증이 붙으면 신용등급이 낮거나 업력이 짧은 업체도 대출을 받기 쉬워진다. 엔비디아 입장에선 이 프로그램을 통해 GPU 판매처를 넓히면서 AI 인프라 시장에서 영향력을 키울 수 있을 것으로 보인다. 대형 클라우드 사업자뿐 아니라 GPU 임대 전문 업체까지 자금 조달 구조 안에 묶어두면 칩 공급과 임대 수요에 대한 통제력이 커질 수 있어서다. AI 가속기 시장에서 경쟁이 치열해지고 있다는 점도 엔비디아가 금융 보증까지 꺼낸 이유로 꼽힌다. AMD는 인스팅트 GPU를 앞세워 AI 서버 시장을 확대하고 있고, 구글·아마존웹서비스·마이크로소프트 등 대형 클라우드 사업자들은 자체 AI 칩을 통해 엔비디아 의존도를 낮추려 하고 있다. 이 같은 상황 탓에 엔비디아는 GPU 성능과 소프트웨어 생태계에 더해 자금 조달 지원까지 결합해 대응에 나선 모습이다. 이 프로그램을 통해 AI 클라우드 업체가 초기 인프라를 엔비디아 GPU 기반으로 구축하면 이후 네트워킹, 소프트웨어, 운영 환경까지 엔비디아 생태계에 머무를 가능성이 커진다. 이 구조는 단순한 반도체 공급 계약과 다르다는 점에서도 주목된다. 엔비디아가 칩을 판매하는 데 그치지 않고 고객사의 GPU 활용률과 매출 흐름에 일부 참여하기 때문이다. 이에 업계에선 AI 인프라 시장에서 하드웨어 공급사와 클라우드 사업자 간 경계도 흐려지고 있다고 진단했다. 디인포메이션은 "엔비디아가 강력한 재무제표를 활용해 더 많은 기업이 고가 AI 칩을 구매하도록 돕고 있다"며 "이 과정에서 일부 수익을 되돌려받을 수도 있다"고 말했다. 그러면서 "엔비디아는 GPU 클라우드 업체들이 AI 개발자에게 GPU를 임대하지 못할 경우 미사용 GPU를 다시 임대하겠다고 약속하는 방식으로 신생 클라우드 업체를 재무적으로 뒷받침하고 있다"고 덧붙였다.

2026.07.02 18:07장유미 기자

노키아 "한국은 AI-RAN 가능성 최적화 시장"

글로벌 통신장비 기업 노키아가 한국을 AI-RAN이 실현될 수 있는 최적의 시장으로 꼽아 주목된다. AI데이터센터가 아니라 통신 집중국사에서 추론과 같은 AI 연산을 가능케 할 수 있고, 이를 통해 통신업의 새로운 수익원이 될 것이란 전망도 내놨다. 노키아코리아의 조봉열 박사는 2일 서울 종로구 포시즌스호텔에서 열린 간담회에서 “한국은 집중 국사 아키텍처가 발달하고 기술 수용도가 높아 AI RAN을 실현하기에 가장 최적의 시장”이라며 “노키아는 한국 통신사와 협력해 AI RAN과 6G 시대를 선도해 나가겠다”고 밝혔다. AI-RAN은 표현 그대로 무선접속망(RAN)에 AI 컴퓨팅을 더한다는 뜻이다. 지난해 엔비디아가 노키아에 10억 달러의 지분 투자를 단행하면서 양사는 전략적 파트너 관계를 맺으며 GPU 컴퓨팅을 네트워크 인프라에 접목하는 연구를 한창 이어가고 있다. 노키아는 네트워크에 분산형 AI 컴퓨팅을 도입하고 기지국이 이를 관리하는 AI그리드 역할을 맡는 청사진을 그리고 있다. AI 연산을 데이터센터에 이르기 전에, 네트워크 단계에서 다루는 엣지컴퓨팅 방식이다. 한효찬 노키아코리아 CTO는 “에이전틱 AI와 피지컬 AI가 구현되면 학습보다 훨씬 더 많은 추론이 발생하고, 추론은 멀리 있는 AIDC가 아니라 사용자와 가장 가까운 곳에서 실시간성과 접근성을 가지고 처리돼야 한다”며 “이 지점에서 한국 통신 기업이 글로벌 클라우드 서비스 제공업체와 새로운 비즈니스 모델을 찾을 수 있다”고 말했다. 조 박사는 “SK텔레콤, KT, LG유플러스 등 이통3사 기존 집중 국사에 클라우드 AI-RAN이나 GPU가 탑재된 디지털 신호 처리 장치(DU)를 구축하고 이들을 묶으면, 집중 국사가 중소형 AIDC 역할을 한다”고 짚었다. 노키아는 엔비디아, 미국 티모바일, 일본 소프트뱅크, 동남아 인도삿 등과 협력해 올해 말 AI-RAN 상용화 가능성을 입증할 계획이다. 노키아와 엔비디아의 AI-RAN 협력은 통신사가 AI 인프라를 통해 새로운 수익 창출 구조를 만드는 데 목적을 두고 있고 실제 이통3사는 현재 노키아와 협력해 AI-RAN, 6G 연구 개발 협력을 진행하고 있다. 조 박사는 “대다수 통신사는 디지털 서비스와 AI 서비스를 동시에 제공하고 싶어하지만, 기존 방식 대로라면 RAN과 AI GPU를 따로 구매해 투자해야 했다”며 “AI-RAN을 도입하면 통신과 AI를 하나의 싱글 플랫폼으로 통합할 수 있다”고 설명했다. 이어 “AI-RAN을 활용하면 컴퓨팅 파워를 5G나 6G를 위한 통신 용량으로 활용하다가, AI 수요가 폭발할 땐 AI 추론, 토큰 비즈니스 등 디지털 서비스로 전환할 수 있어, 통신사 투자 효율성이 극대화된다”고 강조했다.

2026.07.02 17:54홍지후 기자

앤트로픽, MS 애저에 '클로드' 배포…"AI 동맹 결실"

앤트로픽이 마이크로소프트 애저를 클로드 공급 채널로 추가 확보하며 기업 인공지능(AI) 시장 범위를 넓혔다. 29일 앤비디아 블로그에 따르면 앤트로픽 AI 모델 '클로드' 제품군이 엔비디아 '블랙웰 울트라' 시스템 기반 마이크로소프트 애저 클라우드에 정식 배포됐다. 앤트로픽과 엔비디아, 마이크로소프트가 추진해 온 450억 달러 규모 AI 협력이 상용 서비스 단계로 들어선 것이다. 이번 배포로 애저 고객은 클라우드 인프라 안에서 클로드를 직접 구동할 수 있게 됐다. 특히 데이터 역외 이전 규제나 역내 처리 요건 때문에 특정 지역 안에서 AI 서비스를 이용해야 하는 기업 클로드 접근성이 높아질 것이란 예측도 나오고 있다. 앤트로픽은 이를 통해 아마존웹서비스(AWS)와 구글클라우드 외 애저 고객까지 고객층으로 끌어들일 수 있게 됐다. 애저에서는 앤트로픽 상위 모델 '클로드 오퍼스 4.8'과 경량 모델 '하이쿠 4.5'가 제공된다. 확장 추론 기능도 지원돼 복잡한 기업 업무 처리 수요에 대응할 수 있다. 이번 조치는 지난해 11월 세 회사가 체결한 전략적 파트너십 후속 실행이다. 당시 엔비디아와 마이크로소프트는 앤트로픽에 각각 100억 달러와 50억 달러 투자를 약속했다. 앤트로픽은 엔비디아 칩 기반 마이크로소프트 클라우드 서비스를 300억 달러 규모로 구매하기로 했다. 엔비디아는 이번 협력을 통해 자사 AI 칩이 클로드 추론 환경에 활용되는 기반을 확보했다고 밝혔다. 기존 학습용 AI 반도체 시장뿐 아니라 추론용 인프라 시장에서도 입지를 강화할 수 있게 됐다는 설명이다. 마이크로소프트는 오픈AI 외에 앤트로픽 클로드까지 애저에 포함해 기업 고객 모델 선택권을 확대했다. 다양한 AI 모델을 원하는 기업 고객을 클라우드에 묶는 효과도 기대하고 있다. 엔비디아는 이번 협력으로 앤트로픽이 기업 시장 확장 발판을 마련할 것으로 보고 있다. 애저 고객까지 공급망에 편입하면서 클로드는 주요 클라우드 3사 기반 기업 고객과의 접점을 모두 넓히게 됐다. 엔비디아는 "기업은 클로드 에이전트에 도메인 특화 역량을 부여할 수 있게 됐다"며 "AI 에이전트를 비즈니스에 깊숙이 내장하고 이를 조직 운영체제로 활용할 수 있다"고 블로그에서 밝혔다.

2026.06.30 13:19김미정 기자

라인게임즈, 에이수스와 맞손…신작 '엠버 앤 블레이드' 에디션 그래픽카드 공개

라인게임즈가자체 개발 신작의 출시를 앞두고, 에이수스와 함께 협업 제품을 선보인다. 라인게임즈(공동대표 조동현·배영진)는 에이수스 코리아와 협력해 신작 '엠버 앤 블레이드' 에디션 게이밍 그래픽카드를 출시했다고 29일 밝혔다. 이번에 공개된 한정판 상품은 'ASUS 라데온 DUAL RX 9060 8G Ember and Blade 에디션 게이밍 그래픽카드'다. '라데온 DUAL RX 9060 GPU'을 기반으로 신작만의 독창적이고 상징적인 비주얼 디자인을 제품 외관에 녹여낸 것이 특징이다. 해당 에디션 제품은 전자제품 전문 쇼핑몰인 다나와와 컴퓨존을 비롯해 11번가, G마켓, 네이버 쇼핑 등 국내 주요 오픈마켓 플랫폼을 통해 편리하게 구매할 수 있다. 아울러 해당 제품 구매 시 제품에 동봉된 엠버 앤 블레이드 캐릭터 스티커와 게임 코드가 제공된다. 이용자는 추후 게임 서비스 시작에 맞춰 해당 코드를 활용해 플레이를 즐길 수 있다. 엠버 앤 블레이드는 개성 있는 그래픽과 박진감 넘치는 액션 등을 통해 에픽게임즈 스토어가 선정한 올해 기대되는 신작 타이틀 20선에 선정된 바 있다. 라인게임즈는 PC 플랫폼인 스팀과 에픽게임즈 스토어는 물론, 콘솔 플랫폼인 플레이스테이션5까지 발매 라인업을 확장했다. 올 하반기 앞서 해보기 버전을 우선 출시하며 글로벌 시장 공략의 첫 발을 뗼 예정이다.

2026.06.29 17:30진성우 기자

인텔, 자체 개발 에이전틱 AI 플랫폼 '슈퍼클로' 베타 공개

인텔이 기업 환경을 겨냥한 에이전틱 AI 플랫폼 '슈퍼클로' 베타 버전을 공개하고 오는 7월 정식 출시한다. 슈퍼클로는 오픈소스 프로젝트 '오픈클로'와 달리 인텔 내부에서 처음부터 자체 개발한 우분투 리눅스 기반 플랫폼이다. 기업 내부에서 거대언어모델(LLM)과 에이전틱 AI를 안전하고 비용 효율적으로 활용하는 데 초점을 맞췄다. 로컬 AI와 검색증강생성(RAG)을 결합하면서도 민감한 데이터를 클라우드로 보내지 않고 기업 내 방화벽에서 자체 처리한다. 또 이용자별 가상 컨테이너를 통해 보안성과 작업 연속성도 강화했다. 인텔은 컴퓨텍스 타이베이 2026에서 아크 프로 B70 기반 워크스테이션과 팬서레이크 노트북을 활용한 시연을 진행했으며, 윈도용 베타 버전을 공개한 데 이어 오는 7월 정식 출시할 예정이다. 인텔 자체 개발... 아크 GPU에 최적화 슈퍼클로는 인텔이 개인용 PC와 워크스테이션을 위해 개발중인 에이전틱 AI 플랫폼이다. 오픈소스 에이전틱 AI 플랫폼 '오픈클로', 이를 기반으로 파생된 엔비디아 '네모클로'와 이름은 비슷하지만 내용물은 전혀 다르다. 인텔 관계자는 "슈퍼클로는 처음부터 인텔이 자체 개발한 코드를 바탕으로 설계했고 오픈클로와 전혀 관계가 없다. 다만 유사한 기술임을 알리기 위해 이름만 비슷하게 가져온 것"이라고 설명했다. 또 GPU 없이 순수 CPU만 있어도 구동이 가능한 오픈클로와 달리 인텔 아크 GPU에 최적화됐다. 워크스테이션·일반 소비자용 아크 GPU, 또는 코어 울트라 프로세서에 내장된 내장 GPU가 반드시 필요하다. 기업이나 조직 내 안전한 AI 활용에 중점 오픈클로와 슈퍼클로가 겨냥하는 플랫폼에도 차이가 있다. 오픈클로는 개인이 미니PC나 노트북에서 여러 반복된 작업을 자동화할 수 있도록 설계됐다. 반면 슈퍼클로는 기업이나 조직 내 AI 활용을 염두에 두고 도커 등 가상화까지 시야에 넣었다. 강력한 GPU를 내장하지 못한 노트북으로 기업이나 조직 내 서버나 워크스테이션에서 거대언어모델(LLM)을 실행하도록 했다. 챗GPT나 제미나이, 클로드 등 클라우드 기반 LLM 대비 일정한 이점을 준다. 클라우드 서비스에 무심코 입력하는 대외비 정보나 개인정보 유출, LLM이 학습하지 못한 정보를 기반으로 인사이트를 얻기 위한 검색증강생성(RAG)시 위험을 최소화할 수 있는 방식이다. 인텔 관계자는 "외부 AI 서비스 활용시 비용과 토큰을 아끼기 위해 기본적으로는 성능이 뛰어난 로컬 AI 모델을 우선한다. 그러나 외부 데이터가 필요하거나 AI 서비스 접근이 필요하면 이용자가 이를 선택할 수 있다"고 설명했다. 컴퓨텍스서 아크 프로 B70 기반 시연 진행 인텔은 이달 초 '컴퓨텍스 타이베이 2026' 기간 중 아크 B70 GPU 탑재 워크스테이션과 코어 울트라 시리즈3(팬서레이크) 노트북에서 구동되는 슈퍼클로를 시연했다. 워크스테이션은 작년 인텔이 공개한 아크 프로 B시리즈 플랫폼 '프로젝트 배틀매트릭스'를 바탕으로 했다. Xe2 코어 32개와 32GB 메모리를 탑재한 아크 프로 B70 GPU 4개를 장착해 800억 개 매개변수 내장 모델 'Qwen3-Coder-Next-80B'를 구동했다. 당시 현장 인텔 관계자는 "널리 알려진 AI 서비스는 이용자가 그동안 주고 받은 대화 내용이나 지시한 작업에 대해 연속성 있는 결과물을 주지 못한다"고 지적했다. 이어 "슈퍼클로는 이런 단점을 보완해 작업 이력, 대화의 문맥을 추적해 보안 걱정 없는 AI 서비스를 제공하는 것이 목표"라고 설명했다. 가상 컨테이너로 보안 강화... 7월 출시 예정 슈퍼클로는 이용자별 가상 컨테이너 할당 기능도 가지고 있다. 이는 정보보호나 보안, 시스템 안정성 면에서도 일정한 이점을 지닌다. AI 에이전트가 수행하는 작업이 다른 이용자의 작업까지 영향을 미치거나 전체 작업을 날리는 치명적인 오류를 막을 수 있다. 인텔은 현재 아크 프로 B70이 장착된 워크스테이션에서 구동되는 슈퍼클로 서버, 그리고 여기에 접근할 수 있는 윈도용 슈퍼클로 앱 베타 버전을 공개했다. 정식 버전은 7월 출시를 앞두고 있다. 코어 울트라 시리즈3는 Xe3 코어 기반 아크 B390 등 강력한 GPU로 LLM 구동이 가능하다. 64GB 메모리를 탑재한 고성능 노트북을 위한 단독 버전도 추후 출시 예정이다.

2026.06.29 15:43권봉석 기자

K-AI 모델 현장 확산 '속도'…방송 제작부터 공공행정·반도체까지

한국 기업이 독자 인공지능(AI) 모델 산업·공공 현장 적용 사례를 넓혀 K-AI 생태계 확산에 속도를 내고 있다. 과학기술정보통신부는 NC AI를 비롯한 업스테이지, KT, SK텔레콤이 방송 콘텐츠 제작부터 공공 업무 효율화, 지방자치단체 행정 AI 전환, 국산 AI 반도체 기반 모델 구동 분야에 K-AI를 적용한다고 29일 밝혔다. NC AI는 MBC 손잡고 방송 콘텐츠 후반 제작 과정에 멀티모달 AI 기술을 도입한다. 그동안 방송산업은 촬영 후 편집과 자막 삽입 등 포스트 프로덕션 과정을 수작업에 의존했다. 이에 NC AI는 시각언어모델 등 멀티모달 기술을 활용해 편집과 자막 삽입 업무의 비효율을 줄이고 전체 제작 공정을 단축할 계획이다. 방송 제작진이 기획과 연출 등 창의적 업무에 더 집중할 수 있도록 지원한다는 구상이다. 업스테이지는 조달청과 공공 업무용 생성형 AI 업무 지원 서비스 공급 계약을 맺고 조달청 공급사로 선정됐다. 업스테이지는 '솔라' 모델과 광학문자인식(OCR) 기반 문서처리 AI 기술을 에이전트로 통합한 '공공 AI 워크스페이스'를 조달청 디지털서비스몰에 등재했다. 공공 AI 워크스페이스는 한글 파일과 워드, PDF 등 문서 형식을 지원한다. 문서 작업 비중이 큰 공공 업무망에서도 안전하고 신속하게 AI를 적용해 업무 생산성과 효율성을 높이는 데 기여할 것으로 기대된다. KT는 경기도청 '경기 생성형 AI 플랫폼 구축' 사업을 통해 공공행정 AI 전환 기반을 마련하고 있다. 이 사업에는 KT가 독자 기술로 처음부터 개발한 AI 모델 '믿음 2.0'과 행정 분야 특화 데이터 체계 구축, 그래픽처리장치(GPU) 기반 AI 인프라 통합형 플랫폼 구현 등이 포함됐다. 경기 생성형 AI 플랫폼은 여러 AI 모델을 적용할 수 있는 개방형 플랫폼 구조로 구축된다. 행정문서를 비롯한 업무지침, 법령, 제도자료 등 행정 정보를 활용해 문서 작성, 자료 정리, 정보 검색, 분석 기능을 제공하고 행정업무 수행을 지원할 예정이다. 경기도는 우리 AI 모델 기반으로 '경기도 생성형 AI 플랫폼 v1.0'과 'AI 거버넌스'에 대한 한국정보통신기술협(TTA) 인증도 받았다. 이를 통해 AI 서비스 신뢰성·안전성과 운영체계에 대한 객관적 검증을 확보했다. SK텔레콤과 리벨리온은 독자 AI 파운데이션 모델 프로젝트 일환으로 SK텔레콤 AI 모델 'A.X K1'을 리벨리온 서버에서 구동했다. 해당 서버에는 국산 AI 반도체 '리벨100'이 탑재됐다. 두 기업은 5천억 파라미터 이상 초거대 모델도 국산 AI 반도체 인프라에서 운영 가능하다는 점을 확인했다. 양사는 지난해부터 에이닷 통화 녹음 요약과 엑스칼리버 등 SK텔레콤 대규모 AI 서비스를 리벨리온 신경망처리장치(NPU)로 운영해 왔다. 이번 사례는 독자 AI 모델과 국산 AI 반도체가 실제 서비스 환경에서 작동할 수 있음을 보여준 결과다. 나아가 SK텔레콤과 리벨리온은 글로벌 반도체 기업 Arm의 중앙처리장치(CPU)와 리벨리온 NPU를 결합한 AI 서버를 공동 개발하고 SK텔레콤 데이터센터에서 실전 검증하고 있다. 정부는 이를 통해 소버린 AI 인프라의 글로벌 표준 정립 가능성도 기대하고 있다. 고현웅 업스테이지 모델테크 매니저는 "AI는 이미 일하는 방식과 산업의 기준을 빠르게 바꾸고 있다"며 "앞으로 기술 경쟁력을 지속적으로 고도화해 우리나라 AI 기술이 다양한 산업 현장에서 실질적인 혁신과 가치를 만들어낼 수 있도록 노력할 것"이라고 밝혔다.

2026.06.29 09:29김미정 기자

"AI 전력 소비 1000분의 1로 줄인다"…신형 AI 아키텍처 등장

생성형 인공지능(AI) 확산으로 데이터센터 전력 소비가 급증하는 가운데, AI 전력 사용량을 현재 대비 1000분의 1 수준으로 줄이겠다는 목표를 제시한 차세대 컴퓨팅 아키텍처가 등장했다. 28일 데이터브릭스 AI 부문 총괄 출신 나빈 라오 최고경영자(CEO)가 설립한 언컨벤셔널AI는 지난 25일 첫 번째 AI 모델 'Un-0'를 공개했다. 언컨벤셔널AI는 새로운 컴퓨팅 아키텍처를 통해 AI 추론에 필요한 전력 소비를 최대 1000배까지 줄일 수 있다고 주장했다. 현재 챗GPT를 비롯한 대부분의 생성형 AI는 엔비디아 GPU 수천~수만 개를 동원해 연산을 수행한다. AI 모델이 커질수록 전력 소비도 급격히 증가한다. 이로 인해 업계에서는 앞으로 AI 발전을 가로막는 가장 큰 문제가 반도체 부족이 아니라 전력 부족이 될 수 있다는 우려도 커지고 있다. 언컨벤셔널AI는 문제의 원인을 GPU 성능이 아닌 컴퓨터 구조 자체에서 찾았다. 더 많은 GPU를 사용하는 대신 계산하는 방식 자체를 바꾸겠다는 것이다. 회사가 공개한 Un-0는 이미지를 생성하는 AI 모델이다. 아직 실제 반도체가 아닌 소프트웨어 시뮬레이션 환경에서 동작하지만 기존 AI와 다른 방식으로 이미지 생성이 가능하다는 점을 보여주는 데 의미가 있다. 핵심은 '오실레이터'라 불리는 진동 기반 물리 시스템이다. 컴퓨터 칩 안의 트랜지스터가 계산을 수행하는 대신 여러 진동 장치가 서로 영향을 주고받으며 변화하는 과정 자체를 계산에 활용하는 방식이다. 언컨벤셔널AI는 자연스럽게 동기화되는 물리 현상을 계산에 활용함으로써 기존 GPU보다 훨씬 적은 에너지로 AI 연산을 수행할 수 있을 것으로 보고 있다. 나빈 라오 CEO는 "이번 모델은 새로운 종류의 컴퓨터가 보내는 첫 번째 인사"라며 "궁극적인 목표는 현재 AI 시스템보다 약 1000배 적은 에너지로 AI를 구동하는 것"이라고 밝혔다. 이 같은 비전에 투자자들도 주목하고 있다. 언컨벤셔널AI는 시드 투자 단계에서 4억7500만 달러(약 6600억원)를 유치했고, 기업가치는 45억 달러(약 6조2000억원)로 평가받았다. 세쿼이아, 안드레센 호로위츠(a16z), 럭스캐피털, 제프 베이조스 등이 투자에 참여했다. 아직 상용 제품이나 실물 칩도 없지만 AI 산업이 직면한 가장 큰 문제인 전력 문제를 해결할 수 있다는 가능성만으로 수조 원대 가치를 인정받은 셈이다. 다만 언컨벤셔널AI의 기술은 시뮬레이션 환경에서 얻어진 연구 성과로 실제 반도체와 데이터센터 환경에 대한 검증은 필요한 상황이다. 나빈 라오 CEO는 "AI 발전의 다음 과제는 성능이 아니라 에너지 효율"이라며 "단 20와트의 전력으로 작동하는 인간의 뇌처럼 적은 에너지로도 지능을 구현할 수 있는 새로운 컴퓨팅 기반을 구축하고 있다"고 말했다. 이어 "궁극적으로는 AI를 더 저렴하고 접근하기 쉬운 기술로 만들어 모든 사람이 그 혜택을 누릴 수 있도록 하는 것이 목표"라고 덧붙였다.

2026.06.28 07:41남혁우 기자

[ZD SW 투데이] 정철 나무기술 대표, '정보인의 날' 공로상 外

지디넷코리아가 소프트웨어(SW) 업계의 다양한 소식을 한 눈에 볼 수 있는 'ZD SW 투데이'를 새롭게 마련했습니다. SW뿐 아니라 클라우드, 보안, 인공지능(AI) 등 여러 분야에서 활발히 활동하고 있는 기업들의 소식을 담은 만큼 좀 더 쉽고 편하게 이슈를 확인해 보시기 바랍니다. [편집자주] ◆정철 나무기술 대표, '정보인의 날' 공로상 수상 정철 나무기술 대표가 서울 서초구 더 리버사이드호텔에서 열린 '제40회 정보인의 날 기념식'에서 한국인공지능·소프트웨어산업협회 공로상을 수상했다. 정철 대표는 엔터프라이즈 정보기술(IT) 분야에서 쌓은 기술 역량을 바탕으로 기업 현장의 AI 전환과 운영 체계 고도화를 추진해 왔다. 에이전틱 AI 플랫폼 중심 사업 확대와 공공·민간 협력을 통한 AI 활용 기반 마련, 클라우드·소프트웨어 산업 정책 제언과 생태계 활성화에 힘썼다는 평가다. 정보인의 날은 국내에 처음으로 컴퓨터가 도입된 1967년 6월 24일을 기념해 제정된 행사로, 정보통신 분야 발전에 기여한 유공자를 발굴·격려하기 위해 매년 열린다. 제40회 기념식은 한국IT전문가협회가 주최하고 한국인공지능·소프트웨어산업협회 등 10개 정보통신 관련 협·단체가 공동 주관했다. ◆솔트웨어, '공공 AI 산업 박람회'서 AI 보안 솔루션 소개 솔트웨어가 지난 23일부터 24일까지 경기 고양시 킨텍스에서 열린 '2026 공공 AI 산업 박람회(KPAIX)'에 참가해 생성형 AI 보안 솔루션 '사피가디언(Sapie-Guardian)'을 선보였다. 사피가디언은 챗GPT, 클로드 같은 서비스형소프트웨어(SaaS) AI의 입력(프롬프트)과 출력(응답) 구간에서 실시간 모니터링과 유사도 기반 필터링 기능을 제공한다. 이를 통해 개인정보와 내부 업무자료, 기밀 데이터 등 민감정보의 외부 유출을 막고 AI 사용 정책 수립과 운영 현황 관리 기능으로 공공기관의 안전한 AI 도입을 지원한다. 솔트웨어는 현장에서 데이터 유출 시나리오와 보안 통제 과정을 시연했다. 부스를 방문한 공공기관 정보화 담당자 및 디지털 혁신 관계자들과의 상담도 진행했다. ◆디딤, 'K-AI PaaS 서밋'서 AIOps 위한 하네스 운영 전략 발표 디딤이 한국인공지능클라우드산업협회(KACI)가 주최한 'K-AI PaaS 서밋 2026'에 참가해 인공지능 기반 IT운영(AIOps) 구현을 위한 '하네스(Harness)' 도입·운영 전략을 발표했다. 발표자로 나선 장정호 디딤 AX연구1센터장은 클라우드 환경의 복잡도와 운영 데이터가 급증하면서 관리서비스업체(MSP) 관점에서 AIOps 도입이 핵심 경쟁력이라고 강조했다. 다만 검증 없이 AI에 시스템 변경 권한을 전적으로 위임할 경우 오조치로 인한 장애 등 위험을 초래할 수 있다고 지적했다. 디딤이 제시한 해법은 통제된 자율을 구현하는 하네스 체계로, AI 에이전트 계층과 실제 인프라 실행 계층 사이에 운영자가 설계한 정책과 구조를 두는 전략이다. 디딤의 하네스 전략은 안전 게이트(쓰기 작업 전 검증), 멀티테넌시(고객 간 자격증명 격리), 감사 추적(모든 행위 기록) 등 3대 정책을 강제한다. 디딤은 검증된 권한만 단계적으로 허용하는 '통제형 자동화 아키텍처'로서의 하네스 실현 방안과 고객별 운영 정책 커스터마이징 전략도 소개했다. ◆한국데이터센터연합회, 데이터센터 역량강화 교육 2차 과정 모집 한국데이터센터연합회(KDCC)가 급변하는 데이터센터 산업 환경에 대응하고 현장 중심 전문인력을 양성하기 위해 '데이터센터 역량강화 교육' 2차 과정을 개설했다. 이 교육은 유료 과정으로 올해 총 3회 운영되며 지난달 열린 1차 교육은 모집 정원이 조기 마감됐다. 2차 교육은 다음달 22일과 23일 서울역 삼경교육센터에서 진행되고 3차 교육은 10월로 예정됐다. 한국데이터센터연합회는 이번 과정을 공통 분야인 데이터센터 시장 현황·정책·제도와 특화 분야인 시장·기술·사례 중심으로 구성했다. 데이터센터 산업 종사자들이 단편적 기술 이해를 넘어 구축·운영·리스크관리·지속가능성 대응을 포괄하는 종합적 관점을 갖추도록 하는 데 중점을 뒀다. 교육 신청은 다음달 17일까지 한국데이터센터연합회 홈페이지의 온라인 신청서를 통해 가능하다. ◆한국컴퓨팅산업협회, 'GPU 프로그램 모델 및 최적화' 교육과정 개설 한국컴퓨팅산업협회가 다음달 '그래픽처리장치(GPU) 프로그램 모델 및 최적화' 교육과정을 개설한다. 이 과정은 과학기술정보통신부 지원으로 운영 중인 'HPC 이노베이션 허브' 일환이다. 최신 고성능컴퓨팅(HPC) 시스템 구조와 GPU 아키텍처 이해부터 오픈CL·SYCL 프로그래밍 모델, GPU 연산과 메모리 최적화, 멀티 GPU 활용, 엔사이트(Nsight) 기반 프로파일링 방법론까지 산업 현장의 요구를 반영해 구성됐다. 참가자는 GPU 아키텍처와 프로그래밍 모델을 학습하고 실습 코드에 적용해 최적화와 분석을 실시간으로 진행할 수 있다. 한국컴퓨팅산업협회는 빅데이터·AI 개발자, 시스템 엔지니어, HPC 소프트웨어 개발자를 대상으로 커리큘럼을 고도화하고 중소·스타트업이 HPC 기반 AI 신사업을 추진하도록 지원을 이어갈 방침이다.

2026.06.26 16:45이나연 기자

NHN클라우드, AI 인프라 '글로벌 톱20' 진입…"국내 최고 성능"

NHN클라우드가 글로벌 슈퍼컴퓨터 생태계에서 인공지능(AI) 인프라 역량을 인정받았다. NHN클라우드는 AI 인프라 브랜드 'NHN 팩토리X'의 그래픽처리장치(GPU) 클러스터가 최근 공개된 '글로벌 슈퍼컴퓨터 톱500'에서 국내 가장 높은 순위로 이름을 올렸다고 26일 밝혔다. 글로벌 슈퍼컴퓨터 톱500은 전 세계 슈퍼컴퓨터의 연산 성능을 측정해 순위를 발표하는 대표 성능 평가 지표다. 고성능컴퓨팅(HPC) 분야 연구기관과 전문가들이 매년 6월과 11월 최신 순위를 공개하며 글로벌 AI·과학기술 인프라 경쟁력을 가늠하는 기준으로 활용된다. NHN클라우드의 B200 GPU 4080장으로 구축한 'NIPA-CL1'은 글로벌 20위이자 국내 1위를 기록했고 B200 GPU 2040장 기반 'NIPA-CL2'는 글로벌 40위이자 국내 4위에 올랐다. 이번 GPU 클러스터는 과학기술정보통신부의 GPU 확보·구축·운용 지원사업을 통해 확보한 엔비디아 B200 GPU 7656장을 기반으로 구축됐다. NHN클라우드는 4080장 규모의 NIPA-CL1과 2040장 규모의 NIPA-CL2를 구축하며 국내 상위 5대 슈퍼컴퓨터 가운데 2대를 운영한다. NIPA-CL1은 실제 측정 최고 성능(Rmax) 기준 137.4페타플롭스(FLOPS)를 기록했다. NIPA-CL2는 68.42FLOPS를 달성했다. NHN클라우드는 광주 국가 AI 데이터센터 운영 경험을 바탕으로 GPU 클러스터링 효율을 높였다. 인피니밴드 기반 초고속 네트워크와 AI 전용 데이터센터 기술을 적용했다. AI 전용 데이터센터 '팩토리X 서울'에는 랙당 75킬로와트(kW)급 고밀도 환경을 지원하는 100% 수랭식 GPU 냉각 시스템이 적용됐다. 이를 통해 기존 공랭식 대비 인프라 안정성을 높인 것으로 전해졌다. NHN클라우드는 이번 성과가 국내 AI 인프라가 글로벌 수준에 도달했음을 보여주는 사례라고 평했다. 또 정부 AI 컴퓨팅 자원 확충 정책 성과로 해외 의존도 높던 대규모 AI 연산 인프라를 국내에서 공급할 기반을 마련했다고 강조했다. NHN클라우드는 GPU 클러스터 최적화와 수랭식 데이터센터 설계 경험을 담은 'NHN 팩토리X 기술 백서'도 공개했다. 백서에는 AI 전용 데이터센터 구조 GPU 클러스터 구성 고속 네트워크 인터커넥트 D2C(Direct-to-Chip) 수랭식 인프라 GPUaaS 플랫폼 운영 구조 엑사스케일 클러스터 구축 사례 등이 포함됐다. 김동훈 NHN클라우드 대표는 "우리가 국가 AI 인프라 확보 사업 최전선에서 활약하고 있다는 것을 증명했다"며 "뛰어난 GPU 클러스터 구축 역량을 통해 명실상부한 국내 1위 AI 인프라 운영 기업으로 우뚝 섰음을 의미한다"고 밝혔다.

2026.06.26 15:59김미정 기자

[영상] "AI 실수도 기업 책임"…생성형 AI 시대, 리스크 관리가 생존 전략

생성형 인공지능(AI)이 기업 업무와 서비스 전반으로 확산되면서 새로운 과제가 떠오르고 있다. AI가 생산성을 높이고 업무 혁신을 이끄는 동시에 잘못된 답변과 보안 문제, 예기치 못한 오작동이 기업 리스크로 직결되고 있기 때문이다. 특히 AI가 고객과 직접 소통하는 서비스 영역으로 확대되면서 기업은 단순히 모델 성능을 높이는 것을 넘어 AI가 어떤 답변을 내놓고 어떤 행동을 수행하는지까지 관리해야 하는 상황에 직면했다. 생성형 AI 도입이 실험(PoC) 단계를 넘어 실제 서비스 운영 단계로 이동하면서 'LLM 옵저버빌리티(Observability)'가 새로운 기업 IT 과제로 부상하고 있다. 고지훈 와탭랩스 애플리케이션 팀 리드와 신민철 애플리케이션 팀 개발자는 26일 지디넷코리아와의 영상 인터뷰에서 생성형 AI 시대 기업이 마주할 변화와 이에 대응하기 위한 LLM 옵저버빌리티의 중요성을 강조했다. 고 팀장은 "AI가 제공한 답변이라도 결국 고객은 기업이 제공한 공식 정보로 받아들인다"며 "AI 서비스 운영 단계에서는 응답 품질과 신뢰성을 지속적으로 관리하는 체계가 필수"라고 말했다. AI 실수, 이제는 기업이 책임져야 고 팀장은 주요 사례로 캐나다 항공사 에어캐나다를 소개했다. 한 고객이 챗봇에 할인 혜택 적용 가능 여부를 문의하자 에어캐나다의 챗봇은 실제 존재하지 않는 할인 상품을 안내했다. 고객은 이를 믿고 항공권을 구매한 뒤 할인을 요구했지만 에어캐나다가 이를 거부하면서 법적 분쟁으로 이어졌다. 캐나다 법원은 'AI가 응답한 내용이라도 게시된 정보에 대한 책임은 기업에 있다'고 판단했다. 이에 에어캐나다는 패소했고 금전적 보상은 물론 기업 신뢰도에도 타격을 입었다. 신 개발자는 "AI 챗봇의 답변이 기업의 공식 입장으로 간주되는 사례가 실제로 빈번하게 발생하고 있다"며 "잘못된 응답 하나가 직접적인 비용 손실과 브랜드 신뢰도 하락으로 이어질 수 있다"고 설명했다. 고 팀장은 "작년까지는 많은 기업이 AI를 시범 적용하는 수준에 머물렀지만 올해부터는 금융, 공공, 엔터프라이즈를 중심으로 실제 서비스에 적용하는 사례가 빠르게 늘고 있다"며 "응답 품질을 관측할 체계 없이 서비스를 출시하는 기업도 적지 않다"고 지적했다. "지표는 정상인데 고객은 불만"…AI 시대 등장한 새로운 장애 문제는 기존 모니터링으로는 AI 응답 오류를 감지할 수 없다는 점이다. 서버·네트워크 지표가 정상이어도 AI가 잘못된 답변을 내보내면 알 방법이 없다. 고 팀장은 "CPU·메모리는 정상인데 고객 불만이 폭증하는 새로운 유형의 문제가 생긴다"며 "기존 인프라 모니터링만으로는 응답 품질 이상을 잡아낼 수 없다"고 말했다. 보안 위협도 새로운 형태로 진화했다. AI 에이전트가 코드 실행·시스템 제어까지 수행하게 되면서 악의적 입력으로 AI가 의도치 않은 동작을 하도록 유도하는 '프롬프트 인젝션' 공격이 현실화됐다. 와탭랩스 내부에서도 악의적 입력 없이 AI가 잘못된 판단을 내려 개발 PC 폴더가 통째로 삭제되는 사고를 경험했다. AI 보안 위협 역시 새로운 변수로 떠오르고 있다. 신 개발자는 "과거 LLM은 단순히 텍스트를 생성하는 수준이었지만 이제는 함수 호출, 코드 실행, 외부 시스템 제어까지 가능한 에이전트 형태로 발전하고 있다"며 "프롬프트 입력 하나가 실제 시스템 동작으로 연결될 수 있다"고 설명했다. 대표적인 위협은 '프롬프트 인젝션(Prompt Injection)'이다. 이는 특정 입력을 통해 AI가 의도하지 않은 행동을 수행하도록 유도하는 공격 방식이다. 특히 AI가 다양한 시스템과 연결될수록 피해 범위도 커질 수 있다. 와탭랩스 역시 내부 실험 과정에서 예상치 못한 사례를 경험했다. 오케스트레이션 기반 AI 개발 환경을 테스트하던 중 악의적 입력이 없었음에도 AI가 잘못된 판단을 내려 개발 PC의 특정 폴더를 삭제하는 사고가 발생한 것이다. 신 개발자는 "중요한 것은 사용자가 공격 의도를 갖지 않았더라도 AI가 예기치 않은 행동을 할 수 있다는 점"이라며 "AI가 어떤 과정을 거쳐 해당 결정을 내렸는지 추적하고 통제할 수 있어야 한다"고 말했다. GPU 다음은 LLM 운영…기업 AI 운영 경쟁 본격화 와탭랩스는 이러한 문제에 대응하기 위해 LLM 옵저버빌리티 솔루션을 선보인다. GPU 자원 사용량부터 애플리케이션 성능, AI 응답 품질까지 전체 흐름을 연계 분석해 서비스 운영 환경에서 발생하는 오류와 장애를 통합 관리한다. 주요 감시 항목은 ▲AI 답변 적합성·정확성 ▲할루시네이션(없는 정보를 만들어내는 AI 환각 현상) ▲프롬프트 인젝션 공격 ▲개인정보 포함 여부 ▲불필요한 응답 우회 경로 ▲토큰·GPU 리소스 효율 등이다. 특히 보안상 외부 AI 서비스를 사용할 수 없어 GPU를 직접 구축해 모델을 운영하는 국내 금융·공공기관에 적합하게 구현됐다. 자체 GPU로 모델을 운영하는 환경에서는 AI 응답에 쓰이는 토큰이 GPU 자원과 직결되기 때문에, 응답 경로를 최적화하면 처리 성능과 비용 효율을 동시에 높일 수 있다는 설명이다. 신 개발자는 "AI 서비스를 운영하는 기업이라면 응답 품질부터 보안 위협까지 한 플랫폼에서 감시할 수 있는 체계를 갖춰야 한다"며 "단순히 있으면 좋은 도구가 아니라 서비스 신뢰도를 지키는 핵심 인프라"라고 강조했다. 고지훈 팀장은 AI 시대 운영자의 역할 변화도 예고했다. 그는 "앞으로 운영자는 데이터를 직접 분석하는 사람이 아니라, AI가 안전하게 작동할 수 있는 가드레일을 설계하는 사람이 될 것"이라며 "인프라·애플리케이션·AI 모델을 통합 관측하는 체계가 기업 경쟁력을 좌우하게 될 것"이라고 강조했다.

2026.06.26 10:40남혁우 기자

메가존클라우드, 과기정통부 국산 AI반도체 실증 인프라 구축 참가

정부에서 추진하는 대규모 국산 인공지능(AI) 반도체 인프라 구축에 메가존클라우드(대표 염동훈)가 힘을 보탠다. 메가존클라우드는 과학기술정보통신부와 정보통신산업진흥원(NIPA)이 주관하는 'AI컴퓨팅 실증 인프라 고도화' 2차년도 사업에 참여한다고 25일 밝혔다. 이번 사업은 국산 AI반도체를 기반으로 대규모 인프라를 구축하는 국가 과제다. 대규모언어모델(LLM) 기반 서비스와 GPU, NPU 혼용 환경을 실증한다. 메가존클라우드는 국산 NPU 기반 클라우드 인프라의 통합 운영 전반을 담당한다. NPU 자원할당과 통합 관리 모니터링 소프트웨어(SW)를 개발한다. AI컴퓨팅 인프라 통합 운영·관제 인프라도 구축한다. 국산 AI반도체가 실제 서비스 환경에서 안정적으로 작동하도록 돕는 역할이다. 이번 사업은 오는 2027년까지 3개년에 걸쳐 추진된다. 올해 2차년도 목표는 연산용량 60페타플롭스 이상의 컴퓨팅 인프라 구축이다. 메가존클라우드는 지난해에 이어 2년 연속 참여해 운영 안정성을 높일 계획이다. 이번 사업에는 퓨리오사AI, 리벨리온, NHN클라우드, 하이퍼엑셀, 네이버클라우드 등이 컨소시엄으로 함께 참여한다. 사업 성과는 제조, 금융, 헬스케어, 교육 등 다양한 산업군의 AI 서비스 고도화에 활용된다. 메가존클라우드는 국산 AI반도체의 해외 실증도 이끈다. 지난 5월 'AI-반도체 해외실증 지원 사업' 주관사업자로 선정됐다. 사우디아라비아 아람코 디지털을 대상으로 퓨리오사AI의 2세대 NPU 'RNGD' 기반 AI 서비스를 실증하고 있다. 황인철 메가존클라우드 CRO는 "국산 AI반도체의 상용화 경쟁력은 실제 서비스 환경에서 안정적으로 운영하고 확장할 수 있는 클라우드 플랫폼 역량이 함께 뒷받침돼야 한다"며 "국내 인프라 구축과 해외 현장 실증 양면에서 경험을 축적해 국산 AI반도체 생태계의 실질적인 성숙에 기여하겠다"고 말했다.

2026.06.25 15:30남혁우 기자

오픈AI도 자체 칩 승부수…'할라페뇨'로 엔비디아 의존 줄인다

오픈AI가 인공지능(AI) 추론 전용 반도체를 직접 설계하며 칩부터 모델, 서비스까지 아우르는 '풀스택' 전략에 본격 시동을 걸었다. 오픈AI는 24일(현지시간) 브로드컴과 공동 개발한 첫 AI 추론 가속기 '할라페뇨'를 공개했다. 올해 말부터 데이터센터에 배치할 예정인 이 칩은 두 회사가 함께 구축하는 다세대 컴퓨팅 플랫폼의 첫 제품이다. 오픈AI는 할라페뇨 초기 테스트에서 와트당 성능이 현존 최고 수준을 크게 웃돌았다고 설명했다. 최종 성능은 측정 중이며 세부 기술 보고서는 수개월 내 공개할 예정이다. 혹 탄 브로드컴 최고경영자(CEO)는 로이터 통신에 "할라페뇨는 엔비디아의 블랙웰 칩이나 구글의 텐서처리장치(TPU)와 대등한 성능을 갖췄다"고 말했다. 할라페뇨는 기존 AI 가속기를 개조한 범용 칩이 아니라 최신 거대언어모델(LLM) 추론을 겨냥해 처음부터 새로 설계됐다. 챗GPT·코덱스·응용 프로그램 인터페이스(API)를 매일 운영하며 쌓은 데이터가 반영됐다. 초기 설계부터 파운드리(반도체 수탁생산) 공장에 넘기는 '테이프아웃' 단계까지는 9개월밖에 걸리지 않았다. 이에 대해 양사는 고성능 첨단 반도체 분야에서 가장 빠른 주문형 반도체(ASIC) 개발 주기라고 강조했다. 할라페뇨는 대만 TSMC가 양산하며 삼성전자와 SK하이닉스가 브로드컴에 메모리 칩을 공급한다. 블룸버그 통신에 따르면 두 회사는 차기 칩을 2028년에 내놓고 이후 매년 새 칩을 선보일 계획이다. 최근 AI 모델 시장을 이끄는 기업들은 자체 칩을 확보해 엔비디아 의존도를 낮추는 전략을 추진하고 있다. TPU를 앞세운 구글에 이어 오픈AI도 할라페뇨를 통해 자체 추론 칩을 선보였고 앤트로픽 역시 자체 칩 개발을 타진하고 있다. 이들 기업이 모두 핵심 연산 인프라의 내재화에 나서면서 엔비디아 중심의 AI 가속기 주도권 경쟁이 새 국면에 접어들었다. 그렉 브록먼 오픈AI 사장은 "세계는 연산 기반 경제로 나아가고 있다"며 "할라페뇨는 연산 자원을 더 풍부하게 만들어 개인과 기업에 빠르고 안정적이며 저렴한 AI를 제공할 것"이라고 말했다.

2026.06.25 09:59이나연 기자

엔비디아-AWS, 협력 확대…AI 추론·벡터 검색 지원

엔비디아와 아마존웹서비스(AWS)가 기업용 인공지능(AI) 추론과 벡터 검색, 대규모 학습 환경을 업그레이드했다. 엔비디아는 '아마존 EC2'와 '아마존 오픈서치' 전반에 엔비디아 AI 인프라 적용 범위를 넓혔다고 24일 공식 홈페이지에서 밝혔다. 핵심은 엔비디아 블랙웰 기반 그래픽처리장치(GPU)를 탑재한 'EC2 G7 인스턴스'와 '엔비디아 cuVS' 기반 오픈서치 서버리스 벡터 검색 가속이다. 아마존 EC2 G7 인스턴스는 엔비디아 RTX 프로 4500 블랙웰 서버 에디션 GPU를 기반으로 작동한다. AI 추론과 그래픽, 공간 컴퓨팅, GPU 가속 데이터 분석 업무를 겨냥한 신규 인스턴스다. G7은 기존 G6 인스턴스와 비교해 AI 추론 성능을 최대 4.6배 높였다. 그래픽 성능은 최대 2.1배 향상됐다. 아마존 EMR에서 엔비디아 cuDF 라이브러리를 활용한 아파치 스파크 업무도 더 빠르게 처리할 수 있다. G7 인스턴스는 최대 8개 GPU와 총 256기가바이트(GB) GPU 메모리, 초당 700기가비트(Gbps) EFA 지원 네트워킹, 최대 7.6테라바이트(TB) 로컬 NVMe SSD 스토리지를 지원한다. 1개, 2개, 4개, 8개 GPU 구성과 베어메탈 구성을 제공해 기업이 업무에 맞춰 인프라를 선택할 수 있도록 했다. 이를 통해 AI 개발팀은 낮은 지연시간에 추론 환경을 구축할 수 있으며, 미디어·엔터테인먼트 기업은 고해상도 영상 제작과 렌더링 업무에 활용할 수 있다. 시뮬레이션과 컴퓨터 지원 설계, 가상 데스크톱 인프라, 게임, 공간 컴퓨팅 분야도 같은 인스턴스를 쓸 수 있다. AWS는 오픈서치 서버리스에도 엔비디아 cuVS를 적용했다. 차세대 아마존 오픈서치 서버리스는 모든 벡터 컬렉션에서 GPU 가속 벡터 인덱싱을 기본 컴퓨팅 방식으로 사용한다. 이는 검색증강생성(RAG), 의미 기반 검색, 추천 시스템, 에이전틱 AI 애플리케이션을 구축하는 기업에 의미가 크다. 기존에는 별도 최적화 프로젝트에 가까웠던 GPU 기반 벡터 검색을 AWS 기본 기능처럼 활용할 수 있기 때문이다. 엔비디아는 cuVS 적용으로 벡터 인덱싱 속도가 중앙처리장치(CPU) 기반 방식보다 최대 10배 빨라지고, 비용은 4분의 1 수준으로 낮아질 수 있다고 설명했다. 이를 통해 수십억 단위 벡터 데이터베이스(DB)도 1시간 내에 구축할 수 있다고 밝혔다. 엔비디아는 "이번 협력은 AWS의 AI 인프라 계층 전반을 강화하는 데 초점을 맞췄다"며 "운영 부담을 늘리지 않으면서 대규모로 작동하는 생산급 AI 인프라"라고 밝혔다.

2026.06.24 18:31김미정 기자

AI 내재화 확산에 서버용 고출력 전원 솔루션 주목

기업이나 조직 내에서 기업 비밀이나 민감한 개인정보 외부 유출을 막고 오픈소스·자체개발 AI 모델을 활용한 추론과 에이전틱 AI 구동을 위해 AI 서비스를 일부, 또는 전부 자체 서버로 전환하려는 움직임이 활발해지고 있다. 이를 위해 엔비디아·AMD 등 GPU 제조사 기반 서버 도입도 늘고 있다. 문제는 이 서버들이 활용하는 전력이 과거 수백 W에 불과했던 x86 서버 대비 최소 두 배 이상 늘어났다는 것이다. 예를 들어 엔비디아 DGX A100(6U) 기반 서버는 시스템 한 대당 최대 6.5kW(킬로와트)의 전력을 소비한다. 일반 웹서버나 가상화 서버에 쓰이는 x86 1U 서버의 전력 소모량인 300W의 20배 이상이다. 24일 한미마이크로닉스 관계자는 "고성능 GPU 서버 등장으로 단일 서버가 아닌 랙 단위 전력 수요가 증가하고 있는 상황"이라며 "데이터센터 운영 기업들이 전력 효율과 안정성을 높이기 위한 고효율·이중화 서버 전원 솔루션 도입을 확대중"이라고 설명했다. 고성능 AI 서버가 바꾼 전원 인프라 시장 고성능 GPU를 구동하는 서버 환경에서 서버용 전원공급장치의 중요성도 커지고 있다. 대용량 전력을 장시간 안정적으로 공급해야 하며, 이에 실패하면 내부 서비스 중단과 이로 인한 손해가 발생할 수 있다. 현재 주류 GPU인 엔비디아 블랙웰 GB200은 블랙웰 GPU 2개와 그레이스 CPU 1개로 구성되며 최대 2.7kW까지 소비한다. 이는 전세대 주력 제품인 H100의 700W 대비 4배 가까이 늘어난 것이다. AI 서버 전력 수요 증가에 대응해 글로벌 서버 제조사와 전원 솔루션 업체들도 고출력 PSU 및 파워쉘프 개발 경쟁을 벌이고 있다. 한미마이크로닉스 "AI 전원 솔루션 공급 확대" 한미마이크로닉스는 올해 2월 글로벌 전원 솔루션 전문기업 그레이트월과 AI·서버 및 엔터프라이즈 전원 솔루션 분야 협력을 위한 업무협약을 체결했다. 이 회사 관계자는 "이는 기존 PC와 워크스테이션 등에 집중됐던 포트폴리오를 서버 등 AI 인프라로 확장하기 위한 시도"라고 밝혔다. 현재 한미마이크로닉스는 그레이트월 제품군 중 엔비디아 GB300 구동을 위한 33kW급 파워쉘프, 서버용 특수 전원공급장치인 CRPS 제품 4종을 국내 유통중이다. CRPS는 서비스 운영 중단이 허용되지 않는 데이터센터 환경을 위해 설계된 특수 전원공급장치다. 전원 공급을 이중화해 문제가 생겨도 전원 차단 없이 교체가 가능해 다운타임을 크게 줄일 수 있다. "기존 GPU 서버 매각시 전원 교체 필요" AI 서버 도입 확대와 함께 기존 장비 교체 수요도 증가하고 있다. 기업들은 신규 AI 서버를 도입하면서 기존 서버 자산의 매각과 재활용, 유지보수 체계 구축에도 관심을 높이고 있다. 한미마이크로닉스는 올 상반기 진행된 자체 제품 발표 행사와 주요 AI 관련 전시회 등에 AI 인프라 환경을 고려한 그레이트월의 GB300 파워쉘프와 CRPS 시리즈를 비롯해 서버용 전력·냉각 인프라 제품군 전시에 나서기도 했다. 이 회사 관계자는 "기업들이 단가 최소 수천만원 이상인 GPU 서버를 교체하며 기존 제품을 매각하는 방식으로 비용 보전에 나서고 있으며, 이 과정에서 기존 전원공급장치를 신규 제품으로 교체하는 수요도 상당하다"고 설명했다. "전원부터 섀시, 추론 서버까지 포트폴리오 확대" 한미마이크로닉스는 전원 솔루션 외에도 서버 섀시와 냉각 솔루션, AI 서버 플랫폼 등 관련 인프라 사업을 확대하고 있다. 최근 출시한 1U 랙마운트 서버 케이스 RM100은 이중화 전원과 다양한 서버 환경 구성을 지원하며, 이 외에도 4U~6U 서버 섀시, 스토리지 서버 케이스, 듀얼 CPU 서버용 쿨러 및 산업용 고풍압 팬 등 서버 인프라 관련 포트폴리오를 확대 중이다. 자체 개발 제품 투입도 준비 중이다. 7U 규모 AI 추론용 서버 'GSR7 P2G8M24'는 GPU 최대 8개를 탑재 가능하며 핫스왑 기반 스토리지와 이중화 전원 설계를 통해 안정적인 운용이 가능하다. 업계에서는 AI 데이터센터 확산으로 전력 확보와 전력 효율 개선이 핵심 과제로 떠오르고 있다고 보고 있다. GPU 성능 경쟁이 이어지는 가운데 서버 전원공급장치와 파워쉘프 등 전력 인프라 시장 역시 함께 성장할 것으로 전망된다.

2026.06.24 17:25권봉석 기자

[AI 고속도로] AI 클라우드 판 흔드는 GPU 전쟁…네오클라우드, 82조 시장 '정조준'

그래픽처리장치(GPU) 집약형 인공지능(AI) 워크로드가 급증하면서 AI·고성능 컴퓨팅에 특화된 '네오클라우드'가 클라우드 시장의 새 축으로 떠오르고 있다. 생성형 AI 확산으로 대규모 학습·추론 인프라 수요가 커진 가운데 GPU 용량과 가격 경쟁력, 데이터 주권 확보 역량이 기업 클라우드 전략의 주요 변수로 부상했다. 24일 시장조사기관 가트너에 따르면 네오클라우드 공급업체는 오는 2030년까지 2670억 달러 규모 AI 클라우드 시장에서 20%를 차지할 전망이다. 원화 기준으로는 약 410조원 시장 가운데 82조원 규모다. 네오클라우드는 AI와 고성능 워크로드에 특화된 클라우드 공급업체를 의미한다. 가트너는 생성형 AI 도입이 확산되면서 GPU 기반 컴퓨팅 수요가 전례 없는 수준으로 늘고 있으며, 이 과정에서 기존 범용 클라우드 모델의 한계가 드러나고 있다고 분석했다. 엔리케 카스테라 가트너 수석 애널리스트는 "미국의 하이퍼스케일러가 자체 소버린 서비스를 출시하고 있는 가운데 네오클라우드 공급업체가 주목을 받고 있다"며 "네오클라우드는 AI 최적화 인프라와 고성능 워크로드에 중점을 둔다는 점에서 차별점이 있다"고 말했다. 소버린 클라우드도 네오클라우드의 주요 경쟁력으로 꼽힌다. 일부 네오클라우드 사업자는 데이터와 운영이 특정 관할권 안에 유지되도록 보장하는 기능을 강화하고 있다. 데이터, 운영, 거버넌스 등 클라우드 환경 일부 또는 전체를 국경 안에 두도록 해 해외 법적 청구나 역외 접근으로부터 보호하는 방식이다. 글로벌 AI 클라우드 시장에선 GPU 특화 사업자의 인프라 확장도 이어지고 있다. 코어위브는 엔비디아와 협력을 확대해 2030년까지 5GW 이상 규모 AI 팩토리를 구축하겠다는 계획을 내놨고, 람다는 엔비디아 베라 루빈 NVL72와 GB300 NVL72 기반 베어메탈 인스턴스를 준비하고 있다. 네비우스도 엔비디아와 전략적 협력을 맺고 차세대 풀스택 AI 클라우드 구축에 나섰다. 카스테라 애널리스트는 "네오클라우드는 AI 워크로드에 최적화된 성능, 유연한 배포 모델, 강력한 데이터 주권 보장을 바탕으로 차별화된 가치를 제공하고 가격 경쟁력에서도 앞선다"며 "주권, 성능, 인프라 전문성이 기업의 주요 의사결정 요인으로 부상하면서 AI 클라우드 시장은 새로운 국면에 접어들었다"고 설명했다. 가트너는 기업도 중앙집중형 글로벌 클라우드 모델을 넘어 현지화된 하이브리드 아키텍처로 전환하는 움직임을 보이고 있다고 봤다. 인프라 및 운영(I&O)을 비롯한 IT 리더는 전문 네오클라우드 공급업체를 평가해 고성능 AI 인프라와 한정된 GPU 용량을 확보하고 기존 하이퍼스케일러에 국한되지 않는 다각화 전략을 추진해야 한다고 제언했다. 카스테라 애널리스트는 "기업은 네오클라우드 공급업체를 활용해 AI 역량을 강화하면서 데이터 주권과 규제 준수에 대한 통제권도 함께 확보할 수 있을 것"이라며 "이들은 AI 워크로드에 특화된 고성능 인프라에 대해 보다 유연하게 접근할 수 있도록 지원함으로써 기업의 혁신 속도를 높인다"고 말했다.

2026.06.24 10:07장유미 기자

"AI 도입보다 어려운 건 운영"…락플레이스, '통제형 자율 운영' 해법 제시

인공지능(AI) 확산이 기업 디지털 전환을 가속화하며 생산성을 끌어올리고 있다. 하지만 생성형 AI와 그래픽처리장치(GPU) 인프라, 클라우드 네이티브 기술 도입이 본격화되면서 IT 운영 환경은 갈수록 복잡해지는 추세다. 성능과 비용, 보안, 장애 대응을 아우르는 통합 운영 체계 구축이 새로운 과제로 부상하면서 안정적인 서비스 운영 역량이 기업 경쟁력을 좌우하는 핵심 요소로 떠오르는 모습이다. 22일 락플레이스는 이러한 변화에 대응하기 위해 플랫폼 표준화와 옵저버빌리티, AI옵스(AIOps), 자동화를 결합한 통합 운영 모델 '로드(RO@D)'를 앞세워 통제형 자율 운영 전략을 제시했다. 기업 IT 환경은 디지털 서비스 확대와 데이터 주권, 비용 최적화 요구에 따라 단일 데이터센터 중심 구조에서 하이브리드·멀티 클라우드 환경으로 빠르게 전환되고 있다. 특히 생성형 AI 도입이 본격화되면서 대규모 GPU 자원과 탄력적 확장성이 요구되는 AI 워크로드와 강력한 보안 및 안정성이 요구되는 기존 레거시 업무 시스템이 서로 다른 인프라 환경에서 분산 운영되는 사례가 늘고 있다. 여기에 쿠버네티스 기반 컨테이너 애플리케이션과 마이크로서비스 아키텍처(MSA) 확산까지 더해지면서 IT 운영 조직이 관리해야 할 복잡성은 한층 높아지는 상황이다. 문제는 AI 서비스가 기존 애플리케이션과 다른 운영 특성을 가진다는 점이다. AI 서비스는 GPU 사용량과 거대언어모델(LLM) 호출 횟수, 데이터 처리량, 추론 비용 등 다양한 요소가 복합적으로 작용하며 실시간 변동성을 만들어낸다. 단순히 서버 가동 여부를 확인하는 수준을 넘어 인프라와 애플리케이션, 데이터 파이프라인, 사용자 경험, 비용 구조까지 하나의 흐름으로 파악해야 하는 이유다. 이를 해결하기 위한 방안으로 다양한 옵저버빌리티 플랫폼이 등장하고 있다. 하지만 업계에서는 가시성 확보만으로는 복잡해진 운영 환경을 관리하는 데 한계가 있다는 지적도 나온다. 장애 발생 시 원인 분석과 조치, 검증 과정은 여전히 운영자의 경험과 수작업에 의존하는 경우가 많기 때문이다. 락플레이스는 단순 관측을 넘어 지능형 분석과 대응 자동화, 거버넌스까지 운영 전 과정을 하나의 흐름으로 통합하는 클라우드 네이티브 운영 모델 '로드'를 제시했다. 로드는 클라우드 플랫폼과 옵저버빌리티, 자동화를 단일 체계로 통합한 것이 특징이다. 가상머신(VM)과 컨테이너, AI 워크로드를 하나의 인프라 체계에서 관리할 수 있도록 구조화했다. 옵저버빌리티와 AI옵스(AIOps), 런북(Runbook) 자동화를 유기적으로 결합해 실시간 탐지부터 분석, 조치, 검증까지 이어지는 전방위적 운영 프로세스를 제공한다. 락플레이스는 엔터프라이즈 시장에서 검증된 '레드햇 오픈시프트' 기반 플랫폼으로 VM과 컨테이너, AI 워크로드를 일관된 기준으로 다룰 수 있는 토대를 마련했다. 여기에 '다이나트레이스(Dynatrace)' 기반 옵저버빌리티를 더해 서비스 흐름과 의존관계, 사용자 영향도, 인프라 상태를 입체적으로 분석한다. 더불어 운영자 승인과 정책 통제를 포함하는 '휴먼인더루프(Human-in-the-Loop)' 방식 통제형 자율 운영 모델로 안정성을 높였다. 반복 업무는 자동화하되 최종 의사결정과 통제 권한은 운영자가 보유함으로써 엔터프라이즈 환경에 필요한 거버넌스와 감사 가능성을 확보할 수 있도록 돕는다. 회사는 기업의 운영 성숙도에 맞춰 단계적으로 자율 운영 체계를 구축할 수 있도록 지원할 계획이다. 운영 진단과 플랫폼 표준화를 시작으로 옵저버빌리티 구축, AIOps 기반 원인 분석, 런북(Runbook) 자동화, 거버넌스 고도화 단계로 확장하는 방식이다. 락플레이스 관계자는 "AI 시대에는 단순히 인프라를 구축하는 것보다 복잡한 운영 데이터를 얼마나 빠르게 분석하고 실행 가능한 판단으로 연결하느냐가 중요하다"며 "로드를 통해 기업들이 클라우드 네이티브 환경에서 운영 가시성과 안정성, 효율성을 동시에 확보할 수 있도록 지원할 것"이라고 말했다.

2026.06.22 11:36남혁우 기자

[AI 고속도로] 같은 GPU, 다른 결과…AI 인프라도 산업별 맞춤형 설계

인공지능(AI) 인프라 시장의 경쟁 축이 단순 그래픽처리장치(GPU) 확보에서 산업별 워크로드 최적화로 이동하고 있다. 로봇과 자율주행, 바이오, AI 에이전트 등 활용 분야가 다양해지면서 같은 GPU라도 데이터 특성과 운영 방식에 따라 필요한 인프라 구조가 달라지고 있다는 분석이 나온다. 21일 업계에 따르면 최근 젠슨 황 엔비디아 최고경영자(CEO)가 방한해 로보틱스·제조·모빌리티 분야 AI 활용 가능성을 강조하면서 한국형 피지컬 AI가 화두로 떠올랐다. 다만 업계에선 피지컬 AI 확산이 곧 획일적인 인프라 수요 증가로 이어지지는 않을 것으로 보고 있다. 산업마다 AI 모델을 학습·검증·배포하는 방식이 다르고 GPU 사용 규모와 기간, 배치 환경도 제각각이기 때문이다. 이에 대해 안재만 베슬AI 대표는 "AI 인프라 수요는 더 이상 하나의 덩어리로 움직이지 않는다"며 "GPU를 얼마나 확보하느냐 못지않게 누가·어떻게·어디서 쓰는지에 따라 인프라 설계가 달라지고 있다"고 말했다. 피지컬 AI 확산…LLM과 다른 인프라 필요 피지컬 AI는 로봇과 자율주행차처럼 현실 공간에서 동작하는 AI를 의미한다. 대규모언어모델(LLM)이 인터넷 기반 텍스트 데이터로 학습하는 것과 달리 물체 파지나 충돌 반응 등 물리 데이터를 필요로 한다. 이에 시뮬레이션 환경에서 데이터를 생성하고 실제 데이터와 결합하는 과정이 중요해지고 있다. 인프라 구조 역시 LLM과 차이가 있다. 베슬AI에 따르면 시뮬레이션 데이터 생성부터 비전·언어·행동(VLA) 모델 학습, 이후 로봇이나 차량의 온보드 컴퓨터에 탑재해 실시간으로 구동하는 과정까지 고려해야 한다. 안 대표는 "스토리지, 네트워크, 데이터 공급 구조까지 함께 설계해야 피지컬 AI 학습 효율을 높일 수 있다"고 밝혔다. 대학은 짧고 기업은 길게…GPU 사용 패턴도 차별화 실제 GPU 활용 방식도 기관 성격에 따라 뚜렷하게 구분된다. 베슬AI가 최근 30일간 자사 플랫폼 '베슬 클라우드' 운영 데이터를 분석한 결과 대학과 연구기관의 평균 동시 사용 GPU 중앙값은 1.8장 수준으로 나타났다. 반면 기업 고객의 경우 46%가 한 번에 8장 이상 GPU를 사용했으며 최대 32장 규모의 멀티노드 환경까지 확장한 사례도 확인됐다. 배치 환경 역시 산업별 특성이 반영된다. 방산과 금융, 바이오, 통신 분야는 민감 데이터를 다루는 만큼 온프레미스나 폐쇄망 환경을 선호해 왔지만 최근에는 보안 인증을 갖춘 클라우드 활용도 함께 검토하는 추세다. 실제 베슬AI 고객사에도 통신과 보험, 의료, 방산 기업이 포함된 것으로 전해졌다. 로봇·에이전트·바이오마다 다른 GPU 전략 베슬AI는 산업별 특성에 맞춰 GPU 기종과 계약 방식, 노드 구성, 배치 환경을 달리 제공하고 있다. A100과 H100은 물론 B200·B300급 GPU까지 지원하며 온디맨드와 단기·장기 약정 방식, 단일 GPU와 멀티노드 클러스터 등을 워크로드에 맞춰 조합하는 구조다. 베슬AI는 각 고객별 맞춤형 AI 인프라를 지원하고 있다. 대표적으로 휴머노이드 로봇용 파운데이션 모델을 개발하는 기업은 시뮬레이션 데이터와 실제 로봇 데이터를 함께 학습해야 하는 만큼 테라바이트(TB)급 대규모 스토리지와 고성능 GPU를 제공했다. 여러 고객사 프로젝트를 동시 운영할 수 있는 격리된 개발 환경이 중요했던 B2B AI 에이전트 기업에는 학습 환경 추상화 레이어와 클러스터 공유 스토리지를 제공해 다중 워크스페이스 운영을 지원했다. 또 바이오·신약 AI 기업은 보안성이 높은 프라이빗 환경과 클라우드 자원을 유연하게 활용하는 구조를 선호하기에 베슬AI는 글로벌 'SOC 2 Type II' 인증과 초기 도입 부담을 완화한 소규모 시범 사용 크레딧을 제공하고 있다. 안 대표는 "AI 인프라 시장은 GPU를 빌려주는 단계를 넘어 산업별 워크로드가 실제로 작동할 수 있는 환경을 설계하는 방향으로 진화하고 있다"며 "앞으로는 피지컬 AI, 바이오, AI 에이전트 등 산업별 수요에 맞춰 유연한 GPU 인프라 운영 모델을 제공하는 것이 중요하다"고 강조했다.

2026.06.21 15:00한정호 기자

엔비디아 성공 공식, 구글이 따라 쓴다…TPU로 'GPU 장벽' 넘을까

구글이 자체 인공지능(AI) 반도체인 텐서처리장치(TPU) 사업을 앞세워 엔비디아 중심 AI 컴퓨팅 시장에서 영역 확장에 본격 나섰다. 엔비디아가 그래픽처리장치(GPU) 판매 확대에 활용해온 데이터센터 금융 지원 방식을 본격 적용하며 외부 고객 확보에 속도를 내는 모습이다. 18일(현지시간) 월스트리트저널(WSJ)에 따르면 구글은 미국 뉴욕주 서부 온타리오호 인근 AI 데이터센터 클러스터 '레이크 매리너' 프로젝트에 32억 달러(약 4조9000억원) 규모 금융보증을 제공했다. 이 프로젝트는 AI 인프라 기업 테라울프와 구글이 투자한 클라우드 업체 플루이드스택이 추진 중이다. 해당 데이터센터의 컴퓨팅 자원은 앤트로픽에 임대될 예정이다. 이 같은 구글의 전략은 엔비디아가 AI 칩 시장 지배력을 키울 때 활용한 방식과 유사하다. 데이터센터 사업자가 낮은 비용으로 자금을 조달할 수 있도록 지원하고, 이 자금이 다시 칩 구매와 컴퓨팅 임대 계약으로 이어지도록 만드는 구조다. 구글은 TPU 공급과 클라우드 계약, 대형 AI 고객 수요를 함께 묶어 엔비디아 GPU 의존도를 낮추려 하고 있다. AI 경쟁 축이 모델 개발에서 컴퓨팅 자원 확보로 이동하면서 자체 칩을 보유한 빅테크의 영향력도 커지고 있다. 구글은 검색과 AI 서비스 운영을 위해 TPU를 장기간 내부적으로 사용해 왔다. 이후 생성형 AI 수요가 급증하자 구글 클라우드를 통해 외부 기업에 TPU를 제공하기 시작했다. 최근에는 TPU 사업을 더 공격적으로 확장하고 있다. 지난달 TPU를 고객에게 직접 판매하겠다는 계획을 발표했고, AI 추론에 특화한 첫 TPU도 공개했다. 추론은 이용자 질의에 AI 모델이 답변을 생성하는 과정으로, 생성형 AI 서비스 확산에 따라 수요가 빠르게 늘고 있다. 하지만 엔비디아의 진입장벽은 여전히 높은 상태다. 엔비디아는 AI 칩 시장에서 90% 이상 점유율을 가진 것으로 추정된다. 이는 GPU 성능에 더해 쿠다(CUDA) 소프트웨어 생태계, 네트워킹 장비, 서버 시스템을 결합한 전체 하드웨어 스택이 강점으로 작용하고 있어서다. 또 AI 클라우드 업체들이 엔비디아 제품 배정 물량을 의식해 경쟁사 칩 도입에 부담을 느끼고 있기 때문이란 분석도 있다. 여기에 젠슨 황 엔비디아 최고경영자(CEO)는 구글 TPU의 경쟁력을 낮게 보고 있다. 그는 지난 4월 팟캐스트 인터뷰에서 엔비디아가 구글과 ASIC 업체보다 훨씬 넓은 시장 접근성을 갖췄다고 말했다. 앤트로픽 외에 TPU의 의미 있는 외부 고객이 많지 않다는 취지의 언급도 내놨다. 황 CEO는 "TPU가 비용 우위를 갖췄다는 점을 입증해 보였으면 한다"며 "엔비디아는 구글 TPU나 주문형 반도체(ASIC)보다 훨씬 앞서 있다"고 말했다. 이에 구글은 자금력을 앞세워 엔비디아에 맞설 기반을 넓히고 있다. 특히 이달에는 AI 인프라 투자를 위해 850억 달러 규모 자본 조달 계획을 밝히기도 했다. 또 루이지애나주 배턴루지 인근 70억 달러 규모 AI 데이터센터 프로젝트 '리버 벤드'에도 금융 지원을 제공하고 있다. 텍사스주 콜로라도시티 AI 컴퓨팅 임대 프로젝트에는 14억 달러 규모 금융보증을 제공 중이다. 더불어 구글은 블랙스톤과 50억 달러 규모 클라우드 서비스 합작법인 설립 계약도 체결했다. 이 법인은 엔비디아 칩을 기반으로 성장한 코어위브, 네비우스 등 AI 클라우드 업체와 경쟁한다. 아민 바흐다트 구글 AI 인프라 최고기술책임자(CTO)는 "엔비디아와의 경쟁에만 초점을 맞추고 있지 않다"며 "우리에게 중요한 것은 구글과 고객을 위한 더 나은 제품을 만드는 것"이라고 말했다.

2026.06.19 17:45장유미 기자

  Prev 1 2 3 4 5 6 7 8 9 10 Next  

지금 뜨는 기사

이시각 헤드라인

당정청, 반도체 추가 세수로 '미래대응기금' 만든다

악연에서 절친으로...어느 해커의 '멋진 유산'

[영상] '갤럭시 글래스', 이렇게 작동하나…터치 조작·AI 기능 눈길

'전기 먹는 하마' AI 데이터센터, 물도 많이 먹는다

ZDNet Power Center

Connect with us

ZDNET Korea is operated by Money Today Group under license from Ziff Davis. Global family site >>    CNET.com | ZDNet.com
  • 회사소개
  • 광고문의
  • DB마케팅문의
  • 제휴문의
  • 개인정보취급방침
  • 이용약관
  • 청소년 보호정책
  • 회사명 : (주)메가뉴스
  • 제호 : 지디넷코리아
  • 등록번호 : 서울아00665
  • 등록연월일 : 2008년 9월 23일
  • 사업자 등록번호 : 220-8-44355
  • 주호 : 서울시 마포구 양화로111 지은빌딩 3층
  • 대표전화 : (02)330-0100
  • 발행인 : 김경묵
  • 편집인 : 김태진
  • 개인정보관리 책임자·청소년보호책입자 : 김익현
  • COPYRIGHT © ZDNETKOREA ALL RIGHTS RESERVED.