학습
Pathway의 BDH: 엔터프라이즈 AI에 대한 AWS 기반의 새로운 포스트 트랜스포머 접근 방식

Pathway의 BDH: 엔터프라이즈 AI에 대한 AWS 기반의 새로운 포스트 트랜스포머 접근 방식

이 콘텐츠는 어떠셨나요?

현대적 LLM을 뒷받침하는 아키텍처인 트랜스포머 모델은 우리가 살고, 일하고, 만들고, 경쟁하는 방식을 획기적으로 바꾸었습니다. 이를 통해 스타트업은 소규모 팀으로 아이디어를 실험하고 출시할 수 있었으며 코딩, 분석, 콘텐츠 제작과 같은 B2B 분야의 판도를 바꿀 수 있었습니다. 창업자와 기업 모두 몇 년 전만 해도 상상할 수 없었던 생산성 향상을 실현했습니다.

트랜스포머 기반 AI는 브루트포스 스케일링을 통해 발전해 왔습니다. 즉, 더 큰 모델, 더 많은 데이터, 더 많은 컴퓨팅으로 LLM이 개선되었습니다. 그렇다면왜 MIT 연구에 따르면 따르면 기업 AI 프로젝트의 실패율이 95%에 달할까요? 답은 트랜스포머 모델의 아키텍처에 있습니다. 이 모델들은 매번 동일한 상태에서 작업을 시작하며, 메모리가 없기 때문에 과거로부터 학습하지 못하고 일종의 ‘Groundhog Day’ 루프에 갇히게 됩니다. 이러한 기술적 한계는 비즈니스에 실질적인 영향을 미쳐, 한때 조직의 성장을 가능케 하고 역량을 강화했던 바로 그 인프라가 이제는 발전에 걸림돌이 되고 있습니다.

근본적으로 다른 모델 접근법

AI가 진화함에 따라 리스크도 커졌습니다. 기업들은 이제 독자적인 내부 사용 사례와 워크플로에 AI를 적용하고자 합니다. 이를 위해서는 시간이 지남에 따라 행동을 학습 및 조정하고, 장기 추론을 지원하고, 관찰 가능하고 감사 가능한 추론을 생성할 수 있는 모델이 필요합니다. 트랜스포머 모델은 과거에는 비즈니스 혁신을 의미했지만, 이제는 근본적으로 다른 접근 방식이 필요합니다.

AWS 프론티어 모델 파트너인 Pathway는 Dragon Hatchling(BDH)으로 차세대 AI 분야를 개척하고 있습니다. Amazon SageMaker에서 개발되고 AWS 인프라에 최적화된 BDH는 지속적인 학습, 무한한 컨텍스트 및 실시간 적응을 지원하는 포스트 트랜스포머 프론티어 모델입니다. 엔터프라이즈 AI 도입, 메모리 및 학습과 관련한 핵심 과제를 즉각적으로 해결하여 조직이 중요한 새 기능을 활용하고 개인화된 엔터프라이즈 인텔리전스를 활용할 수 있도록 합니다.

엔터프라이즈 트랜스포머의 한계

트랜스포머 모델은 여전히 많은 작업에서 기본 옵션으로 사용되고 있으며, 비즈니스 운영을 근본적으로 변화시켜 왔습니다. 하지만 트랜스포머가 등장한 지 거의 10년이 지난 지금, 트랜스포머는 엔터프라이즈 환경에서 실용적, 수학적 한계에 도달하기 시작했습니다.

트랜스포머는 지속적인 학습을 달성하도록 설계되지 않았습니다.이들은 한 번 훈련을 받으면 시간이 지나도 새로운 스킬을 배울 수 없으며, 외부 데이터베이스에 텍스트만 축적할 수 있기 때문에 시간이 지나도 더 스마트해지지 않습니다.
트랜스포머는 매우 리소스 집약적입니다.데이터가 증가할수록 계산량이 급격히 늘어나는 방식으로 정보를 처리하므로 막대한 연산 능력을 요하고, 실행을 위해 매우 빠른 메모리가 요구되며, 모델의 파라미터를 지속적으로 조정하고 반영해야 합니다.
트랜스포머는 진정한 엔터프라이즈 네이티브 AI에 필요한 것을 제공하는 데 있어 아키텍처적 한계를 가지고 있습니다. 기업은 내부에 특화된 지식과 프로세스를 보유하고 있으며, 이는 모델이 내재화하고 학습해야 합니다. 또한 거버넌스와 옵저버빌리티가 필요합니다. 오늘날의 트랜스포머 기반 모델은 추론 과정이 불투명한 블랙 박스처럼 작동하고, 사전 학습된 가중치에 의존하며, '다음에 일어날 일'을 모델링하는 메커니즘이 부족합니다.

이것이 현실적으로 의미하는 것

트랜스포머의 기술적 한계는 실제 비즈니스에 직접적으로 영향을 미치기 때문에 기업과 스타트업에 추가적인 비용과 복잡성이 유발합니다. 트랜스포머는 역량 강화를 위한 도구가 아니라 병목 현상의 원인이 되어 팀이 가치를 창출하는 것보다 해결 방법을 관리하는 데 더 많은 시간을 할애하게 됩니다.

모델을 비즈니스가 실제로 작동하는 방식에 맞추려면 추가 작업이 필요합니다. 상용 모델을 조직의 운영 방식에 맞게 조정하기 위해서는 사용자 지정 LLM 구축, 모델 규모 조정, 프로세스 구축을 위한 에이전트 워크플로 사용 등 추가 워크로드 또는 수정 사항을 관리하는 작업이 수반되는 경우가 많습니다.
전문 지식을 적용하거나 컨텍스트화하려면 팀에서 에이전트 워크플로의 광범위한 미세 조정 및/또는 복잡한 배포를 관리해야 합니다.
차별화는 갈수록 어려운 과제가 됩니다. 고유한 결과를 얻기 위해서는 팀이 직접 모델을 맞춤화해야 하는데, 이 경우 시간이 지남에 따라 연관성과 정확성이 떨어질 위험을 감수해야 합니다. 그렇지 않으면 경쟁업체와 동일한 범용 모델을 사용할 수밖에 없습니다.
비용은 까다로운 절충을 강요합니다. 비용이 많이 드는 훈련과 추론으로 인해 AI 배포 위치를 고르고 선택해야 하는 상황에 놓여 팀은 잠재적인 기회를 놓치게 됩니다.

BDH: 엔터프라이즈 인텔리전스의 새로운 패러다임 구축

트랜스포머 모델은 지금까지 진화해 왔지만, 제품을 차별화하고 가치를 추가하려는 기업에게는 더 이상 충분하지 않습니다. BDH는 트랜스포머 스택을 점진적으로 개선하는 것이 아니라, 패러다임 자체를 바꾸며 엔터프라이즈 AI의 새로운 물결을 불러일으키고 있습니다.

트랜스포머 기반 모델이 고정된 가중치를 사용하는 것과 달리, BDH의 아키텍처는 뉴런과 시냅스의 네트워크와 더 유사한 구조를 갖고 있습니다. 새로운 정보가 들어올 때마다 연결이 지속적으로 업데이트되며, 각 작업마다 초기화되는 대신 장기적으로 지식을 유지하고 정교화할 수 있습니다. 그 결과, 메모리 기반이며 자율적이고 관측 가능한 형태로 엔터프라이즈 인텔리전스를 구현할 수 있게 됩니다. 이는 기업에 다음과 같은 새로운 역량을 열어줍니다.

1.지속적 학습: BDH는 모든 상호작용을 통해 학습하고 시간이 지남에 따라 학습한 내용을 내면화하여 추론, 지속적인 전문성, 점점 더 자율적인 문제 해결을 가능하게 합니다.

중요한 이유

BDH는 단순히 더 많은 정보를 수집하고 내보내는 데 그치지 않습니다. 시간이 지남에 따라 지능과 판단력이 발전합니다.
분야별 전문 지식이 축적되어 개인화를 통해 복합적인 이점을 창출합니다.
데이터나 훈련을 통해 복제할 수 없는 엔터프라이즈 지속성을 확립합니다. AI는 비즈니스를 학습하면서 무엇과도 바꿀 수 없는 존재가 됩니다.
장기적인 시간 범위에 걸쳐 추론합니다.
희소하고 특화된 데이터로부터도 학습합니다(많은 양의 데이터가 필요한 트랜스포머와 대비됨).

2. 효율성: BDH는 모델이 학습 모드이든 추론 모드이든 관계없이, GPU에서 두뇌처럼 작동하며 기본적으로 효율성을 보장합니다. 지능은 전체가 한 번에 작동하는 것이 아니라, 시간이 지남에 따라 강화되거나 약화되는 국소적 상호작용에서 시작되어 필요할 때만 활성화됩니다. 트랜스포머가 매번 전체 모델을 활성화하는 것과 달리, 토큰당 약 5%의 뉴런만 활성화됩니다.

게다가 BDH는 진정한 네이티브 추론 모델입니다. 잠재 추론 공간이라는 더 큰 내부 추론 공간을 만들면 사용 중 학습과 적응을 지원하는 내재적 기억 메커니즘을 갖게 됩니다. BDH는 트랜스포머가 잘하는 기능, 특히 언어 이해와 생성 기능을 유지하는 동시에 표준 LLM에서 어려움을 겪는 비언어 문제를 해결할 수 있는 기능을 추가합니다. 예를 들어 BDH는 약 25만 개의 최고 난이도 스도쿠 문제로 구성된 Extreme Sudoku 벤치마크에서 97.4%의 정확도를 달성한 반면, 주요 LLM들은 이 문제에서 거의 성능을 내지 못합니다.

중요한 이유

훈련 활동 및 추론 토큰 전반에서 효율성이 10배 향상되었습니다.
에너지 및 전력 사용량이 절감되었습니다.
대규모 사전 훈련 없이도 시장 출시 시간을 단축할 수 있습니다(씬 데이터세트, 장기적 학습).
1 언어 작업과 비언어 작업(예: 게임) 모두에서 탁월한 성능을 발휘하는 단일 아키텍처는 의사 결정 분야에서의 강력한 잠재력을 시사합니다.

3. 엔터프라이즈급: BDH를 활용하여, 기업은 비즈니스를 이해하고 지속적으로 적응하며 모니터링하고 설명하기 쉬운 AI를 실행할 수 있습니다. 추가 해결 방법이나 수정 없이 이 모든 작업을 수행할 수 있습니다.

중요한 이유

조직의 경험 맥락에 깊이 통합되는 AI입니다.
감사 가능성을 갖춘 상태에서, 프로덕션 환경에서도 지속적으로 학습하는 시스템을 배포할 수 있다는 신뢰가 형성됩니다.
AI는 시간 요소를 고려할 수 있기 때문에, 프로세스 인식, 디지털 트위닝, Next Best Action을 처리할 수 있습니다.
시간이 지남에 따라 모델이 어떻게, 왜 변화하는지에 대한 거버넌스를 제공합니다.
필요할 때 학습을 일시 중지, 분리 또는 롤백할 수 있는 명확하고 가용성이 뛰어난 메커니즘을 제공합니다.

핵심적인 AI 기능을 가능케 하는 ‘지속성 추론’

여러분의 경쟁 우위는 무엇인가요? 상용 AI를 배포하고 일회성 훈련을 통해 더 이상 경쟁 우위를 확보할 수 없게 되면 다른 접근 방식이 필요합니다. BDH는 궁극적인 엔터프라이즈 경쟁력을 창출하는 '지속적 추론' 사용 사례를 위해 설계되었습니다. BDH는 독점 데이터를 통해 지속적으로 학습하여 시간이 지남에 따라 분야별 전문성을 구축하고 실질적인 경쟁 우위를 창출합니다.

지속적 추론 사용 사례는 기업의 가장 중요한 자산인 독점 데이터와 밀접하게 연관되어 있습니다. 이들은 정확성과 가치를 유지하기 위해 가장 신선하고 즉각적인 정보에 지속적으로 액세스할 수 있어야 하며, 장기간과 시간에 걸쳐 관찰 가능한 추론을 할 수 있는 능력에 좌우됩니다.

그렇다면 이러한 '까다로운' 사용 사례는 어디에 나타날까요? BDH는 수평적 영역과 수직적 산업 부문 전반에 걸친 지속적 추론 사용 사례를 제공합니다. 수평적으로 보면 새로운 기능이 중요한 영역에서 이러한 사례가 나타나고 있습니다. 수직적으로 보면 데이터와 컨텍스트가 진정으로 비즈니스를 주도하는 소매, 보험, 기술, 금융 서비스 및 의료 서비스 전반에서 이러한 현상이 나타납니다.

수평 영역:

BDH는 여러 부문에 걸친 글로벌 기업의 긴 분기말 회계 프로세스를 여러 지역 및 비즈니스 부서 전반에서 수개월에 걸쳐 추론하여 자동화합니다. BDH는 재무 결산을 별개의 이벤트로 취급하지 않고 전체 분기에 걸쳐 조기 예측을 수행하고, 중간 주기 편차를 평가하고, 위험 노출을 분석하여 헤징을 유도하고, 조정을 조정하고, 명확하고 감사 가능한 시험 종결을 진행합니다. 이러한 장기적 인텔리전스는 시간이 지날수록 정확성과 예측력이 향상됩니다.

산업 분야: 산업 불문
수평 영역: 관리
주요 차별화 요소: 장기적 추론

소매:

BDH는 소매 회사가 동적인 조건을 기반으로 판매를 목표 수준으로 유지할 수 있도록 합니다. BDH는 변화하는 내부 및 외부 데이터를 고려하여 제품 개인화 워크플로에서 집중해야 할 부분, 동적 가격 책정 기회, 맞춤형 프로모션이 적절한 영역 등 차선책을 제안합니다.

산업 분야: 소매
수평 영역: 영업
주요 차별화 요소: Next Best Action

보험

BDH는 보험 서비스 기업에서 사전 승인 및 이후 의료 청구 검증의 자동화를 확대하며, 복잡하고 정형화되지 않은 다양한 상황을 실시간으로 추론합니다. 더 많은 청구를 자동화함으로써 건당 비용을 절감하는 동시에 정확도를 높이고, 각 의사결정에 대해 내장된 감사 추적을 제공합니다.

산업 분야: 보험
수평 영역: 운영
주요 차별화 요소: 상호 운용성

빅 테크

BDH는 통신 사업자를 위해 각 기업 고객의 네트워크에 대한 실시간 디지털 트윈을 운영합니다. 텔레메트리, 토폴로지, 그리고 실시간 고객 데이터를 지속적으로 수집함으로써 실제 사용량과 예상 사용량을 비교하고, 선제적인 재구성, 유지보수, 서비스 관점의 Next Best Action을 추천합니다.

산업 분야: 첨단 기술
수평 영역: 서비스
주요 차별화 요소: 라이브 디지털 트위닝

의료 서비스

BDH는 환자 이력을 지속적으로 통합해 더 정교한 치료 옵션을 제안함으로써 복잡한 임상 연구를 지원합니다. 기존 LLM이 소량의 데이터로 학습하는 데 한계가 있고 희귀하거나 특이한 사례에서 어려움을 겪는 것과 달리, BDH는 ‘단일 사례’로부터도 학습하여 이를 실행 가능한 인사이트로 전환할 수 있습니다.

산업 분야: 의료 서비스
수평 영역: 연구
주요 차별화 요소: 씬 데이터세트

금융 서비스

BDH는 은행의 독자적인 위험 플레이북과 투자 논문을 학습하여 초개인화된 거래 탐색을 실행합니다. 실시간 시장 데이터를 지속적으로 분석함으로써 표준 시장 옵션보다 수익성이 높은 새로운 기회를 포착하고 이에 맞는 새로운 거래 기회를 창출합니다.

산업 분야: 금융 서비스
수평 영역: 리스크
주요 차별화 요소: 지속적 학습

Amazon SageMaker HyperPod에서 개발되고 AWS에 최적화된 솔루션

AWS와 Pathway는 컨텍스트, 메모리 및 장기 추론이 가장 중요한 사용 사례에 첨단 AI 혁신 기술을 도입하여 오늘날 이 기술을 이용할 수 있도록 하고 있습니다. BDH는 Amazon SageMaker HyperPod를 기반으로 개발되었습니다. 이 HyperPod는 대규모 분산 훈련을 지원하도록 설계되었으며 팀에서 관리형 워크플로를 사용하여 GPU 클러스터를 프로비저닝하고 운영할 수 있도록 지원합니다.

또한 AWS 인프라에 최적화되어 있어 효율적으로 운영되고 최대 성능으로 작동합니다. BDH는 API를 통해 기존 AWS 애플리케이션 및 워크플로에 액세스할 수 있으며, 조직이 AWS에 이미 저장한 데이터를 기반으로 지속적으로 개선됩니다.

Pathway(dragon@pathway.com)에 문의하여 BDH에 대해 알아보고고 구현을 시작해 보세요. 고객은 AWS 기반 POC 프로그램을 통해 초기 투자를 줄일 수 있습니다. 또한 Arxiv와 오픈 소스 리포지토리에 대한 Pathway의 연구 자료에 액세스하려면 Github를 참조하세요.

이 콘텐츠는 어떠셨나요?