-
딥러닝 하드웨어 담론 (4)machine learning 2024. 11. 30. 06:21
여태까지 3편의 담론을 쓰면서 기저에 깔려있던 핵심주제는 "AI 모델의 추론"이라고 할 수 있습니다. 모델 추론이라는 행위를 하기 위해서 숱한 ml researcher들이 사비로 수백~수천만원씩을 소모하고, 작은 기업들도 nvidia 그래픽카드를 구하기 위해서 수천만 ~ 수억원을 기꺼이 지불합니다.
한편, 모델 추론과 학습을 원활하게 지원하기 위한 새로운 방식의 반도체 장비를 개발하기 위해 글로벌 회사들 또한 저마다의 영역에서 경쟁을 벌이고 있습니다.
그러면 도대체 왜 이렇게 다들 추론을 열심히 하려고 노력할까요?
이 물음에 대해서 제가 나름대로 생각하는 AI의 가능성을 리뷰해보도록 하겠습니다.
눈에 보이는 것의 자동화

키보드 조작 뿐만 아니라 마우스와 같은 다른 입력까지 받아서 위 화면이 출력된다면? 위 움짤은 알리바바에서 발표한 게임 실시간 생성모델 "The Matrix"의 화면입니다.
알리바바에서는 프레임 단위의 실시간 생성이 가능하고, AAA급 게임 수준의 시각적 효과 제공, 무한한 길이의 콘텐츠를 생성할 수 있는 능력, 다양한 장면을 생성할 수 있는 폭넓은 일반화 가능성을 포함하고 있다고 소개하고 있습니다.
단순히 게임을 하나의 모델로 대체하는 것을 넘어서, 위 화면에서 나오는 장면이 게임이 아니라 일반 컴퓨터 사용화면이 될 수 도 있습니다. 그렇게 된다면 굳이 cpu, memory, disk, memory bus로 구성된 폰노이만 아키텍쳐를 구성할 필요없이 간단한 전원장치와 gpu device, 모니터만으로 컴퓨터를 만들 수도 있겠습니다.
지식 집약적 노동의 자동화

이제 대학원생이 아니라 AI 서비스를 돈주고 고용해야 할지도 모릅니다. 사카나 AI는 구글 '트랜스포머' 논문 저자 중 하나인 릴리언 존스가 지난해 일본 도쿄에 설립한 회사입니다. 이들이 이번에 공개한 AI 사이언티스트는 LLM을 사용해 과학 논문을 생성하는 완전 자동화된 파이프라인입니다.
간단한 초기 코드 베이스로 광범위한 과학 연구 방향이 주어지면, AI는 이후 인간 개입 없는 후속 과정을 진행합니다.
즉, 연구 아이디어를 창출하고, 필요한 코드를 작성하고, 실험을 실행하고, 실험 결과를 요약하고, 시각화하고, 연구 결과를 완전한 과학 논문으로 제시하는 일까지 전체 연구 라이프사이클을 수행합니다.
대학원을 경험해 보신 분들이라면 아시겠지만, 논문을 쓴다는 것은 은근히 사무작업의 끝판왕(?)입니다. 가설을 제시하고 실제 데이터에 기반하여 기안을 제시한 다음 상사/동료에게 제출하여 컨펌을 받아 정리된 형태의 보고서로 정리하는 작업의 연속입니다.
이러한 과학 논문이 자동화 될 수 있다면 우리가 통상적으로 생각하는 논리적인 작업은 "AI모델 사용"이라는 인터페이스 하나로 수렴될 가능성이 크다고 할 수 있겠습니다.
결론
AI, LLM은 단순히 신기한 도구를 넘어서서 우리가 무심코 사용하고 있던 절차와 개념들의 조합을 "AI"라는 하나의 도구로 치환할 수 있는 가능성을 가지고 있습니다. 당연히 이러한 도구를 먼저 제시할 수 있는 기업은 AI 시장의 승자가 되어 아주 큰 이익을 누릴 것이 분명해보입니다.
따라서 AI라는 분야의 가능성을 믿고 수많은 분야에서 "AI 모델의 추론"에 매달리는 현상은 그렇게 이상한 것이 아닌, 어쩌면 당연한 수순입니다.
'machine learning' 카테고리의 다른 글
Model2Vec: 모델을 외워봅시다 (2) 2024.12.22 Matryoshka Representation Learning (2) 2024.12.22 딥러닝 하드웨어 담론 (3) (0) 2024.11.24 딥러닝 하드웨어 담론 (2) (0) 2024.11.16 딥러닝 하드웨어 담론 (1) (4) 2024.11.15