애플 WWDC24 3분 요약, 3B 모델로 이게 되네?

6/10일부터 14일까지 열린 애플의 세계개발자회의(WWDC) 24 에서 LLM 관련 주목할만한 기술적인 내용을 짧고 굵게 정리해보겠습니다. 

생성AI 관련 핵심 요약은 지난 뉴스레터 보기에서 보실 수 있습니다.
알찬 AI 정보 계속 업데이트 하겠습니다. 올거나이즈 뉴스레터 구독 많이 소개해 주세요. 


온디바이스 AI의 왕이 될 관상인가? 3B로 이게 되네!

WWDC에서 발표한 애플 인텔리전스(Apple Intelligence)를 보셨나요?
애프에서는 iOS 18, iPadOS 18 및 macOS Sequoia에 통합된 개인 지능 시스템이라고 소개했는데요.
크게 이미지와 텍스트로 나눠서 할 수 있는 일을 살펴보면 아래와 같습니다.

이미지

  • AI가 생성한 맞춤형 "젠모지(나, 친구들 실사 바탕)", 일러스트
  • 대략적 스케치를 상세한 이미지로 생성, 텍스트 기반으로 이미지 생성
  • 사진을 자동으로 정리, 자연어로 사진 검색

텍스트 

  • 이메일 문법 교정 및 스타일 변환, 핵심 사항 요약 등 기존 생성형 AI가 잘 하는 것들
  • 문자와 이메일에서 일정 찾아서 전달, 알림 우선 순위 지정 및 요약
  • iPad의 새로운 스마트 스크립트 기능- 손글씨를 실시간으로 정리, 메시지나 웹페이지의 텍스트를 자신의 손글씨로 변환

실제 구현 화면을 보고 싶으신 분은 아래의 애플 인텔리전스 5분 요약 영상을 보세요.

애플 인텔리전스는 여러 개의 생성형 AI 모델로 구성되어 있는데요. 이러한 모델 중 2개를 애플이 자세히 설명했습니다.
🍎 Apple의 온디바이스 및 서버 기반 모델 소개

온디바이스 모델은 3B(30억) 파라미터의 언어 모델이고, 서버 기반 모델은 애플 실리콘 서버에서 실행되는 모델인데요. 공개한 내용들을 요약해 보겠습니다.

 [온디바이스 AI] 

  • 3B 수준의 작은 파운데이션 모델을 만든 뒤, 여덟가지 주요 작업을 선정해 각각 잘 처리하도록 파인튜닝
  • 작은 모델이라, 단일 모델로 여러 가지 태스크를 하기 보다 특화된 작업에 전문성을 가지도록 설정
  • 파운데이션 모델은 16비트로 학습시킨 후 4비트 양자화
  • 파인튜닝은 LoRA 튜닝으로 2비트와 4비트 양자화 혼합
  • 최적화를 통해 속도 향상(iPhone 15 Pro에서 초당 30개의 토큰 생성)
  • 어댑터로 어떤 파인튜닝 레이어를 사용할지 동적으로 결정

 [클라우드 AI] 

  • 온디바이스로 어려운 작업은 애플의 자체 클라우드 서버를 사용해서 처리
  • 클라우드는 애플 실리콘 기반의 서버, 애플이 직접 개발 및 전용 클라우드 OS 개발
  • 개인 정보 유출 원천 차단하기 위해 물리적인 스토리지 없고, 원격 접속도 안 됨
  • 디바이스에서 클라우드로 올리고 출력을 받는 모든 과정 암호화. 애플도 어떤 사용자의 작업이 이뤄지는지 알 수 없음

이밖에도 시스템 내 사용자의 정보를 앱 엔티티로 변환해서 로컬 디바이스에 저장, RAG를 위해 사용하고 있다는 점이 놀라웠습니다. 

책임 있는 개발을 지향하는 애플답게 모델들의 성능 평가에 대한 내용도 유해 콘텐츠에 대한 평가, 안전한 답변에 대한 평가들이 이어지는데요.
성능 평가는 온디바이스 모델은 오픈 소스 모델(Phi-3, Gemma, Mistral, DBRX)과 비교하고, 서버 모델은 비슷한 크기의 상용 모델(GPT-3.5-Turbo, GPT-4-Turbo)과 비교합니다. 벤치마크에서 애플의 3B 온디바이스 모델은 Phi-3-mini, Mistral-7B 및 Gemma-7B보다 성능이 뛰어납니다. 서버 모델은 DBRX-Instruct, Mixtral-8x22B 및 GPT-3.5-Turbo에 비해 매우 효율적이라고 자체 평가하고 있습니다.

축소지향 애플? 안전한 생성형 AI를 위한 전략!

오픈AI나 구글이 엄청난 크기의 파운데이션 모델을 만들어서 전세계 정보를 취합하며 성능 경쟁을 벌이고 있는 때에, 애플은 왜 작은 모델을 선택했을까요?

전 세계 10억 명 이상의 아이폰 사용자를 위해 크기, 속도, 컴퓨팅 성능을 고려한 모델을 만들어야 했을 것입니다. 
또한 애플이 중요하게 생각하는 매끄러운 사용자 경험을 위한 전략이기도 합니다. 생성형 AI의 환각 및 편향된 콘텐츠 등을 대응하기 위해 기능에 맞게 특별히 설계된 맞춤형 데이터로 여러 가지 모델을 만들어 특정 결정에 대한 투명성을 높이려고 한 것 같습니다. 생성형 AI에 대해 실용적이면서도 신중한 접근을 하는 것이죠. 특화된 작업에 집중할 수 있도록 "어댑터"를 포함한 것이 그런 전략이라고 봅니다.

애플 인텔리전스 시연 화면을 보면, 시리에서 챗GPT로 연결하는 모습을 볼 수 있는데요. 앞으로 애플은 챗GPT, 구글 제미나이 등 외부 거대언어모델(LLM)을 연결할 예정입니다. 오픈AI가 애플의 생태계에서는 그저 파트너사 중의 하나입니다.

이렇게 온디바이스 AI와 외부 모델을 활용하는 투 트랙 전략은 책임감 있는 AI+확장성 두 마리 토끼를 다 놓치고 싶지 않은 모양입니다. AI 오용과 위험과 안전 문제를 제한하면서 예상된 결과가 나오는 작업에만 애플 인텔리전스를 적용하고, 시리에 없는 질문을 할 때 챗GPT로 전환하는 형태로 문제를 외부로 보내는 것이죠. 
이미지 플레이그라운드에서 이미지를 생성할 때(온디바이스 모델), 이미지 스타일을 보면 애니메이션, 일러스트, 스케치로 제한을 둔 것을 볼 수 있습니다. 딥페이크 이미지를 만들 수 없게 한 것입니다.

애플의 온디바이스 AI 및 클라우드 AI 구현 관련해서 더 자세히 살펴보고 싶은 분은 아래 링크를 살펴보시면 좋을 것 같습니다.


23년이 생성AI를 테스트하는 해였다면, 올해는 생성AI의 현실화 단계라고 볼 수 있는데요.
올거나이즈는 B2B AI 전문 기업으로 오픈 소스 모델 기반의 파인 튜닝으로 산업 특화 모델도 만들고 있고, RAG를 통해 생성AI를 기업에서 제대로 활용할 수 있도록 돕는 기술도 뛰어납니다.

B2B AI 솔루션은 업무 현장에서 LLM을 복합적으로 결합해 문제를 해결하고, 정교하고 정확한 결과물을 만들기 위한 방향으로 진화하고 있는데요. 
기업 내 문서의 복잡한 표에서 답을 잘 찾는 기술은 올거나이즈가 오픈AI의 리트리버보다 더 잘하고 있는 영역입니다.

다양한 LLM을 우리 회사 업무에 맞게 선택해서 사용할 수 있고, 100여 개의 업무 자동화 툴을 한번에 바로 사용할 수 있는 올거나이즈의 알리 LLM 앱 마켓도 풀스택 AI 툴을 향해 진화하고 있습니다.

AI 네이티브 워크플로 툴이 궁금하시다면, 올거나이즈에 문의하세요!

Contact Us