생성형 AI

A collection of 4 posts
DeepSeek-R1의 등장, 그럼에도 우리가 놓치지 말아야 하는 것 - Part 2
생성형 AI

DeepSeek-R1의 등장, 그럼에도 우리가 놓치지 말아야 하는 것 - Part 2

* 최근 우리를 놀라게 한 DeepSeek-R1에 대해 2개의 블로그 글로 설명해드립니다. * 이번 Part 2에서는 DeepSeek-R1이 가져온 패러다임의 변화에 대한 내용을 담았습니다. 먼저 업로드한 Part 1에서는 DeepSeek-R1의 등장배경과 모델에 대한 기술적 내용을 자세히 알려드렸습니다. 긴 글이지만 2개 글 모두를 읽어보실 것을 추천드립니다. * 이 글은 올거나이즈 RAG팀의 조한준 엔지니어님이 작성하셨습니다. 3. 추론 중심
12 min read
DeepSeek-R1의 등장, 그럼에도 우리가 놓치지 말아야 하는 것 - Part 1
생성형 AI

DeepSeek-R1의 등장, 그럼에도 우리가 놓치지 말아야 하는 것 - Part 1

* 최근 우리를 놀라게 한 DeepSeek-R1에 대해 2개의 블로그 글로 설명해드립니다. * 이번 Part 1에서는 DeepSeek-R1의 등장배경과 모델에 대한 기술적 내용을 담았습니다. 이어지는 Part 2에서는 DeepSeek-R1이 가져온 패러다임의 변화에 대해 설명드릴 예정입니다. 긴 글이지만 2개 글 모두를 읽어보실 것을 추천드립니다. * 이 글은 올거나이즈 RAG팀의 조한준 엔지니어님이 작성하셨습니다. 1. AI 사전학습의 한계: 데이터
19 min read
Allganize의 새로운 LLM 평가 플랫폼으로 DeepSeek-V3를 평가해 봤습니다.
생성형 AI

Allganize의 새로운 LLM 평가 플랫폼으로 DeepSeek-V3를 평가해 봤습니다.

DeepSeek-V3에 대한 Agent 벤치마크 평가 결과 최근 6700억 개의 파라미터를 가진 DeepSeek-V3가 오픈소스로 공개되었습니다. DeepSeek-V3는 ChatGPT나 Gemini처럼 텍스트를 이해하고 생성하는 데 뛰어난 능력을 가진 LLM이지만, 기존 모델과는 몇 가지 중요한 차이점을 가지고 있습니다. 이 모델의 핵심 목표는 높은 성능을 유지하면서도 학습 비용을 크게 절감하는 것입니다. DeepSeek-V3는 주요 기술적 혁신을 통해
17 min read
실시간 서비스를 위한 Cross-Encoder 경량화 시도와 엔지니어링을 통한 최적화
생성형 AI

실시간 서비스를 위한 Cross-Encoder 경량화 시도와 엔지니어링을 통한 최적화

* 실시간 서비스를 위한 Cross-Encoder 경량화 시도에 대해 올거나이즈 RAG팀의 조한준 엔지니어님이 설명해 드립니다. 1. 서론: Cross-Encoder와 실시간 검색 시스템의 과제 1.1 배경 Reranking은 검색 시스템에서 검색 결과의 품질을 결정짓는 핵심 과정으로, 최종 사용자 경험에 큰 영향을 미칩니다. 이 중에서도 Cross-Encoder는 쿼리와 문서 간의 상호작용을 정교하게 모델링하여, 기존 검색 모델(
22 min read