RAG

A collection of 3 posts
DeepSeek-R1의 등장, 그럼에도 우리가 놓치지 말아야 하는 것 - Part 2
생성형 AI

DeepSeek-R1의 등장, 그럼에도 우리가 놓치지 말아야 하는 것 - Part 2

* 최근 우리를 놀라게 한 DeepSeek-R1에 대해 2개의 블로그 글로 설명해드립니다. * 이번 Part 2에서는 DeepSeek-R1이 가져온 패러다임의 변화에 대한 내용을 담았습니다. 먼저 업로드한 Part 1에서는 DeepSeek-R1의 등장배경과 모델에 대한 기술적 내용을 자세히 알려드렸습니다. 긴 글이지만 2개 글 모두를 읽어보실 것을 추천드립니다. * 이 글은 올거나이즈 RAG팀의 조한준 엔지니어님이 작성하셨습니다. 3. 추론 중심
12 min read
DeepSeek-R1의 등장, 그럼에도 우리가 놓치지 말아야 하는 것 - Part 1
생성형 AI

DeepSeek-R1의 등장, 그럼에도 우리가 놓치지 말아야 하는 것 - Part 1

* 최근 우리를 놀라게 한 DeepSeek-R1에 대해 2개의 블로그 글로 설명해드립니다. * 이번 Part 1에서는 DeepSeek-R1의 등장배경과 모델에 대한 기술적 내용을 담았습니다. 이어지는 Part 2에서는 DeepSeek-R1이 가져온 패러다임의 변화에 대해 설명드릴 예정입니다. 긴 글이지만 2개 글 모두를 읽어보실 것을 추천드립니다. * 이 글은 올거나이즈 RAG팀의 조한준 엔지니어님이 작성하셨습니다. 1. AI 사전학습의 한계: 데이터
19 min read
실시간 서비스를 위한 Cross-Encoder 경량화 시도와 엔지니어링을 통한 최적화
생성형 AI

실시간 서비스를 위한 Cross-Encoder 경량화 시도와 엔지니어링을 통한 최적화

* 실시간 서비스를 위한 Cross-Encoder 경량화 시도에 대해 올거나이즈 RAG팀의 조한준 엔지니어님이 설명해 드립니다. 1. 서론: Cross-Encoder와 실시간 검색 시스템의 과제 1.1 배경 Reranking은 검색 시스템에서 검색 결과의 품질을 결정짓는 핵심 과정으로, 최종 사용자 경험에 큰 영향을 미칩니다. 이 중에서도 Cross-Encoder는 쿼리와 문서 간의 상호작용을 정교하게 모델링하여, 기존 검색 모델(
22 min read