main

A collection of 47 posts
생성형 AI 환각 해결 전략 - 하이라이트 구현
AI

생성형 AI 환각 해결 전략 - 하이라이트 구현

생성형 AI의 환각을 줄이기 위해 답의 근거가 되는 출처를 표기하는 서비스가 늘고 있습니다. 하지만 문서가 길고 복잡하면 출처 표기만으로는 근거를 제대로 찾기 어려운데요. 올거나이즈의 Alli는 근거를 하이라이트해서 표시해주고 있습니다. 하이라이트 기능이 필요한 이유와 구현 방법을 올거나이즈 이정훈 RAG 팀장이 설명해 드립니다.
10 min read
성공적인 RAG를 위한 리트리버 최적화 전략
AI

성공적인 RAG를 위한 리트리버 최적화 전략

LLM의 환각을 줄이는 RAG에 대한 관심이 높아지면서, 어떤 RAG 솔루션을 사용해야 답의 후보군을 잘 찾고 답을 생성할 수 있을지에 대한 고민도 커지고 있습니다. 올거나이즈 RAG팀에서 고성능의 리트리버 최적화를 위한 전략을 공유합니다. 키워드 검색과 의미기반 검색을 모두 사용하는 하이브리드 검색, 사례별 최적화 대응 방법을 자세히 설명 드립니다.
12 min read
💰2024 AI 인덱스 리포트 핵심 요약, 테크 기업 다음은 금융이다!
AI

💰2024 AI 인덱스 리포트 핵심 요약, 테크 기업 다음은 금융이다!

스탠퍼드 대학교 HAI에서 발간한 AI 인덱스 리포트가 공개되었습니다. 오픈AI의 GPT-4 학습 비용 약 1083억원, 구글의 제미나이 울트라(Gemini Ultra) 학습비용 약 2643억원 등 AI 모델 제작에 엄청난 비용이 소모되는 가운데, 기업에 미칠 경제적 영향력이 점점 더 중요해지고 있는데요. 생성AI로 생산성이 증가될 산업은 하이테크 다음으로 금융권인 것으로 나타났습니다. 502쪽 보고서 중 경제 챕터를 요약해 봤습니다.
9 min read
➡24년 달라진 LLM 소비 트렌드-제품 GPT, 테스트 구글, 파인튜닝 라마2
AI

➡24년 달라진 LLM 소비 트렌드-제품 GPT, 테스트 구글, 파인튜닝 라마2

여러분은 LLM 모델을 몇 개 사용하고 계신가요? 포춘 500대 기업 등에서 오픈AI만 썼던 작년과 달리, 올해는 3개 이상의 LLM 모델을 사용중입니다. 실제 프로덕션에는 여전히 오픈AI GPT가 많이 쓰이지만, 테스트 단계에서는 오픈AI보다 구글의 제미나이 모델을 더 많이 쓰고 있는데요. 기업들이 오픈 소스 모델에 대한 선호도가 높아지고 있는 것도 주목할만 합니다. 파인튜닝과 RAG가 점점 더 중요해지고 있습니다.
9 min read
한국어 실무 특화  '알파-인스트럭트' LLM 오픈소스 출시
AI

한국어 실무 특화 '알파-인스트럭트' LLM 오픈소스 출시

올거나이즈는 한국어 실무에 강한 알파-인스트럭트 LLM을 오픈소스로 출시했습니다. 라마3(Llama3) 기반의 8B 모델로 한국어 이해도가 높아 문서 생성 및 요약 등의 실무에 특화돼 있습니다. Logickor 리더보드에서 높은 점수를 기록중입니다. 알파-인스트럭트 모델에 대한 소개와 오픈소스로 공개한 이유, 제작 방식 등에 대해 자세히 설명합니다.
6 min read
RAG 리더보드 공개-금융, 공공, 의료, 법률, 커머스 한국어 RAG 성능 평가
AI

RAG 리더보드 공개-금융, 공공, 의료, 법률, 커머스 한국어 RAG 성능 평가

올거나이즈가 RAG 리더보드를 공개했습니다. 금융, 공공, 의료, 법률, 커머스의 한국어 RAG 성능을 평가하실 수 있습니다. 테스트 데이터 셋까지 모두 공개해 누구나 사용 가능합니다. 기업을 위한 RAG는 복잡한 표와 이미지에서도 답을 잘 찾을 수 있어야 합니다. 업종별 특징과 실무 문서 스타일을 반영한 RAG들을 비교해 보실 수 있습니다.
7 min read
[금융 LLM 시리즈 5] 금융 AI 모델 학습 파이프라인 및 Llama3 이후 전략
AI

[금융 LLM 시리즈 5] 금융 AI 모델 학습 파이프라인 및 Llama3 이후 전략

금융 LLM 시리즈 5편, 금융 모델 제작 후, 새로운 오픈소스 모델이 나오더라도 학습과 평가에 엔지니어의 시간이 많이 들어가지 않도록 학습 파이프라인을 자동화해야 합니다. 메타의 Llama 3 공개 이후 모델 기대체와 평가 데이터도 바뀌어야 하는 상황이 왔습니다. 올거나이즈 AI팀의 고민과 진행과정을 공유합니다.
4 min read
[금융 LLM 시리즈 4] 금융 전문 AI 모델 선정과 학습 방법
AI

[금융 LLM 시리즈 4] 금융 전문 AI 모델 선정과 학습 방법

금융 전문 AI 모델을 어떻게 학습해야 할까요? 일단 좋은 퀄리티의 금융 데이터도 확보해야 하지만, 파인 튜닝 전 파운데이션 모델도 잘 선택해야 합니다. 올거나이즈는 EEVE 모델을 선택해 QLoRA, Neftune, DPO 방법을 사용해 학습을 진행해 봤습니다. 금융 LLM 시리즈 4편, 금융 전문 AI 학습 방법에서 올거나이즈 AI팀의 고민과 진행과정을 공유합니다.
10 min read
[금융 LLM 시리즈 3] 금융 전문 AI를 위한 평가 전략
AI

[금융 LLM 시리즈 3] 금융 전문 AI를 위한 평가 전략

금융 전문 LLM의 성능은 어떻게 평가해야 할까요? 금융과 금융 문서를 이해하고, 복잡한 추론과 수식에 강해야 하는 LLM을 제대로 비교하고 평가하기 위해서는 정량평가와 정성평가가 모두 필요합니다. 금융 LLM 시리즈 3편, 금융 전문 AI를 위한 평가 전략에서 올거나이즈 AI팀의 고민과 진행과정을 공유합니다.
19 min read
[금융 LLM 시리즈 2] 금융 데이터 셋 구축 전략과 학습 예시 공개
AI

[금융 LLM 시리즈 2] 금융 데이터 셋 구축 전략과 학습 예시 공개

금융 AI 모델을 경량화하려면 특화된 데이터셋으로 학습시켜야 합니다. 올거나이즈의 금융 데이터 셋 구축 전략과 학습 예시를 공개합니다. 금융 LLM 시리즈는 온프렘 구축이 가능한 오픈소스 모델 중에서 성능 좋은 금융 AI 모델을 만들기 위한 올거나이즈 AI 팀의 고민과 진행 과정을 공유하고 있습니다.
19 min read
[금융 LLM 시리즈 1] 성능 좋은 금융 AI 모델의 정의와 평가 방법
AI

[금융 LLM 시리즈 1] 성능 좋은 금융 AI 모델의 정의와 평가 방법

오픈AI의 GPT-4나 앤트로픽의 클로드3는 성능이 뛰어나지만, 망분리 규제를 받는 금융권에서는 사용이 어려운 측면이 있습니다. 온프렘 구축이 가능한 오픈소스 모델 중에서 성능 좋은 금융 AI 모델을 만들기 위한 올거나이즈 AI 팀의 고민과 진행 과정을 공유합니다. 금융 전문 LLM의 정의와 이를 평가하기 위한 방법론에 대해 올거나이즈 신기빈 CAIO가 방향을 제시합니다.
18 min read
[올거나이즈] 금융 전문 LLM 리더보드 및 테스트 데이터 셋 공개
AI

[올거나이즈] 금융 전문 LLM 리더보드 및 테스트 데이터 셋 공개

올거나이즈가 금융 전문 LLM 리더보드와 테스트 데이터셋을 공개했습니다. 이를 통해 금융권 고객들이 자신의 업무에 적합한 LLM 모델을 효율적으로 평가할 수 있게 되었습니다. 금융 LLM 리더보드는 금융 용어와 복잡한 추론에 특화된 한국어 LLM의 성능을 평가하며, 테스트 데이터셋은 금융 문서 이해, 수식 계산, 표/차트 분석 등에 특화되어 있습니다. 금융 기업들이 LLM 도입 시 효율적인 성능 평가를 수행할 수 있을 것으로 기대됩니다.
7 min read
[세미나] 금융권 AI 도입의 핵심 전략과 구축 사례(MS, SKT)
AI

[세미나] 금융권 AI 도입의 핵심 전략과 구축 사례(MS, SKT)

기업용 생성형 AI의 강자 마이크로소프트, SK텔레콤과 올거나이즈가 금융권 AI 도입 실무자 및 임직원을 위한 실제 사례를 발표합니다. 생성형 AI 기술 트렌드 및 금융 분야 적용 전략, 금융권 생성형 AI 프로젝트 성공을 위한 핵심 전략, 생성형 AI 금융권 적용 사례 및 고려 사항을 들으실 수 있습니다.
3 min read
[AI 트렌드 전망] 24년 생성AI 핵심은 생산성: 딜로이트/이코노미스트 보고서 요약
AI

[AI 트렌드 전망] 24년 생성AI 핵심은 생산성: 딜로이트/이코노미스트 보고서 요약

2024년 AI 트렌드를 정리해봤습니다. 트렌드코리아 2024, IT 트렌드 2024, 이코노미스트와 딜로이트의 2024 전망 보고서까지 골고루 다뤘는데요. 24년 생성AI의 핵심은 생산성, 현실화, 업무 효율화입니다. 실제 기업 현장에서 생성AI가 만들어낼 임팩트를 살펴보세요. 2024년 연간 계획 수립에 도움이 되었으면 좋겠습니다.
11 min read
오픈AI 샘 알트먼 해고 후 72시간 요약 정리-구글/앤트로픽/MS 중 승자는?🍿
AI

오픈AI 샘 알트먼 해고 후 72시간 요약 정리-구글/앤트로픽/MS 중 승자는?🍿

오픈AI가 샘 알트먼을 해고하면서 엄청난 후폭풍을 맞고 있습니다. 해고 5분 전에야 소식을 알았던 마이크로소프트는 빠르게 샘 알트먼과 그렉 브록먼을 AI 리서치팀으로 고용했고, 오픈AI 투자자들은 알트먼이 복귀하지 않을 경우 이사회를 고소할 준비를 하고 있습니다. 주말 동안 오픈AI 고객사들은 구글과 앤트로픽, MS에 연락해 이동 가능성을 타진했습니다. 72시간의 반전 드라마를 간단히 요약해 드리고, 마이크로소프트와 앤트로픽, AI 투자자들의 동향을 공유해 드립니다.
11 min read
오픈AI GPT-4 터보+어시스턴트 API+GPT 스토어가 압살할 AI 생태계 정리🥶
AI

오픈AI GPT-4 터보+어시스턴트 API+GPT 스토어가 압살할 AI 생태계 정리🥶

오픈AI의 첫 개발자 컨퍼런스에서 다양한 기능들이 발표되었습니다. 더 싸고 더 빠르고 강력해진 GPT-4 터보, 무한 스레드를 제공하는 어시스턴트 API, 누구나 GPT를 만들어 수익을 낼 수 있는 GPT 스토어까지 전방위적인 업데이트가 있었는데요. 무늬만 AI였던 서비스들이 두려움에 떨고 있습니다. 화려하고 복잡한 랭체인과 GPT에 단순 기능을 더했던 스타트업들은 앞날이 불투명합니다.
9 min read
오픈AI의 retrieval은 못하는데 올거나이즈는 잘하는 것? - 복잡한 표에서 답 찾기
AI

오픈AI의 retrieval은 못하는데 올거나이즈는 잘하는 것? - 복잡한 표에서 답 찾기

오픈AI가 어시스턴트 API의 툴로 retrieval 기능을 통해 파일을 업로드해 답을 찾는 것을 선보였습니다. 올거나이즈는 오픈AI의 발표 전부터 RAG 기능을 제품에 적용했고, RAG에 사용자 피드백을 반영하는 등 실제 사용 고객을 위한 장치를 마련해 두었는데요. 오픈AI vs. 올거나이즈, 복잡한 표에서 답을 잘 찾는 솔루션은 무엇이었을까요? 비교해서 바로 보여드립니다.
10 min read
[🇯🇵일본 특별판] 일본 기업 AI 도입 현황 조사+소프트뱅크 일본어 특화 LLM 개발 소식
AI

[🇯🇵일본 특별판] 일본 기업 AI 도입 현황 조사+소프트뱅크 일본어 특화 LLM 개발 소식

일본 디지털청이 마이크로소프트와 손을 잡고 AI에 200만 달러 이상을 쓸 예정입니다. 일본 정부는 오픈AI가 아니라 왜 MS를 선택했을까요? 소프트뱅크가 AI에 투자한 금액이 1,400억 달러 이상인데 AI에서 존재감이 흐릿합니다. 이제 일본어 특화 LLM 개발에 뛰어든다고 하는데요. 소뱅이 이번에는 성공할 수 있을까요?
11 min read
기술 출시에서 '고객 중심'으로, 생성AI 2막 전략 로드맵 6️⃣단계
AI

기술 출시에서 '고객 중심'으로, 생성AI 2막 전략 로드맵 6️⃣단계

세콰이어캐피털의 '생성AI의 2막'은 생성AI가 '기술 출시' 단계에서 이제 '고객 중심'의 2막으로 진입하는 단계라고 분석하고 있습니다. 이제 실질적인 비즈니스 임팩트를 이끌어낸 사례가 중요해지고 있는데요. 석유 및 가스 산업, 헬스 산업에서 생성AI가 어떤 영향을 미치고 있는지 아람코와 엔비디아의 사례를 공유합니다. 기존 빅데이터 분석, 머신러닝과 다르게 생성AI는 반복적인 워크플로우 자동화, 거대 데이터에서 인사이트 도출 및 보고서의 빠른 생성 등의 차별화 지점을 보여주고 있습니다.
9 min read