×닫기
올거나이즈가 국내 최초로 검색 증강 생성(RAG) 성능을 평가하는 '알리 RAG 리더보드'를 공개했습니다. 이 리더보드는 금융, 공공, 의료, 법률, 커머스의 5개 분야에서 한국어 RAG 성능을 평가합니다. 이를 통해 기업들은 가장 적합한 RAG 솔루션을 비교하고 도입할 수 있습니다 (AI타임스) (올거나이즈, 기업 생산성을 혁신하는 LLM Enabler).
리더보드는 답변 유사도 및 정확도를 판단하는 5개의 평가 도구를 사용하여 성능을 평가합니다. 이 도구들은 답변의 정확성과 유사성을 측정하며, 각 평가 결과에서 3개 이상의 도구가 오류 없이 통과된 경우에 '이상 없음'으로 판정합니다 (올거나이즈, 기업 생산성을 혁신하는 LLM Enabler).
또한, 올거나이즈는 테스트 데이터셋을 공개하여 기업들이 실제 업무에 적용할 수 있도록 지원하고 있습니다. 문서, 이미지, 표 등의 다양한 데이터가 포함된 테스트셋을 활용하여 더욱 현실적인 평가가 가능하도록 했습니다. 이를 통해 기업들은 개발자 투입 없이도 맞춤형 모델을 쉽게 구축할 수 있습니다 (올거나이즈, 기업 생산성을 혁신하는 LLM Enabler).
이 리더보드는 허깅페이스(Hugging Face) 플랫폼에서 확인할 수 있으며, 다양한 RAG 솔루션들도 링크로 제공되어 누구나 체험해 볼 수 있습니다 (올거나이즈, 기업 생산성을 혁신하는 LLM Enabler).
올거나이즈의 이러한 노력은 기업들이 RAG 도입을 통해 업무 생산성을 높이고, AI 생태계에 기여할 수 있는 중요한 발판이 될 것입니다 (AI타임스) (올거나이즈, 기업 생산성을 혁신하는 LLM Enabler).
langchain을 활용한 벡터 데이터 만들기 (0) | 2024.11.11 |
---|---|
AI 가 주는 프로그래머의 삶의 변화 (1) | 2024.11.09 |
챗GPT로 소개팅 전략 짜기 (0) | 2023.04.10 |
빅데이터의 실상 (0) | 2016.02.03 |