비영어권 LLM 현황

비영어권 LLM(대형언어모델)은 자국 언어와 문화의 특수성을 반영하고, 글로벌 LLM에서 소외되기 쉬운 언어적 한계를 극복하기 위한 전략으로 주목받고 있다. 현재 아랍어, 일본어, 한국어, 중국어, 러시아어, 인도네시아어 등 비영어권 주요 언어를 중심으로 각국이 독자적인 LLM을 개발하고 있으며, 일부는 다국어를 포괄하는 유럽형 모델로 확장되고 있다.

< 비영어권 LLM 종합 표 > (2024–2025 기준)

모델명주요 언어파라미터 수공개 여부대표 적용 사례
Falcon 2 11B아랍어11B공개공공 서비스 번역 지원
Jais 13B아랍어 + 영어13B공개COP28 기후문서 요약
Mistral Large유럽 다국어12B공개EU 번역 AI 시험 통과
Aya-101101개 언어13B공개다국어 지시 따르기 정확도 94%
DeepSeek V2중국어 + 영어67B공개바이두 검색, BMW 자동차 음성비서
OpenHPI독일어비공개비공개공공 디지털 교과서 지원
Fugaku LLM일본어미공개연구용행정 자동화, 입시 필터링
Sahabat-AI인도네시아어 + 방언~13B부분공개교통 자동응답, 교육 번역
GPT-SW3스웨덴어20B공개공공기관 보고서 요약, 교육 협업
Viking 7B핀란드어, 노르웨이어 등7B공개북유럽 정부 공동 번역 플랫폼
YandexGPT 3.0러시아어비공개비공개검색, 브라우저 비서 ‘Alice’ 운영
KoGPT / HyperCLOVA한국어수십억 단위일부 공개카카오톡·네이버 서비스용 챗봇
PanGu-Σ / Ernie Bot중국어100B+ 이상일부 공개화웨이·바이두 AI 제품군 기반
Navarasa 2.0 / Bhashini힌디어 및 인도 언어다양일부 공개공공 서비스, 저소득층 언어 접근
PLLUM폴란드어미공개비공개공공 행정 및 서비스
Masakhane / Aya스와힐리 등 아프리카 언어다양공개언어 소수권 보호, 교육 번역
Aleph Alpha독일어 + 유럽 언어다양일부 공개독일 기업 솔루션 및 GPT 대안

Comments

Popular posts from this blog

🧑‍🏫[칼럼] 미래 인재상, T자형 하이브리드로 설계하라

[인사이트] "연구용 AI"의 등장과 연구 패러다임의 변화

Local Deep Research : 로컬 환경에서 OpenAI의 Deep Research와 유사하게 동작