DeepSeek의 기술적 혁신과 AI 생태계에 미치는 영향 (KISTI 정책연구센터)


 * 이 내용은 KISTI 정책연구센터에서 분석한 내용입니다.(2025.02.07)

■ (DeepSeek 개요) 중국 AI스타트업 DeepSeek*가 '24년 12월 이후 공개한 거대언어모델(LLM)인 DeepSeek-V3 등의 제품군으로제한된 자원과 비용으로 최신 LLM에 필적한 성능 구현

       * 헤지펀드사인 幻方量化(High-Flyer Quant) 산하 AI 연구소로 설립('23.7.)
 ㅇ 금융 분야 AI 개발을 통해 축적한 기술력을 자연어처리 및 딥러닝 분야로 확대
 ㅇ Transformer 기반 구조를 유지하며효율적인 학습과 추론을 위한 특징 기술 적용
 ㅇ '25년 1월에 발표한 추론에 특화된 모델인 DeepSeek-R1은 수학과 프로그래밍 벤치마크에서 OpenAI o1과 Claude-3.5 등 보다 우월한 성능을 보임
 
■ (DeepSeek의 기술적 특징) 저사양 컴퓨팅 환경에 최적화된 AI 아키텍처를 통해 비용 효율성 및 성능 최적화에 중점
 ㅇ 모델 경량화 기술을 통한 연산 최적화 및 학습 비용 절감
 ㅇ 소량·고품질 데이터를 Cold-Start 데이터로 활용하여 초기 학습 안정성 개선
 ㅇ 규칙 기반 보상 기반 다단계 강화학습 적용으로 경쟁력 있는 추론 성능 확보
 ㅇ 효율적인 정책 최적화(GRPO) 기반의 강화학습을 통한 학습 속도 개선
 
■ (DeepSeek의 영향) AI 모델 개발 패러다임의 변화로 AI 혁신이 가속화하며, AI를 중심으로 국가 간 기술 패권경쟁 격화 및 관련 산업 전반에 영향을 줄 것으로 예상
 ㅇ (오픈소스) 오픈소스로 모델을 공개하고 누구나 활용할 수 있게 하여 AI 모델의 활용성을 제고
 ㅇ (패권경쟁 격화미국의 기술 패권 경쟁국에 대한 반도체 제재 강화 및 중국 기업의 AI 분야 투자 확대로 국내 (반도체기업 환경 불확실성 증가
 ㅇ (국제 규제 심화) 민감 데이터 유출 및 사이버 안보 위협 가능성 등으로 주요국은 DeepSeek 사용을 제한하거나 규제를 논의 중
 
 ⭴ (DeepSeek의 한계/도전과제) 학습데이터 정보 미공개 및 과도한 개인정보 수집 등 AI 모델 운영의 투명성과 보안 취약 및 악의적 활용 등 안전성의 문제점 지적
 ㅇ 오픈소스에 기반한 높은 개방성에 비해 학습데이터를 공개하지 않아 투명성 결여
 ㅇ DeepSeek 사용 시 수집하는 사용자 데이터를 과도하게 수집하고중국 정부 및 관련 사업자와 수집한 데이터를 공유하는 등 개인정보 유출 및 악용 우려
 ㅇ 중국 정부의 통제로 인한 정보 생성의 검열·제한과 정보 왜곡의 발생 가능
 ㅇ 민감 데이터 노출 등 보안 취약점 및 탈옥·적대적 공격 등 안전성 문제 우려
 ㅇ 언론에 공개된 모델 개발비용은 DeepSeek-V3의 공식적인 훈련비용으로실제 개발비용은 추가 확인 필요
 
■ 대응 방향
 ㅇ 데이터·서비스 관련
   - 고품질의 데이터 구축제공 및 활용
   - 서비스 제공 시 수집 데이터의 저장활용 등 투명성 확보
 ㅇ AI 기초 기술 R&D
   - 공개모델의 활용에서 최적화된 자체 기술 개발
   - Chain of Thought(CoT) 기술을 활용한 추론 성능 강화
   - 초거대 모델 활용 실용화를 위한 모델 경량화
 ㅇ AI R&D 인프라
   - AI 기초 기술 연구 역량 강화
   - AI 연구 최적화를 위한 이종컴퓨팅 환경 개발 강화
   - AI 기술 및 연구자원 R&D를 위한 산업계/학계 협력 개방형 R&D 전략 수립
 ㅇ AI 활용 확산 및 보안
   - 기관 내 DeepSeek, ChatGPT 등 LLM 사용 지침 마련 등 보안 및 활용 교육 강화

Comments

Popular posts from this blog

🧑‍🏫[칼럼] 미래 인재상, T자형 하이브리드로 설계하라

AI 활용 6대 영역 및 인간-AI 협력 역할 분석

"PaperBanana", AI Scientist 위한 논문 일러스트 생성 AI