DeepSeek의 기술적 혁신과 AI 생태계에 미치는 영향 (KISTI 정책연구센터)

February 10, 2025

* 이 내용은 KISTI 정책연구센터에서 분석한 내용입니다.(2025.02.07)

■ (DeepSeek 개요) 중국 AI스타트업 DeepSeek*가 '24년 12월 이후 공개한 거대언어모델(LLM)인 DeepSeek-V3 등의 제품군으로, 제한된 자원과 비용으로 최신 LLM에 필적한 성능 구현

* 헤지펀드사인 幻方量化(High-Flyer Quant) 산하 AI 연구소로 설립('23.7.)
ㅇ 금융 분야 AI 개발을 통해 축적한 기술력을 자연어처리 및 딥러닝 분야로 확대
ㅇ Transformer 기반 구조를 유지하며, 효율적인 학습과 추론을 위한 특징 기술 적용
ㅇ '25년 1월에 발표한 추론에 특화된 모델인 DeepSeek-R1은 수학과 프로그래밍 벤치마크에서 OpenAI o1과 Claude-3.5 등 보다 우월한 성능을 보임

■ (DeepSeek의 기술적 특징) 저사양 컴퓨팅 환경에 최적화된 AI 아키텍처를 통해 비용 효율성 및 성능 최적화에 중점
ㅇ 모델 경량화 기술을 통한 연산 최적화 및 학습 비용 절감
ㅇ 소량·고품질 데이터를 Cold-Start 데이터로 활용하여 초기 학습 안정성 개선
ㅇ 규칙 기반 보상 기반 다단계 강화학습 적용으로 경쟁력 있는 추론 성능 확보
ㅇ 효율적인 정책 최적화(GRPO) 기반의 강화학습을 통한 학습 속도 개선

■ (DeepSeek의 영향) AI 모델 개발 패러다임의 변화로 AI 혁신이 가속화하며, AI를 중심으로 국가 간 기술 패권경쟁 격화 및 관련 산업 전반에 영향을 줄 것으로 예상
ㅇ (오픈소스) 오픈소스로 모델을 공개하고 누구나 활용할 수 있게 하여 AI 모델의 활용성을 제고
ㅇ (패권경쟁 격화) 미국의 기술 패권 경쟁국에 대한 반도체 제재 강화 및 중국 기업의 AI 분야 투자 확대로 국내 (반도체) 기업 환경 불확실성 증가
ㅇ (국제 규제 심화) 민감 데이터 유출 및 사이버 안보 위협 가능성 등으로 주요국은 DeepSeek 사용을 제한하거나 규제를 논의 중

⭴ (DeepSeek의 한계/도전과제) 학습데이터 정보 미공개 및 과도한 개인정보 수집 등 AI 모델 운영의 투명성과 보안 취약 및 악의적 활용 등 안전성의 문제점 지적
ㅇ 오픈소스에 기반한 높은 개방성에 비해 학습데이터를 공개하지 않아 투명성 결여
ㅇ DeepSeek 사용 시 수집하는 사용자 데이터를 과도하게 수집하고, 중국 정부 및 관련 사업자와 수집한 데이터를 공유하는 등 개인정보 유출 및 악용 우려
ㅇ 중국 정부의 통제로 인한 정보 생성의 검열·제한과 정보 왜곡의 발생 가능
ㅇ 민감 데이터 노출 등 보안 취약점 및 탈옥·적대적 공격 등 안전성 문제 우려
ㅇ 언론에 공개된 모델 개발비용은 DeepSeek-V3의 공식적인 훈련비용으로, 실제 개발비용은 추가 확인 필요

■ 대응 방향
ㅇ 데이터·서비스 관련
- 고품질의 데이터 구축, 제공 및 활용
- 서비스 제공 시 수집 데이터의 저장, 활용 등 투명성 확보
ㅇ AI 기초 기술 R&D
- 공개모델의 활용에서 최적화된 자체 기술 개발
- Chain of Thought(CoT) 기술을 활용한 추론 성능 강화
- 초거대 모델 활용 실용화를 위한 모델 경량화
ㅇ AI R&D 인프라
- AI 기초 기술 연구 역량 강화
- AI 연구 최적화를 위한 이종컴퓨팅 환경 개발 강화
- AI 기술 및 연구자원 R&D를 위한 산업계/학계 협력 개방형 R&D 전략 수립
ㅇ AI 활용 확산 및 보안
- 기관 내 DeepSeek, ChatGPT 등 LLM 사용 지침 마련 등 보안 및 활용 교육 강화

Search This Blog

Research Data & AI

DeepSeek의 기술적 혁신과 AI 생태계에 미치는 영향 (KISTI 정책연구센터)

Comments

Post a Comment

Popular posts from this blog

"PaperBanana", AI Scientist 위한 논문 일러스트 생성 AI

AI 활용 6대 영역 및 인간-AI 협력 역할 분석

NK 신문기사 데이터의 정량화 방안 (안) : 북한 기업소 밸류체인(VC) 분석 프로세스