'딥 리서치(Deep Research)' - '지식 노동자의 종말이 시작'된다고 까지

'오픈AI'가 검색, 추론, 종합 과정을 결합한 AI 에이전트 ‘딥 리서치(Deep Research)’를 내놨다. 이는 기존 AI 모델보다 한 단계 진화한 AI 리서치 도구로, 금융, 과학, 정책, 엔지니어링 등 집중적인 연구와 심층 분석이 필요한 분야에 특화되어 있다.

특히 비직관적이고 틈새 정보가 많은 주제를 찾는 데 강력한 기능을 제공하며, 추론을 활용해 방대한 양의 온라인 정보를 종합하고 다단계 연구 작업을 수행할 수 있다.

따라서 ‘딥 리서치’는 기존 AI 도구보다 한층 진화한 독립적 연구 수행 AI 에이전트로, 광범위한 검색, 심층 추론, 다단계 분석을 통해 전문가 수준의 보고서를 자동 생성하는 기능을 갖추고 있다. 연구자는 AI가 생성한 보고서를 검토·보완하는 방식으로 연구를 효율적으로 수행할 수 있으며, 특히 방대한 데이터 분석 및 틈새 정보를 찾는 데 강력한 기능을 발휘할 것으로 기대된다.

■ ‘딥 리서치(Deep Research)’의 작동 방식

  • 사용자 질의 수집 및 명확화
    • 사용자가 질문이나 연구 주제를 입력하면, AI 에이전트가 추가 질문을 통해 요구사항을 구체화
    • 예: "모바일 보급률을 어떤 기준으로 분석할 것인가?"
  • 정보 수집 및 분석
    • 수백 개의 논문, 뉴스, 데이터베이스를 검색하여 관련 정보를 수집
    • 수집된 정보를 비교 및 평가하여 신뢰성 높은 데이터를 선별
  • 데이터 가공 및 보고서 생성
    • 표, 그래프, 차트 등으로 데이터 시각화
    • 생성된 보고서에 출처 명확히 표기하여 신뢰성 확보
  • 사용자 피드백 반영 및 추가 조사
    • 필요에 따라 추가 탐색을 수행하고 결과를 보완
    • 사용자 요구 사항에 따라 데이터를 업데이트 및 개선

   이를 통해 사용자는 복잡한 연구 과제를 자동화하고,
   전문가 수준의 심층 분석 보고서를 손쉽게 생성할 수 있다.

■ ‘딥 리서치(Deep Research)’의 성능 평가

‘딥 리서치’는 전문가 수준에서 광범위한 주제를 테스트하는 HLE(Humanity’s Last Exam)에서 정확도 26.6%를 기록했다. 이는 기존 AI 모델 대비 월등히 높은 성능이다.

  • GPT-4o: 3.3%
  • Claude 3.5 Sonnet: 3.8%
  • Gemini Thinking: 6.2%
  • OpenAI o1: 9.1%
  • OpenAI o3-mini(high): 13.0%

오픈AI는 '딥 리서치'가 GPT-4o보다 뛰어난 추론 능력을 갖추었으며,
기존 AI의 단순한 정보 나열 방식에서 벗어나 전문 연구자의 보고서와 유사한 수준의 결과를 생성한다고 발표했다.

■ ‘딥 리서치(Deep Research)’의 활용 사례

  • 의료 분야   AI타임스
    • 유방암 치료 옵션에 대한 심층 보고서 작성
    • 환자의 나이와 유전적 요인을 고려한 맞춤형 치료 정보 제공
  • 기술 연구   네이버 프리미엄콘텐츠
    • 에단 몰릭(Ethan Mollick) 교수의 연구 과제 수행
    • 6개의 인용문과 참고문헌이 포함된 13페이지 분량 보고서 생성
  • 제품 분석
    • 자동차, 가전제품, 가구 등 검토가 필요한 제품에 대해 맞춤형 추천 보고서 작성.
    • 사용자의 요구를 반영한 최적의 제품 추천
  • 시장 조사 및 금융 리서치
    • 방대한 웹 데이터를 분석해 경쟁 분석 및 산업 전망 보고서 생성

■ ‘딥 리서치(Deep Research)’ 방식의 차별점 및 기능 확장

  • 기존 연구 방식
    • 검색 엔진에서 키워드를 입력해 자료 검색
    • 수작업으로 정리 및 분석 후 보고서 작성
    • 다단계 과정을 반복해야 하는 비효율성
  • ‘딥 리서치’ 방식
    • AI가 자동으로 정보 검색, 분석, 종합하여 보고서 작성
    • 연구자는 주제 설정과 결과 검토만 수행하면 됨
    • 전문가가 며칠 걸릴 작업을 단 몇 분 만에 완료
  • '딥 리서치'의 기능 및 확장성
    • 사용자 데이터 업로드 가능 (PDF, CSV 등)
    • 파이썬을 활용한 그래프 및 시각화 지원
    • 출처 인용 기능 제공 (신뢰할 수 있는 데이터 활용 가능)

■ ‘딥 리서치'의 한계 및 개선 과제

  • 가끔 사실을 착각하거나 잘못된 추론 가능
  • 권위 있는 정보와 루머 구별이 어려울 수 있음
  • 초기에는 보고서 서식 오류 및 작업 속도 문제 발생 가능
  • 사용자의 피드백을 반영해 지속적으로 개선될 것으로 예상

■ ‘딥 리서치'의 사용 

  • 현재 챗GPT 프로(Pro) 사용자(월 200U$)만 이용 가능
  • 추후 챗GPT 플러스(Plus) 및 팀(Team) 사용자에게 제공 예정
  • 웹브라우저에서만 사용 가능, 조만간 모바일 및 데스크톱 앱 출시 예정
  • 월 최대 100개의 쿼리 사용 가능



* https://brunch.co.kr/@aichaemun/146
* https://brunch.co.kr/@plutoun/224

* https://www.youtube.com/watch?v=XsSvngBWeC8
* https://youtu.be/8TyjphM8wcg

Comments

Popular posts from this blog

🧑‍🏫[칼럼] 미래 인재상, T자형 하이브리드로 설계하라

[인사이트] "연구용 AI"의 등장과 연구 패러다임의 변화

AI의 기반 : 데이터부터 시작하라