신문 기사 데이터를 정량적 분석 데이터로 전환하는 체계적인 프로세스는 다음과 같다. <1단계> 데이터 수집 및 표준화 (Data Collection) 북한 매체(로동신문, 조선중앙통신 등)에서 특정 기업소명을 키워드로 기사를 추출하고, 통합 워크시트를 작성하는 단계이다. 수집 대상: 로동신문, 민주조선, 조선중앙통신 등 북한 관영 매체 워크시트 구성 : 순번 | 기사제목 | 출처 | 일자 | 기사내용(Raw Text) 표준화 작업 : 일자 형식을 YYYY-MM-DD로 통일하고, 중복 기사나 단순 동정 보도는 선별하여 제거한다. <2단계> 경영 활동 내용 추출 및 요약 기사 내용 중 기업의 경영 성과, 기술 도입, 설비 보수 등 실질적인 경영 행위를 식별하여 요약하는 단계이다. 핵심 식별 요소 : 신규 설비 도입, 기술 혁신안 적용, 원자재 반입, 목표 달성률 등 작성 원칙 : 북한식 수사적 표현(예, '충성의 돌격전', '불타는 열의')을 배제하고, '무엇을(대상)', '어떻게(수단)', '결과(성과)' 중심으로 평어체 요약한다. <3단계> 밸류체인(VC) 분류 및 매핑 요약된 경영활동을 사전 정의된 6개 항목으로 분류한다. 북한 산업의 특수성을 고려하여 분류 기준을 명확히 한다. VC 6개 항목 정의(예시) R&D : 기술혁신안, 창안 도입, 과학기술보급실 운영 조달 : 파철 수집, 연료/원자재 반확보, 외부 자재 반입 생산 : 용해 공정, 압연 실적, 일일 계획 초과 달성 설비 : 보수 및 정비, 현대화 개건 공사, 국산화 설비 교체 품질 : 규격화, 검사 강화, 강재의 질적 향상 군수/기타 : 군수품 생산 지원, 대외 협력, 후방 사업 중복 분류: 하나의 활동이 설비 현대화와 생산 증대에 동시에 기여한다면 두 항목 모두 표기한다. <4단계> 정량 분석 데이터 구축 분류된 데이터를 통계 분석이 가능한 형태의 최종 ...
Comments
Post a Comment