📘 1. 데이터 형태의 구분: 정형 / 비정형 / 반정형분류예시특징정형(Structured)RDB, Excel스키마 기반, SQL 처리 용이비정형(Unstructured)영상, 음성, SNS자유 형식, 분석 어려움반정형(Semi)JSON, XML형식 존재, 스키마 유동적 📘 2. 빅데이터의 특성: 3V → 5V 확장항목설명Volume데이터 양Velocity생성 속도Variety데이터 다양성Veracity신뢰성 (정확한가?)Value가공했을 때의 가치 📘 3. Hadoop 개요HDFS: 분산 파일 저장 시스템MapReduce: 병렬 분산 처리 엔진데이터 크기가 수 TB~PB 이상인 경우 적합단점: 속도가 느림, 실시간 처리 한계📘 4. Spark 개요In-memory 기반 처리 시스템RDD (Res..