정형/비정형 데이터 & 빅데이터 처리 시스템 요약 (Hadoop, Spark)

정보처리기사

정형/비정형 데이터 & 빅데이터 처리 시스템 요약 (Hadoop, Spark)

news800905 2025. 5. 11. 10:51

728x90

📘 1. 데이터 형태의 구분: 정형 / 비정형 / 반정형

분류예시특징

정형(Structured)	RDB, Excel	스키마 기반, SQL 처리 용이
비정형(Unstructured)	영상, 음성, SNS	자유 형식, 분석 어려움
반정형(Semi)	JSON, XML	형식 존재, 스키마 유동적

📘 2. 빅데이터의 특성: 3V → 5V 확장

항목설명

Volume	데이터 양
Velocity	생성 속도
Variety	데이터 다양성
Veracity	신뢰성 (정확한가?)
Value	가공했을 때의 가치

📘 3. Hadoop 개요

HDFS: 분산 파일 저장 시스템
MapReduce: 병렬 분산 처리 엔진
데이터 크기가 수 TB~PB 이상인 경우 적합
단점: 속도가 느림, 실시간 처리 한계

📘 4. Spark 개요

In-memory 기반 처리 시스템
RDD (Resilient Distributed Dataset) 구조 사용
Hadoop보다 10~100배 빠른 처리 가능
Streaming / Graph / SQL / MLlib 등 다양한 확장 API 보유

📘 5. 비교 요약

항목HadoopSpark

처리 방식	디스크 기반	메모리 기반
속도	느림	빠름
실시간	불리	유리
활용 분야	대용량 배치 처리	실시간 분석, 머신러닝

📝 기출 포인트 정리

비정형 데이터: 영상, 음성, SNS, 로그 파일 등
MapReduce는 Hadoop의 처리 모델
Spark는 RDD 기반 인메모리 처리 시스템
NoSQL, 분산 처리와 연계되는 문제도 함께 출제됨

728x90

'정보처리기사' 카테고리의 다른 글

운영체제 기초 이론: 운영체제 역할, 주요 기능, 프로세스 vs 스레드 구분 (0)	2025.05.13
데이터베이스 마무리 정리 – 데이터 사전, 정합성, 메타데이터, SQL 보안 이슈 (0)	2025.05.12
📘 [12일차] NoSQL, 분산 데이터베이스, CAP 이론 — 정보처리기사 최신 기술 흐름 요약 (1)	2025.05.10
📘 [11일차] 데이터베이스 보안과 백업 복구 전략 완전 정리 (0)	2025.05.09
📘 [10일차] 뷰(View), 인덱스(Index), 클러스터링(Clustering) 완전 정리 (0)	2025.05.08

현재글정형/비정형 데이터 & 빅데이터 처리 시스템 요약 (Hadoop, Spark)

일상다반사

AI 뉴스

250x250

마비노기, 입석좌석 #스탠딩시트 #skyrider2_0 #저비용항공 #항공혁신 #비행기좌석 #lcc #항공안전 #단거리항공 #기내체험 #루틴픽트렌드, 정보처리기사 #조합회로 #순서회로 #논리게이트 #andornot #플립플롭 #정보처리기사기출, 사찰제사 #제사음식재탕 #종교윤리 #유족신뢰 #소비자권리 #경남사찰 #절투명성 #루틴픽생활정보, 손흥민 #토트넘 #유로파리그우승 #캡틴 #축구스타, 케미컬스필 #고속도로사고 #염산유출 #방제작업 #화학물질안전 #충남공주 #당진대전고속도로 #환경보호 #도로통제 #비상대응 #위험물운송 #공공안전 #사고예방 #루틴픽안전정보, 김상욱 #물리학자 #과학커뮤니케이터 #떨림과울림 #과학강연 #과학책추천 #호기심 #질문하는힘 #티스토리, 정보처리기사 #주소지정방식 #명령어사이클 #전자계산기기출 #opcode #immediateaddressing #정보처리기사필기, 트럼프푸틴 #미러협상 #국제정세 #우크라이나전쟁 #세계뉴스 #대선이슈 #한반도안보 #글로벌경제 #티스토리, 삼성전자서비스 #ksqi #고객감동콜센터 #서비스품질 #고객만족 #ai상담 #생활정보 #티스토리, 정보처리기사 #전자계산기기출 #가산기 #플립플롭 #카운터 #논리회로정리 #정보처리기사필기, 이벤트, 마비노기 모바일, 초여름건강 #미세먼지대비 #더위관리 #건강습관 #여름생활팁 #일상꿀팁 #면역력강화 #티스토리, 일회용품줄이기 #텀블러사용 #친환경카페 #경기도정책 #환경보호 #카페트렌드 #텀블러세척기 #지구를지키는습관 #티스토리, 새둥지, 모비노기, 비상금 #72시간생존 #정전대비 #네덜란드 #생존키트 #비접촉결제 #위기관리 #루틴픽트렌드 #전산망장애, 장마철 #실내습기 #곰팡이예방 #제습기팁 #생활정보, 퀘스트,

Today :
Yesterday :

티스토리툴바