본문 바로가기

자격증/데이터분석준전문가(ADSP)

[방디] 데이터분석준전문가(ADSP) - 데이터 이해(1과목) - 데이터의 가치와 이해

728x90

안녕하세요. 방디입니다.

 

지난 글에서는 데이터분석준전문가의 첫번째 학습자료로 1과목 데이터 이해 - [데이터의 이해]를 다루었습니다.

오늘은 이어서 같은 1과목의 [데이터의 가치와 이해] 부분을 소개하겠습니다.

 

감사합니다.

 

※ 제가 안내드리는 내용은 시험주관처에서 안내하는 시험과목 순서를 따르지만, 일부 중요도가 낮은 부분은 다루지 않습니다.


데이터 이해

데이터의 가치와 미래

1. 빅데이터의 이해

. 빅데이터의 정의

- 더그 래니(Doug Laney)3V: Volume(), Variety(다양성), Velocity(속도)

- 최근 4V의 개념으로 추가되는 개념: Value(가치), Visualization(시각화), Veracity(정확성)

- 3V라는 협의의 정의에서 인재, 조직 변화까지 포함하는 광의의 정의로 점차 확대

 

. 빅데이터의 기대과 비유

- 산업혁명의 석탄과 철: 서비스 분야의 생산성 향상을 통하여 사회, 경제, 문화, 생활 전반의 혁명적 변화 기대

- 21세기 원유: 산업 전반의 생산성 향상과 함께 새로운 산업 창조

- 렌즈: 생물학 발전에 대한 현미경의 영향처럼 데이터가 산업 발전에 큰 영향을 미침

- 플랫폼: 공동 활용 목적으로 구축된 유무형의 구조물로서 플랫폼 역할 기대

 

. 빅데이터로 인한 변화

과거 현재
사전처리 사후처리
표본조사 전수조사
질(Quality) 양(Quantity)
인과관계 상관관계

 


2. 빅데이터의 가치와 영향

. 빅데이터 가치 산정의 어려움

- 데이터의 재사용이나 재조합 등의 활용방식이 일반화되면서 가치 산정이 어려움

- 빅데이터는 기존에 없던 새로운 가치를 창출하기에 가치 측정이 어려움

- 새로이 등장하는 분석 기술로 과거 가치가 없던 데이터도 새로운 가치를 찾아낼 수 있음

 

. 빅데이터의 영향

- 기업: 소비자 행동분석이나 시장변동 예측을 통해 비즈니스 모델을 발전

- 정부: 기상, 인구이동 등 데이터를 수집하여 사회변화를 추정

- 개인: 데이터 분석 비용의 하락으로 개인이 목적에 따라 자유로이 빅데이터를 활용

 


3. 비즈니스 모델

. 빅데이터 활용 기본 테크닉

테크닉 내용
연관규칙학습 변인들 간 주목할 만한 상관관계를 찾는 방법
유형분석 대상의 특성에 따라 분류
유전자 알고리즘 최적화가 필요한 문제의 해결책 제시, 점진적 진화
기계학습 훈련 데이터로부터 학습하여 결과 예측
회귀분석 두 변인 간 관계를 파악할 때 사용
감정분석 특정 주제에 대한 저자의 감정 분석
소셜네트워크분석(사회관계망분석) 특정인과의 관계도를 통해 파악

 


4. 위기 요인과 통제 방안

. 빅데이터의 문제점

- 사생활 침해

- 데이터 오용

- 책임 원리의 훼손

 

. 빅데이터 문제의 해결 방안

1) 사생활 침해의 해결방안

- 익명화 기술의 발전

- 개인정보 사용자의 책임 강조

2) 데이터 오용의 해결방안

- 데이터 오용 피해자를 대변할 전문가로 알고리즈미스트 필요

- 알고리즘에 대한 접근권을 제공하여 부당함을 구제할 방안 제시

3) 책임 원리의 훼손

- 기존의 원칙을 보강하거나 강화

- 예측 자료에 의한 불이익을 최소화할 장치나 제도 마련

728x90