안녕하세요. 방디입니다.
지난 글에서는 데이터분석준전문가의 첫번째 학습자료로 1과목 데이터 이해 - [데이터의 이해]를 다루었습니다.
오늘은 이어서 같은 1과목의 [데이터의 가치와 이해] 부분을 소개하겠습니다.
감사합니다.
※ 제가 안내드리는 내용은 시험주관처에서 안내하는 시험과목 순서를 따르지만, 일부 중요도가 낮은 부분은 다루지 않습니다.
데이터 이해
데이터의 가치와 미래
1. 빅데이터의 이해
가. 빅데이터의 정의
- 더그 래니(Doug Laney)의 3V: Volume(양), Variety(다양성), Velocity(속도)
- 최근 4V의 개념으로 추가되는 개념: Value(가치), Visualization(시각화), Veracity(정확성)
- 3V라는 협의의 정의에서 인재, 조직 변화까지 포함하는 광의의 정의로 점차 확대
나. 빅데이터의 기대과 비유
- 산업혁명의 석탄과 철: 서비스 분야의 생산성 향상을 통하여 사회, 경제, 문화, 생활 전반의 혁명적 변화 기대
- 21세기 원유: 산업 전반의 생산성 향상과 함께 새로운 산업 창조
- 렌즈: 생물학 발전에 대한 현미경의 영향처럼 데이터가 산업 발전에 큰 영향을 미침
- 플랫폼: 공동 활용 목적으로 구축된 유무형의 구조물로서 플랫폼 역할 기대
다. 빅데이터로 인한 변화
과거 | 현재 |
사전처리 | 사후처리 |
표본조사 | 전수조사 |
질(Quality) | 양(Quantity) |
인과관계 | 상관관계 |
2. 빅데이터의 가치와 영향
가. 빅데이터 가치 산정의 어려움
- 데이터의 재사용이나 재조합 등의 활용방식이 일반화되면서 가치 산정이 어려움
- 빅데이터는 기존에 없던 새로운 가치를 창출하기에 가치 측정이 어려움
- 새로이 등장하는 분석 기술로 과거 가치가 없던 데이터도 새로운 가치를 찾아낼 수 있음
나. 빅데이터의 영향
- 기업: 소비자 행동분석이나 시장변동 예측을 통해 비즈니스 모델을 발전
- 정부: 기상, 인구이동 등 데이터를 수집하여 사회변화를 추정
- 개인: 데이터 분석 비용의 하락으로 개인이 목적에 따라 자유로이 빅데이터를 활용
3. 비즈니스 모델
가. 빅데이터 활용 기본 테크닉
테크닉 | 내용 |
연관규칙학습 | 변인들 간 주목할 만한 상관관계를 찾는 방법 |
유형분석 | 대상의 특성에 따라 분류 |
유전자 알고리즘 | 최적화가 필요한 문제의 해결책 제시, 점진적 진화 |
기계학습 | 훈련 데이터로부터 학습하여 결과 예측 |
회귀분석 | 두 변인 간 관계를 파악할 때 사용 |
감정분석 | 특정 주제에 대한 저자의 감정 분석 |
소셜네트워크분석(사회관계망분석) | 특정인과의 관계도를 통해 파악 |
4. 위기 요인과 통제 방안
가. 빅데이터의 문제점
- 사생활 침해
- 데이터 오용
- 책임 원리의 훼손
나. 빅데이터 문제의 해결 방안
1) 사생활 침해의 해결방안
- 익명화 기술의 발전
- 개인정보 사용자의 책임 강조
2) 데이터 오용의 해결방안
- 데이터 오용 피해자를 대변할 전문가로 알고리즈미스트 필요
- 알고리즘에 대한 접근권을 제공하여 부당함을 구제할 방안 제시
3) 책임 원리의 훼손
- 기존의 원칙을 보강하거나 강화
- 예측 자료에 의한 불이익을 최소화할 장치나 제도 마련
'자격증 > 데이터분석준전문가(ADSP)' 카테고리의 다른 글
[방디] 데이터분석준전문가(ADSP) - 데이터분석 기획(2과목) - 데이터분석 기획의 이해 (0) | 2021.03.22 |
---|---|
[방디] 데이터분석준전문가(ADSP) - 데이터 이해(1과목) - 가치 창조를 위한 데이터 사이언스와 전략 인사이트 (0) | 2021.03.16 |
[방디] 데이터분석준전문가(ADSP) - 데이터 이해(1과목) - 데이터의 이해 (0) | 2021.03.12 |
[방디] 데이터분석준전문가(ADSP) 기본사항, 출제기준, 2021년 시험일정 안내 (0) | 2021.02.18 |