데이터 과학은 데이터를 만들고, 만들어진 데이터를 이용하는 일을 합니다.
데이터 공학은 데이터를 다루는 도구를 만들고, 도구를 관리하는 일을 합니다.
표 : 데이터들의 모임. (데이터 셋)
표 속에 구속된 데이터에서 의미있는 정보를 뽑아낼 수 있어야 합니다.
o 행(row)
- 개체(instance)
- 관측치(observed value)
- 기록(record)
- 사례(example)
- 경우(case)
o 열(column)
- 특성(feature)
- 속성(attribute)
- 변수(variable)
- field
독립변수(원인이 되는 열)
원인은 결과에 영향을 안 받음.
종속변수(결과가 되는 열)
원인에 영향을 받음
상관관계
한쪽의 값이 바뀌었을 때, 다른 쪽의 값도 바뀐다
인과관계
각 열이 원인과 결과의 관계일 때 (즉, 독립변수와 종속변수의 관계)
즉, 모든 인과관계는 상관관계입니다.
하지만, 모든 상관관계가 인과관계인 것은 아닙니다.
'딥러닝' 카테고리의 다른 글
1. 기계학습-6일차(생활코딩) (0) | 2022.06.07 |
---|---|
1. 기계학습-5일차(생활코딩) (0) | 2022.06.07 |
1. 기계학습-4일차(생활코딩) (0) | 2022.06.07 |
1. 기계학습-2일차(생활코딩) (0) | 2022.06.07 |
1. 기계학습-1일차(생활코딩) (0) | 2022.06.07 |