#Archive
05. 자동차 평가 데이터
Gom Guard
2017. 12. 3. 10:30
반응형
데이터명
Car Evaluation Data Set
자동차 평가 데이터 셋
레코드수
1728 개
컬럼개수
7개 (분류 class 1개, 속성 attributes 6개)
데이터 설명
- 이 데이터 셋은 1997년에 Marco Bohanec 이 UCI dataset 저장소에 제공한 데이터 입니다.
- 나이브베이즈, 의사결정트리 등의 분류 알고리즘에 예제로 많이 사용되는 데이터 입니다.
컬럼 설명
- 데이터의 이해를 돕기 위해 포함된 7개의 변수에 대한 간략한 설명입니다.
- Class 는 Unacc, Acc, Good, Vgood 으로 총 4개로 나누어져 있으며 각각 문제 많음, 그럭저럭, 좋음, 매우좋음을 뜻합니다.
- Attibute 속성은 Buying, Maintenance, Doors, Persons, Luggage Boot, Safety 로 총 6개로 구성되어 있습니다. 각각 설명하자면,
- Buying 는 Buying Price 로 구매가격을 의미합니다. vhigh, high, med, low 로 4개로 구별됩니다.
- Maintenance 는 Price of the Maintenance 로 유지비용을 말합니다. 이 또한 vhigh, high, med, low 4개로 구별됩니다.
- Doors 는 Number of Doors 로 차문의 개수를 뜻하며 숫자로 표현됩니다.
- Persons 는 Capacity in terms of persons to carry 를 의미하며 차량 탑승인원을 말합니다. 이 또한 숫자로 표현됩니다.
- Luggage Boot 는 The Size of Luggage Boot 로 짐칸의 크기를 말합니다. 이는 small, med, big 총 3개로 구별됩니다.
- Safety 는 Estimated Safety of The Car 의 준말이며 차량의 안전한 정도를 의미합니다. 이는 low, med, high 총 3개로 구별됩니다.
반응형