티스토리 뷰

#Archive

07. 독버섯 데이터

Gom Guard 2018. 1. 19. 17:36
반응형

데이터명

  • Mushroom Data Set

  • 독버섯 분류 데이터 셋

레코드수

  • 8124 개

컬럼개수

  • 23개 (분류 class 1개, 속성 attributes 22개)

데이터 설명

  • 이 데이터는 8,124종류 버섯의 특징과 독성 여부가 적혀있는 데이터 셋입니다.
  • 나이브베이즈, 의사결정트리 등의 분류 알고리즘에 예제로 많이 사용되는 데이터 입니다.

컬럼 설명

  • 데이터의 이해를 돕기 위해 포함된 23개의 변수에 대한 간략한 설명입니다.  
    • 1열은 독성 분류로 p, e 총 2개로 나누어져 있으며 독있을 경우poisonous, 식용일 경우 edible 로 표기합니다.
    • Attibute 속성은 총 22개로 구성되어 있습니다. 각각 설명하자면,
      • Buying 는 Buying Price 로 구매가격을 의미합니다. vhigh, high, med, low 로 4개로 구별됩니다.
      • Maintenance 는 Price of the Maintenance 로 유지비용을 말합니다. 이 또한 vhigh, high, med, low 4개로 구별됩니다.
      • Doors 는 Number of Doors 로 차문의 개수를 뜻하며 숫자로 표현됩니다.
      • Persons 는 Capacity in terms of persons to carry 를 의미하며 차량 탑승인원을 말합니다. 이 또한 숫자로 표현됩니다.
      • Luggage Boot 는 The Size of Luggage Boot 로 짐칸의 크기를 말합니다. 이는 small, med, big 총 3개로 구별됩니다.
      • Safety 는 Estimated Safety of The Car 의 준말이며 차량의 안전한 정도를 의미합니다. 이는 low, med, high 총 3개로 구별됩니다.


반응형
댓글
반응형
공지사항
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday
링크
«   2024/04   »
1 2 3 4 5 6
7 8 9 10 11 12 13
14 15 16 17 18 19 20
21 22 23 24 25 26 27
28 29 30
글 보관함