파이썬 분류 예제

교육 데이터부터 시작합니다. 이 예제에서는 벡터 집합 (높이, 무게, 신발 크기)과이 벡터가 속한 클래스가 있습니다 : 파이썬을위한 가장 잘 문서화 된 기계 학습 libaries 중 하나 인 파이썬 모듈 Scikit-learn을 설치하여 시작해 봅시다. 이 자습서에서는 파이썬용 기계 학습 도구인 Scikit-learn을 사용하여 파이썬에서 간단한 기계 학습 알고리즘을 구현합니다. 유방암 종양 정보의 데이비데이브 베이즈(NB) 분류기를 사용하여 종양이 악성인지 양성인지 여부를 예측합니다. 로그 손실 또는 LogLoss는 기본적으로 분류자가 예측에 대해 얼마나 확신하는지 평가합니다. LogLoss는 지정된 클래스에서 예제의 구성원 자격에 대한 확률을 반환하여 분류자의 일반적인 신뢰도를 나타내기 위해 함께 합산합니다. Python 파일과 동일한 디렉토리에 데이터 파일을 넣기만 하면 됩니다. 팬더 라이브러리는 데이터를 쉽게 로드할 수 있는 방법, read_csv(): 이 데이터 집합의 간단한 예제는 원래 문제에서 시작하여 scikit-learn에서 소비하기 위한 데이터를 형성하는 방법을 보여 줍니다. 다중 클래스 분류에서는 학습 데이터를 사용하여 분류자 학습을 학습하고 이 분류기에서 새 예제를 분류합니다. 모델을 학습하는 프로세스는 데이터를 신경망에 공급하고 데이터의 패턴을 학습하도록 하는 프로세스입니다.

학습 프로세스는 데이터를 가져와 데이터 집합의 기능을 가져옵니다. 감독된 분류 작업에 대한 교육 프로세스 중에 네트워크는 교육 데이터의 기능과 레이블을 모두 전달합니다. 그러나 테스트 하는 동안 네트워크는 공급 된 기능만 있습니다. 이 자습서가 끝나면 Python에서 자체 기계 학습 모델을 빌드하는 방법을 알 수 있습니다. KNN (k-가장 가까운 이웃) 분류기 – KNN 또는 k-가장 가까운 이웃은 가장 간단한 분류 알고리즘입니다. 이 분류 알고리즘은 데이터의 구조에 의존하지 않습니다. 새 예제가 발생할 때마다 학습 데이터에서 가장 가까운 k 이웃을 검사합니다. 두 예 사이의 거리는 그들의 특징 벡터 들 사이의 유양핵거리일 수 있다. 가장 가까운 k 이웃 중 대부분의 클래스는 발생 한 예제에 대 한 클래스로 이동 합니다. 회귀 대상은 float64로 캐스팅되고 분류 대상은 유지됩니다: Naive Bayes 분류자는 예제가 일부 클래스에 속할 확률을 결정하고 일부 입력 이벤트가 있는 경우 이벤트가 발생할 확률을 계산합니다.

발생 했습니다. Jupyter에서 ML 자습서라는 새 파이썬 노트북을 만듭니다. 노트북의 첫 번째 셀에서 sklearn 모듈 가져오기: 위의 코드 조각에서 볼 수 있듯이 dtype 메서드를 사용 하 여 해당 데이터 형식과 함께 Dataframe에서 사용할 수 있는 다른 열을 나열할 수 있습니다. 예를 들어 Supply 하위 그룹 열은 개체 데이터 형식이고 `수익별 클라이언트 크기` 열은 정수 데이터 형식임을 알 수 있습니다. 이제 정수에 정수가 있는 열과 문자열 데이터가 있는 열에 대해 알아요. 반대로, 자율 학습은 네트워크에 공급되는 데이터의 레이블이 지정되지 않은 위치이며 네트워크는 가장 중요한 기능을 자체적으로 학습해야 합니다. 언급했듯이 분류는 감독 된 학습의 유형이므로이 기사에서는 감독되지 않은 학습 방법을 다루지 않습니다. 의사 결정 트리 분류기 – 의사 결정 트리 분류기는 다중 클래스 분류에 대한 체계적인 접근 방식입니다.