파라메트릭의 의미와 개념에 대해 알아봅시다.
파라메트릭의 의미와 개념을 이해합니다.
파라메트릭 수단 기계 학습통계학 분야에서는 모집단 데이터가 특정한 분포를 따른다고 가정하고, 데이터의 양에 관계없이 학습을 통해 결정해야 할 매개변수의 종류와 개수를 명확하게 결정하여 학습을 수행하는 방법을 말한다. 파라메트릭(Parametric)은 데이터 모델의 형태를 미리 결정하고, 전송되는 매개변수의 종류와 개수에 따라 학습을 통해 개발하는 기술이다. 비모수적이란 모집단 데이터가 특정 분포를 명확하게 따르는 것으로 간주할 수 없는 경우입니다. 이는 사용할 수 있는 방법입니다. 비모수적(Non-Parametric)이란 머신러닝을 통해 튜닝해야 할 매개변수의 종류와 개수가 결정되지 않은 상황에서 훈련 데이터를 학습해 매개변수를 결정하는 기법이다. 비모수적(Non-parametric)은 매개변수 수가 적고 매개변수 분포가 적은 데이터 모델입니다. 정의하지 않는 통계적 방법이다. 매개변수 수가 적은 대표적인 모델로는 정규분포(Normal Distribution) 또는 선형회귀모델(Linear Regression Model)이 있습니다. 비모수학에서는 매개변수의 수와 성격이 학습을 통해 변경되거나 발전할 수 있으며 미리 정의되거나 고정된 값이 아닙니다. 파라메트릭에는 고정된 수의 매개변수가 있습니다. 반면, 비모수적 경우에는 학습 데이터의 양에 따라 매개변수의 개수가 변경되거나 증가할 수 있습니다. 매개변수는 데이터 모델 내부에 있으며 함수로부터 데이터 값을 추정할 수 있습니다. 변수라는 뜻이다. 매개변수는 예측을 수행하는 모델, 특정 문제를 해결하는 모델, 데이터를 추정하거나 학습하는 모델에 필요합니다. 매개변수는 머신러닝 알고리즘의 가장 핵심적인 요소입니다.
파라메트릭 의미 및 개념 설명
모수적이란 모집단이 어떤 확률 분포를 따르는지 미리 알 때 사용할 수 있는 기술을 말합니다. 파라메트릭은 분포를 미리 가정할 수 있기 때문에 검출력을 높입니다. 예를 들어, 데이터가 정규 분포를 따르는 경우 평균과 표준 편차를 알면 분포를 식별할 수 있습니다. 파라메트릭은 데이터가 구체적인 모델입니다. 모델이 따르는 것을 가정하고 모델이 가지고 있는 고정된 개수의 매개변수를 학습하여 조정됩니다. 비모수적 기법은 모집단이 어떤 확률 분포를 따르는지 미리 알 수 없을 때 사용할 수 있는 기법입니다. 비모수적(Non-parametric)은 데이터가 특정 매개변수에 종속된다고 가정하지 않으며, 학습을 통해 조정하려는 매개변수를 명확하게 정의하거나 계산할 수 없는 경우에 사용됩니다. 실제 데이터 분석 문제에서는 모집단이 어떤 분포를 따르는지 아는 것이 불가능합니다. 인구자료의 분포에 대한 추정이 없는 경우가 많기 때문에 분포의 형태와 무관한 별도의 방법이 필요하며, 이러한 경우에 사용할 수 있는 방법이 비모수적이다. 비모수적으로 만들기 위해서는 표본을 크기순으로 변경하여 얻은 순서통계량을 이용한다. 비모수적 추정 방법에는 중앙값 추정, 허용 한계 추정, 모집단 분포 구간 추정이 포함됩니다. 그리고 비모수 검증 방법에는 두 분포함수가 동일한지 여부를 테스트할 수 있는 부호 테스트(Sign Test)와 소프트 테스트(Soft Test) 방법이 있습니다.[파라메트릭과 논파라메트릭]
파라메트릭은 학습해야 할 데이터 분석 모델이 명확하게 정의되어 있기 때문에 매우 빠르고 이해하기 쉽다는 장점이 있습니다. 그러나 인구 데이터는 특정 분포를 따른다고 가정해야 하기 때문에 유연성이 부족하고 단순한 문제를 해결하는 데에만 적합한 경우가 많습니다. 비모수적에서는 모집단 데이터가 특정 분포를 따른다고 가정하지 않습니다. 유연성이 높다는 장점이 있습니다. 그러나 내용이 명확하게 정의되지 않아 속도가 느리고, 더 많은 데이터가 필요할 수 있으며, 데이터 모델이 왜 그런 형태인지 구체적이고 명확하게 설명하기 어렵다는 단점이 있다.[파라메트릭의 종류]