열 머리글은 해석에 대한 설명 변수 이름으로 적합하도록 선택되었습니다. 1주차에 PRICE_12PK의 가격은 12팩에서 구매할 때 맥주 24캔이 $19.98(즉, 12팩 한 팩의 가격은 $9.99)이며, CASE_12PK의 경우 223.5의 값은 447 개의 12팩이 판매되었기 때문에 (2개의 경우)를 의미합니다(2개의 경우 12 팩). 회귀 분석을 수행하려면 하나 또는 여러 개의 독립 변수의 영향을 받고 있다고 가설하는 종속 변수를 정의해야 합니다. 분류 및 회귀 트리 프로시저는 데이터에서 관찰을 예측하는 기계 학습 프로세스를 구현합니다. 그것은 2 개의 형태의 모델을 만듭니다: 선형 회귀 분석은 여섯 가지 기본 가정을 기반으로: Minitab에서 회귀 도구 모음에서 몇 번의 클릭만 소요 하 고 통계 메뉴를 통해 액세스. OLS가 데이터에 적합하다고 가정할 때 누락된 값의 한 가지 어려움은 해당 값을 처리하는 데 사용할 수 있는 대체 분석이 없다는 것입니다. OLS가 데이터에 적합한 경우 문제가 없는 값이 있더라도 거의 문제가 없습니다. 그러나 이러한 관측값을 사용할 수 있도록 누락된 값을 추정하는 방법이 있습니다. 이 프로세스는 누락된 값이 임의로 발생하지 않는 경우 특히 유용합니다(위에서 설명한 대로). 어떤 소프트웨어를 사용하고 있는지 는 알 수 없지만 SPSS에는 누락 된 값을 대치하는 데 특히 좋은 방법이 있습니다. 누락된 값이 데이터 집합에 문제가 있다고 생각되면 누락된 값을 추정하는 방법을 조사한 다음 OLS를 사용해야 합니다.

첫째, 데이터 분석가에게 판매에 영향을 미치는 영향을 파악하라고 말하지 마십시오. Redman은 “대부분의 분석이 진행되는 방식은 관리자가 자신이 찾고 있는 것에 초점을 좁히지 않았다는 것입니다. 영향을 미치고 있다고 의심되는 요인을 파악하고 분석가에게 이를 확인하도록 요청하는 것이 사용자의 임무입니다. “데이터 과학자에게 낚시 탐험에 가거나 모르는 것을 말하라고 말한다면, 당신은 당신이 얻는 것을 받을 자격이 있으며, 이는 나쁜 분석입니다. 즉, 분석가에게 한 번에 모든 변수를 살펴보도록 요청하지 마십시오.