전체 글 91

[Python ML]서포트 벡터 머신(SVM)_SVC/SVR, 나이브 베이즈(Naive Bayes)_GaussianNB/BayesianRidge

* 서포트 벡터 머신(SVM; Support Vector Machine) - '초평면을 활용한 분류모형' - 데이터를 선형으로 분리하는 최적의 선형 결정 경계를 찾는 알고리즘. 알고리즘의 목표는 클래스가 다른 데이터들을 '가장 큰 마진(margin)'으로 분리해내는 선 또는 면(=초평면)을 찾아내는 것 - 마진(margin): 두 데이터 군과 결정 경계가 떨어져있는 정도 - 대부분의 데이터는 이상적으로 분리되어 있지 않음. 많은경우 이상치(outlier)들이 관측됨. - 이런 경우 데이터를 선형적으로 완벽하게 분리하는 것은 불가능함. 이를 해결하기 위해 약간의 오류를 허용하는 파라미터 = 'C' (cost) - 낮은 C값: 데이터샘플이 다른 클래스에 놓이는 것을 많이 허용 (일반적인 결정경계 찾아냄) ➡..

[Python ML]K-최근접이웃(K-NN), 의사결정나무(Decision Tree)

* K-최근접 이웃(K-NN; K-Nearest Neighbor) - 가장 근접하게 있는 데이터 종류에 따라서 해당 데이터의 종류를 정해주는 알고리즘 (유유상종) - 판별하고 싶은 데이터와 인접한 k개의 데이터를 찾아, 해당 데이터의 라벨이 다수인 범주로 데이터를 분류하는 방식 - k는 '홀수'로 하는것이 좋음. 짝수일 경우 동점 상황이 만들어져 분류할 수 없는 경우가 발생할 수 있기 때문 * K-NN 코딩하기 1) KNeighbors Classifier(분류형) - 순서: 데이터 분할 - 데이터 표준화 - 데이터 밸런싱 - 모델 생성 - 모델 적용 - 결과값 도출 - X는 이산형 변수만 가지고 있기 때문에, StandardScaler()만 적용 - 오버샘플링 SMOTE 적용 - knn 분류모델 생성: ..

[마케팅 뉴스 스크랩]#4. 너 왜 자꾸 혼자서 하겠다는 거야, 애플🍎

칼럼 원본: https://stibee.com/api/v1.0/emails/share/oQeEQjJ0N2np88joCxSnyHlWvJbqOJU= 너 왜 자꾸 혼자서 하겠다는 거야?🍎 #디스플레이 #마이크로LED #닥터코퍼 stibee.com * 애플, 디스플레이 '자체 설계' - 2025년부터 애플워치 울트라에 '차세대 디스플레이' 탑재, 향후 아이폰과 아이패드 등 적용 대상 확대 - 차세대 디스플레이? '마이크로 LED', 기존 디스플레이보다 훨씬 선명하고 수명은 길지만 전력 소모는 적음 - 애플, 그동안은 다른 회사가 만든 디스플레이 부품 탑재(아이폰14: 70% = 삼성 디스플레이 부품, 20% = LG) ➡️의존도가 높았음 - 삼성 디스플레이의 전체 매출액 21%, LG디스플레이 매출 3~40% ..

[Python ML]분류모델평가_오분류표, ROC커브 & 로지스틱 회귀분석(Logistic, Multinomial Logistic Regression Analysis)

* 분류모델 평가 1) 오분류표 - Accuracy(정확도) = TP + TN / TP + FN + FP + TN => 분자가 모두 T - Error Rate(오분류율) = FP + FN / TP + FN + FP + TN (1 – Accuracy) => 분자가 모두 F - Sensitivity(민감도) & Recall(재현율) = TP / P => 두개의 식이 같음 - Specificity(특이도) = TN / N => sensitivity의 반대편 - Precision(정밀도) = TP / TP + FP => 모두 P에 관한 것 - F1 score = 2 * precision * recall / precision + recall => 더하기가 아래로(분모로) 간다라고 생각 *accuracy, F1 s..

[마케팅 뉴스 스크랩]#3. 우리카드, 고객 니즈 반영... 초 개인화 마케팅 통합/KB국민카드, 인공지능 타깃 마케팅 시스템 'AIMS'

뉴스 원본: http://www.lcnews.co.kr/news/articleView.html?idxno=43002 우리카드, 고객 니즈 반영…‘초개인화 마케팅 통합플랫폼’ 완성 - 라이센스뉴스 라이센스뉴스 = 임이랑 기자 | 우리카드가 고객의 니즈를 빠르고 정확하게 충족시키기 위해 머신러닝과 인공지능(AI)를 기반으로 고객 관리 체계를 전면개편했다.우리카드는 고객 맞춤 서비스 www.lcnews.co.kr 뉴스 원본: https://www.newsworks.co.kr/news/articleView.html?idxno=702890 KB국민카드, 인공지능 타깃 마케팅 시스템 'AIMS' 가동 - 뉴스웍스 [뉴스웍스=이한익 기자] KB국민카드가 차별화된 고객 경험을 제공하기 위한 인공지능(AI) 마케팅 시스..

[Python ML]규제기법(Regularization)_릿지(Ridge), 라쏘(Lasso), 엘라스틱 넷(Elastic-Net)

* 규제(Regularization)란? : 우리 말로 정규화라고도 불린다. 독립변수의 수가 지나치게 많거나 변수간 다중공산성이 크다고 여겨질 때, 회귀 모델의 적합 성능을 향상시키기 위해 변수 선택이나 차원 축소 등의 방법을 사용할 수 있는데, 여기서 한 가지 더 선택할 수 있는 옵션이 바로 규제(Regularization)방법이다. 이 방법은 회귀계수를 구할 때, 회귀 계수의 크기에 제약을 두어 설명력이 낮은 독립변수에 대한 가중치를 줄인다. (설명 출처: https://velog.io/@cleansky/%EC%9D%B8%EC%82%AC%EC%9D%B4%EB%93%9C-%EB%A8%B8%EC%8B%A0%EB%9F%AC%EB%8B%9D-%EB%8C%80%ED%91%9C%EC%A0%81%EC%9D%B8-..

[Python Data Analysis]선형 회귀분석을 통해 'BMI지수'에 영향을 주는 요소 알아보기

1) 필요 패키지 불러오기 - pandas, train_test_split(데이터 분할) 2) 데이터 불러오고 결측값 제거 - dropna()는 전체 데이터에 적용하기 (X, Y 따로따로 했다가 행 수가 안맞아서 error가 계속 났다..) - isnull.sum(): 결측값 제거 확인하기 3) 데이터 분할, 통계기반 변수선택 4) Y에 로그 적용 5) 데이터 분할, 데이터 표준화 - 변수선택에서 연속형 데이터를 가진 변수만 도출되었기 때문에, StandardScaler()적용 6) 선형 회귀분석 - LinearRegression() - R2 = 0.843 (모델이 평균의 84%정도의 정확도로 설명하고 있다. ) - RMSE= 0.014 (실제값과 예측된 y의 오차가 0.014이다. ) 7) 실제값과 예..

[마케팅 뉴스 스크랩]#2. 고객 보상 줄이고 다른 업체와 손잡고…침체 맞서는 마케팅 전략

뉴스 원본: https://www.hankyung.com/economy/article/202301165012i 고객 보상 줄이고 다른 업체와 손잡고…침체 맞서는 마케팅 전략 고객 보상 줄이고 다른 업체와 손잡고…침체 맞서는 마케팅 전략, 수익성 개선하려 고객 보상체계 재설계 반발 심해도 2~3개월이면 잦아들어 협업 마케팅으로 비용 줄이며 점유율 확대 www.hankyung.com - 침체기 맞서는 마케팅 전략: 고객 보상체계 재설계, 협업 마케팅 1) 수익성 개선을 위한 고객 보상체계 재설계 * Best Buy - 일반 고객 대상 보상(리워드)프로그램 축소 - 멤버십 가입한 소비자에게만 배송비 무료 - 마케팅 비용 줄여 배송으로 늘어난 비용 완화 - '유료 회원제' 도입하려는 움직임으로 볼 수 있음 (충..

[마케팅 뉴스 스크랩]#1. "원가절감 타령 그만"…스마트폰 전략 多 뜯어고친 삼성

뉴스 원본: https://www.hankyung.com/it/article/2022121591901 [단독] "원가절감 타령 그만"…스마트폰 전략 多 뜯어고친 삼성 [단독] "원가절감 타령 그만"…스마트폰 전략 多 뜯어고친 삼성, 갤럭시의 절치부심 "애플에 더 밀리면 미래 없다" AP솔루션개발팀 신설해 갤럭시 특화된 반도체 적용 갤Z 등 폴더블폰 대중화에 www.hankyung.com - 2010년 중반 이후 삼성전자의 스마트폰 전략은 '원가 절감'을 통한 수익성 확보 였음. (ex. 갤럭시A 시리즈 -> 신흥국 시장 공략) - 샤오미, 오보, 비보 등이 하드웨어 측면에서 빠르게 따라오면서 삼성전자만의 마케팅 포인트가 많이 약화됨. - 현재 삼성이 스마트폰의 경쟁력을 강화하는 방안: '고객 경험 극대화..

[Python ML]선형 회귀분석(Linear Regression Analysis)

* 선형 회귀 분석 - 종속변수 Y와 한 개 이상의 독립변수 X와의 선형 상관관계를 모델링하는 회귀분석기법 - 가정: 선형성, 등분산성, 독립성, 비상관성, 정상성(정규성) - 독립변수의 갯수에 따라 1개일 경우 '단순 선형 회귀', 2개 이상일 경우 '다중 선형 회귀'로 나누어짐 (1) 단순 선형 회귀 (2) 다중 선형 회귀 - 회귀 모델 주요 평가지표 1) MSE(평균 제곱 오차) : 실제 값과 예측 값의 차이를 제곱해 평균한 것 : from sklearn.metrics import mean_squared_error 2) MAE(평균 절대 오차) : 실제 값과 예측 값의 차이를 절댓값으로 변환해 평균한 것 : from sklearn.metrics import mean_absolute_error 3) ..

728x90
반응형