본문 바로가기

공부/Data Analysis4

[python/ML] typeerror: '>' not supported between instances of 'nonetype' and 'int' 오류 / 최종 모델 불러오기 오류 / MAC, WINDOWS 협업 문제점 1. 문제typeerror: '>' not supported between instances of 'nonetype' and 'int' 오류 발생세미 프로젝트 진행 중 최종 모델을 pkl 파일로 load해서, streamlit 앱 내에서 작동시키는 작업을 진행하고 있었습니다. 모든 작업을 올바르게 했는데, predict를 실행시키면 위와 같은 오류가 발생하더라고요.코드는 다음과 같았습니다.import streamlit as stimport joblibimport numpy as npimport pandas as pd# 모델 불러오기model1 = joblib.load("models/gm_model.pkl")model2 = joblib.load("models/ngm_model.pkl")# 데이터 프레임 불.. 2023. 9. 25.
[python/visualization] Streamlit을 활용한 데이터 시각화 1 0. 머리말streamlit은 python 코드를 기반으로 웹에 시각화 구현 가능HTML, CSS를 따로 학습하지 않아도 편리하지만, 알고 있다면 더욱 자세한 내용을 입력가능But, 기능이 제한적이라 프로토타입 형식으로 제작하여 소통에 도움을 주는 정도가 한계인듯 함.자세한 내용은 streamlit docs 참고(https://docs.streamlit.io/)아래 내용은 streamlit docs와 유튜브 '테디노트'님의 Streamlit 강의를 참고하였습니다.Streamlit 관련 정보나 한국어 강의가 거의 없는데 제공해주시는 테디노트님 감사합니다.다음 글에서는 세미 프로젝트에 Streamlit을 활용한 시각화 대시보드 포스팅 예정1. Textimport streamlit as stst.title('.. 2023. 9. 21.
[Python/ML] Category Feature의 Encoding 방법 0. Category Feature란?Category Feature라고 하면 익숙하지 않을 수 있겠지만, 범주형 변수라고 하면 익숙하다. 범주형 변수란 고유한 값이나 범주의 수가 제한된 변수로써, 명목형 변수와 순서형 변수등이 이에 속한다.범주형 변수 예시Category = ['사과', '바나나', '귤'] num = [3, 5, 6] df = pd.DataFrame({'Category' : Category, 'num' : num}) df범주형 변수는 숫자의 의미가 아니라 고유한 값을 뜻하기 때문에 컴퓨터는 그 고유한 특성을 이해하지 못한다. 따라서, 컴퓨터가 이해할 수 있도록 인코딩 해주어야 하는데 인코딩 방법에는 다음과 같은 것들이 있다.One-Hot EncodingLabel EncodingTarge.. 2023. 9. 13.
[Python/crawling]BeautifulSoap를 활용한 크롤링 정리 0. 내가 요약한 프로세스지난 며칠 간 BeautifulSoap를 통한 정적 웹페이지 크롤링에 대해 실습했다. 아래 내용은 크롤링 과정 정리와 함수 사용법에 대한 간단한 요약이다.실습 자료https://seongwonds.notion.site/8-4-beautifulsoup-2-8-10-e6fdd4ef0b9046f79d86c7ec431fbc3e?pvs=4https://seongwonds.notion.site/8-4-beautifulsoup-2-8-10-e6fdd4ef0b9046f79d86c7ec431fbc3e?pvs=4크롤링 프로세스 요약1. HTML 호출 : requests.get(url, headers)library : requestsurl에는 크롤링하고 싶은 페이지의 주소headers : 대게 크롤.. 2023. 8. 10.