본문 바로가기
728x90
반응형

sklearn2

[Python Data Analytics] Python을 활용한 Machine Learning 안녕하세요. 바른 호랑이입니다.이번 게시글에서는 실제 데이터들과 Python을 활용하여 다양한 Machine Learning 실습을 진행해볼 예정입니다.결국 데이터를 잘 가공하고 전처리하는 과정을 통해 얻어내고자 하는 것은 그 데이터 속의 패턴을 분석하여 결과를 예측함으로써 보다 더 나은 판단을 하기 위함입니다. 이와 같은 예측을 보다 편리하게 할 수 있게 Python은 여러가지 ML(Machine Learning)패키지들을 제공하고 있으며, 이를 활용하여 보다 편리하게 패턴을 파악하고 결과를 예측할 수 있습니다. ML에는 크게 지도학습, 비지도학습으로 분류할 수 있으며, 이번에는 이와 같은 학술적이고 이론적인 부분들을 다루기 보다는 실제로 그와 같은 모델들을 어떤 식으로 사용하고 코딩해야하는지에 .. 2023. 6. 23.
[Python Data Analytics] Python을 활용한 데이터 전처리(1) 안녕하세요. 바른 호랑이입니다. 이번 게시글에서는 Python을 활용한 데이터 전처리 방법에 대해 알아볼 예정입니다. 데이터 분석이라고 하면 많은 사람들이 AI, 머신러닝, 딥러닝과 같은 부분들을 먼저 떠올리지만 데이터 분석의 대부분의 업무는 그와 같은 모델들보다는 로우 데이터들을 얼마나 잘 가공하는가에 집중되어 있다고 해도 과언이 아니라고할 수 있습니다. 이와 같은 데이터 전처리를 지원하기 위해 Python에서는 Pandas, sklearn과 같은 다양한 패키지들이 작성되어있어 참고하기 쉽고, 이를 통해 데이터 전처리과정을 보다 원활하게 진행할 수 있습니다. 데이터 전처리라고 지칭되기는 하나 그 범위가 상당히 넓기 때문에 이번에는 가장 기본적인 부분인 누락, 중복 데이터 처리, 데이터 표준화 등과 같은.. 2023. 6. 19.
728x90
반응형