본문 바로가기
728x90
반응형

pandas7

[Python Data Analytics] Python을 활용한 Machine Learning 안녕하세요. 바른 호랑이입니다.이번 게시글에서는 실제 데이터들과 Python을 활용하여 다양한 Machine Learning 실습을 진행해볼 예정입니다.결국 데이터를 잘 가공하고 전처리하는 과정을 통해 얻어내고자 하는 것은 그 데이터 속의 패턴을 분석하여 결과를 예측함으로써 보다 더 나은 판단을 하기 위함입니다. 이와 같은 예측을 보다 편리하게 할 수 있게 Python은 여러가지 ML(Machine Learning)패키지들을 제공하고 있으며, 이를 활용하여 보다 편리하게 패턴을 파악하고 결과를 예측할 수 있습니다. ML에는 크게 지도학습, 비지도학습으로 분류할 수 있으며, 이번에는 이와 같은 학술적이고 이론적인 부분들을 다루기 보다는 실제로 그와 같은 모델들을 어떤 식으로 사용하고 코딩해야하는지에 .. 2023. 6. 23.
[Python Data Analytics] Python을 활용한 데이터 전처리(2) ※ Python을 활용한 데이터 전처리 [Python Data Analytics] Python을 활용한 데이터 전처리(1) 안녕하세요. 바른 호랑이입니다. 이번 게시글에서는 Python을 활용한 데이터 전처리 방법에 대해 알아볼 예정입니다. 데이터 분석이라고 하면 많은 사람들이 AI, 머신러닝, 딥러닝과 같은 부분들 data-is-power.tistory.com 안녕하세요. 바른 호랑이입니다. 이번 게시글에서는 저번 게시글에 이어서 Python을 활용한 데이터 전처리 방법에 대해 알아볼 예정입니다. 이전 게시글에서 누락, 중복 데이터 처리 및 데이터 표준화에 대해서 알아본 것에 이어서 함수적용방법, 열 순서변경 및 분리방법, 값 필터링 방법, 데이터프레임 병합 , 조인, 분리, 그룹핑 방법들에 대해서 알.. 2023. 6. 20.
[Python Data Analytics] Python을 활용한 데이터 전처리(1) 안녕하세요. 바른 호랑이입니다. 이번 게시글에서는 Python을 활용한 데이터 전처리 방법에 대해 알아볼 예정입니다. 데이터 분석이라고 하면 많은 사람들이 AI, 머신러닝, 딥러닝과 같은 부분들을 먼저 떠올리지만 데이터 분석의 대부분의 업무는 그와 같은 모델들보다는 로우 데이터들을 얼마나 잘 가공하는가에 집중되어 있다고 해도 과언이 아니라고할 수 있습니다. 이와 같은 데이터 전처리를 지원하기 위해 Python에서는 Pandas, sklearn과 같은 다양한 패키지들이 작성되어있어 참고하기 쉽고, 이를 통해 데이터 전처리과정을 보다 원활하게 진행할 수 있습니다. 데이터 전처리라고 지칭되기는 하나 그 범위가 상당히 넓기 때문에 이번에는 가장 기본적인 부분인 누락, 중복 데이터 처리, 데이터 표준화 등과 같은.. 2023. 6. 19.
[Python Data Analytics] Pandas를 활용한 데이터 개요확인 안녕하세요. 바른 호랑이입니다. 이번 게시글에서는 Python의 데이터 분석을 위해 사용되는 Open source Library인 Pandas를 활용한 데이터 개요확인방법에 대해 알아볼 예정입니다. 데이터 분석을 시작하게 되면 EDA(Exploratory Data Analysis : 탐색적 데이터 분석)를 먼저 수행하고 본격적인 데이터 분석을 진행하는 경우가 많습니다. EDA란 수집한 데이터의 구조 및 이상치등과 같은 부분들을 간단하게 검토하여 데이터를 기초 통계수치나 그래프로 분석하여 데이터를 직관적으로 이해하는 일련의 과정이라고 할 수 있으며, Pandas에서는 이를 위해 여러가지 함수와 메소드들을 제공하고 있습니다. 모든 코드는 Colab 환경을 기준으로 작성하였으며, 보다 자세한 내용은 아래의 실.. 2023. 6. 18.
[Python Data Analytics] Pandas를 활용한 데이터 입출력 안녕하세요. 바른호랑이입니다. 이번 게시글에서는 Python의 데이터 분석을 위해 사용되는 Open source Library인 Pandas를 활용한 데이터 입출력방법에 대해 알아볼 예정입니다. 이전까지 Pandas의 대표적인 자료구조의 방법과 기초적인 조작방법에 대해 알아보았다면 이번에는 실제적인 분석을 위해 데이터를 불러오고 저장하는지에 대해 알아볼 예정입니다. Colab환경을 기준으로 작성을 해서 로컬상에서 적용할 때와는 약간의 차이가 발생할 수 있으니 해당사항은 참고하시면 되겠습니다. 추가적으로 Pandas에 대해서 다양한 정보를 확인하고 싶으시다면 아래의 사이트로 들어가서 원하는 내용을 찾아보면 좋을 것 같습니다. ※ Pandas 참고 사이트 pandas - Python Data Analysis.. 2023. 6. 18.
[Python Data Analytics] Pandas를 활용한 데이터 조작(2) ※ Pandas를 활용한 데이터 조작 [Python Data Analytics] Pandas를 활용한 데이터 조작(1) 안녕하세요. 바른 호랑이입니다. 이번 게시글에서는 Python 데이터 분석의 기초라 할 수 있는 Pandas를 활용한 데이터 분석 방법에 대해 알아볼 계획입니다. 데이터 분석 업무는 데이터를 수집하고 data-is-power.tistory.com 안녕하세요. 바른 호랑이입니다. 이번 게시글에서는 저번 게시글에 이어서 Python의 데이터 분석을 위해 사용되는 Open source Library인 Pandas를 활용한 데이터 조작방법에 대해 알아볼 예정입니다. 이전 게시글에서 대표적인 자료구조와 해당 자료구조의 간단한 조작방법에 대해서 알아본 것에 이어서 이번에는 정렬과 연산에 대해서 알.. 2023. 6. 17.
[Python Data Analytics] Pandas를 활용한 데이터 조작(1) 안녕하세요. 바른 호랑이입니다. 이번 게시글에서는 Python 데이터 분석의 기초라 할 수 있는 Pandas를 활용한 데이터 분석 방법에 대해 알아볼 계획입니다. 데이터 분석 업무는 데이터를 수집하고 정리하는 일이 전부라고 할 수 있을 정도로 데이터 수집 및 가공은 기초적이면서 가장 중요한 일이라고 할 수 있습니다. Pandas는 Python언어를 기반으로 한 Open source Library로 데이터를 수집하고 정리하는데 최적화된 도구이기에 이를 학습하여 적재적소에 활용할 수 있다면 데이터 분석업무를 보다 효과적으로 수행할 수 있습니다. 데이터의 형태나 속성은 매우 다양하며, 이를 분석하기 위해서는 컴퓨터가 이해할 수 있는 형식을 가지는 구조로 통합할 필요가 있습니다. Pandas는 이를 위해 데이터.. 2023. 5. 20.
728x90
반응형