728x90 반응형 IT & 데이터 사이언스104 [Python Data Analytics] Pandas를 활용한 데이터 입출력 안녕하세요. 바른호랑이입니다. 이번 게시글에서는 Python의 데이터 분석을 위해 사용되는 Open source Library인 Pandas를 활용한 데이터 입출력방법에 대해 알아볼 예정입니다. 이전까지 Pandas의 대표적인 자료구조의 방법과 기초적인 조작방법에 대해 알아보았다면 이번에는 실제적인 분석을 위해 데이터를 불러오고 저장하는지에 대해 알아볼 예정입니다. Colab환경을 기준으로 작성을 해서 로컬상에서 적용할 때와는 약간의 차이가 발생할 수 있으니 해당사항은 참고하시면 되겠습니다. 추가적으로 Pandas에 대해서 다양한 정보를 확인하고 싶으시다면 아래의 사이트로 들어가서 원하는 내용을 찾아보면 좋을 것 같습니다. ※ Pandas 참고 사이트 pandas - Python Data Analysis.. 2023. 6. 18. [Python Data Analytics] Pandas를 활용한 데이터 조작(2) ※ Pandas를 활용한 데이터 조작 [Python Data Analytics] Pandas를 활용한 데이터 조작(1) 안녕하세요. 바른 호랑이입니다. 이번 게시글에서는 Python 데이터 분석의 기초라 할 수 있는 Pandas를 활용한 데이터 분석 방법에 대해 알아볼 계획입니다. 데이터 분석 업무는 데이터를 수집하고 data-is-power.tistory.com 안녕하세요. 바른 호랑이입니다. 이번 게시글에서는 저번 게시글에 이어서 Python의 데이터 분석을 위해 사용되는 Open source Library인 Pandas를 활용한 데이터 조작방법에 대해 알아볼 예정입니다. 이전 게시글에서 대표적인 자료구조와 해당 자료구조의 간단한 조작방법에 대해서 알아본 것에 이어서 이번에는 정렬과 연산에 대해서 알.. 2023. 6. 17. [Python Data Analytics] Pandas를 활용한 데이터 조작(1) 안녕하세요. 바른 호랑이입니다. 이번 게시글에서는 Python 데이터 분석의 기초라 할 수 있는 Pandas를 활용한 데이터 분석 방법에 대해 알아볼 계획입니다. 데이터 분석 업무는 데이터를 수집하고 정리하는 일이 전부라고 할 수 있을 정도로 데이터 수집 및 가공은 기초적이면서 가장 중요한 일이라고 할 수 있습니다. Pandas는 Python언어를 기반으로 한 Open source Library로 데이터를 수집하고 정리하는데 최적화된 도구이기에 이를 학습하여 적재적소에 활용할 수 있다면 데이터 분석업무를 보다 효과적으로 수행할 수 있습니다. 데이터의 형태나 속성은 매우 다양하며, 이를 분석하기 위해서는 컴퓨터가 이해할 수 있는 형식을 가지는 구조로 통합할 필요가 있습니다. Pandas는 이를 위해 데이터.. 2023. 5. 20. [DB] 데이터 정합성과 무결성 그리고 데이터베이스 정규화 안녕하세요. 바른호랑이입니다. 이번 게시글에서는 데이터 정합성과 무결성 그리고 데이터베이스 정규화에 대해서 알아볼 예정입니다. 정규화(Normalization)란 데이터 모델링의 핵심 중의 하나라고 할 수 있으며, 중복데이터와 이상현상을 제거함으로써 데이터 정합성(Consistency)과 데이터무결성(Integrity) 확보하기 위해 테이블을 분해하는 것입니다. 이와 관련된 보다 자세한 내용은 아래와 같습니다. 1. 데이터정합성과 무결성 ① 정의 ㆍ 데이터 정합성(Data Consistency) : 데이터들이 서로 일치하는 상태 - 데이터가 서로 모순없이 일치해야 함을 의미하며 중복데이터가 제거되지 않은 비정규형을 사용하여 이상현상(Anomaly)가 발생할 경우 정합성이 깨지게 됨. 예를 들어 사원정보 .. 2023. 3. 16. [환경설정] Oracle DB 및 SQL Developer 설치 안녕하세요. 바른 호랑이입니다. 이번 게시글에서는 Orcale DB 및 SQL Developer 설치에 대해서 알아볼 예정입니다. Oracle DB는 대표적인 관계형 데이터베이스로 가장 쉽게 접할 수 있는 DB이며, DB-Engines에서 측정한 지표상으로도 최상위권에 위치하고 있는 DB입니다. DB-Engines Ranking Popularity ranking of database management systems. db-engines.com 상용 서비스 제공을 위한 DB 구축이 아닌 개인적인 SQL 학습을 위해서 사용할 환경구축을 목표로 하고 있기에 무료버전인 Oracle DB Express(XE)을 설치할 계획입니다. Oracle DB License에 대한 보다 자세한 내용은 아래의 사이트에서 참고.. 2023. 3. 11. [환경설정] VMware Workstation을 활용한 가상화 환경 설정 안녕하세요. 바른호랑이입니다.이번 게시글에서는 가상화 환경을 설정할 수 있게 해주는 Vmware Workstation을 설치하여 가상화환경을 구축하는 방법에 대해 알아볼 예정입니다. VMware Workstation은 사용자가 가상 머신, 컨테이너, Kubernetes 클러스터를 실행할 수 있도록 해 주는 데스크톱 하이퍼 바이저제품군이며, 자신이 보유한 OS외의 OS를 사용할 수 있고 하나의 컴퓨터에서 여러개의 OS를 운영할 수 있게 해주기에 다양한 방면에서 활용도가 높습니다. 가상머신에 대한 자세한 내용이 궁금하신 분들은 아래의 링크를 참고하시면 되겠습니다. 가상 머신(버추얼 머신), 가상 서버, 가상 OS 개념 및 작동 방식가상 머신이란 물리 머신의 리소스를 추상화하여 생성된 격리된 가상 컴퓨팅 환경.. 2023. 3. 9. [SNS] Credly를 통한 MS Certification LinkedIn 연동 안녕하세요. 바른호랑이입니다. 이번 게시글에서는 Credly 사이트를 통해서 MS Certification을 LinkedIn Profile에 연동하는 방법에 대해서 알아볼 예정입니다. MS Certification를 간략하게 설명드리면 Microsoft사의 여러가지 IT기술에 대한 지식수준과 숙련도를 평가하는 각종 시험을 통과하고 나서 얻을 수 있는 인증들로 Azure, PowerBI, Teams등과 같은 프로그램들에 대한 활용가능여부를 보장해주는 자격증들입니다. 보다 자세한 내용이 궁금하신 분들은 아래 사이트에서 확인해주시기 바랍니다. Microsoft Certifications Benefits of certifications Upon earning a certification, 61% of tech .. 2023. 3. 8. [DB] 성능 데이터 모델링 안녕하세요. 바른호랑이입니다. 이번 게시글에서는 성능 데이터 모델링에 대해서 알아볼 예정입니다. 대용량의 복잡한 데이터들의 관리비용을 최소화하고 효율적인 관리를 위해서는 성능데이터 모델링이 요구되며 관련 개념들로는 정규화, 반정규화, 테이블 통합 등이 존재합니다. 이와 관련된 세부 내용들은 아래와 같습니다. 1. 성능데이터 모델링의 개요 ① 정의 ㆍ DB 성능향상을 목적으로 설계 단계의 데이터 모델링 때부터 정규화, 반정규화, 테이블 통합, 테이블 분할, 조인구조, Key관리 등 여러가지 성능과 관련된 사항이 데이터 모델링에 반영될 수 있도록 하는 것 ㆍ SQL 튜닝만을 통해 성능에 대한 데이터 모델 설계를 하게되면 한계에 부딪칠 수 밖에 없고, 시간이 지날수록 성능개선의 비용은 증가하게 되기에 프로젝트.. 2023. 3. 8. [DB] DB 및 SQL 관련용어 정리 안녕하세요. 바른호랑이입니다. 이번 게시글에서는 DB 및 SQL관련용어들에 대해서 간략하게 알아볼 예정입니다. 용어들과 그에 대한 내용은 아래와 같습니다. 1. 개념적 데이터 모델링 : 추상화 수준이 높고, 업무중심적이며 포괄적인 수준의 모델링을 지칭하는 용어로 전사적 데이터 모델링, EA(Enterprise Architect)수립시 많이 이용함. 2. 격리성(Isolation) : 실행 중인 트랜잭션의 중간에 다른 트랜잭션이 접근할 수 없음. 3. 공유 Lock(Shared Lock) : 데이터를 읽고자 할 때, 다른 공유 Lock과는 호환되지만 다른 배타적 Lock과는 호환되지 않음. 4. 관계(Relationship) : 엔터티의 인스턴스 사이의 논리적인 연관성으로 존재의 형태로서나 행위로서 서로에.. 2023. 3. 6. 이전 1 ··· 5 6 7 8 9 10 11 12 다음 728x90 반응형