728x90 반응형 IT & 데이터 사이언스104 [ADP] 과목Ⅰ 데이터의 이해 보호되어 있는 글 입니다. 2023. 10. 22. [Python Data Analytics] OpenAPI를 활용한 데이터 호출&적재 안녕하세요. 바른 호랑이입니다. 이번 게시글에서는 OpenAPI를 활용하여 데이터를 호출하고 적재하는 방법과 공공데이터 포털의 데이터가 필요할 때 활용하기 좋은 Python Library도 알아볼 예정입니다. API(Application Programming Interface)란 컴퓨터나 컴퓨터 프로그램 사이의 연결을 지칭하는 용어로 일종의 다리역할을 한다라고 생각하면 됩니다. 그 중에서도 OpenAPI란 하나의 웹 사이트에서 자신이 가진 기능을 이용할 수 있도록 공개한 프로그래밍 인터페이스로 누구나 사용이 가능하기에 이를 응용하여 앱, 웹 등의 개발을 진행하거나 데이터 분석시 사용할 수 있습니다. 이를 조금 더 쉽게 접근하고 이용할 수 있게 대한민국 정부에서는 공공데이터 포털을 통해 여러 OpenAPI.. 2023. 7. 17. [환경설정] Amazon Web Services 가입하기 안녕하세요. 바른 호랑이입니다.이번 게시글에서는 대표적인 클라우드 서비스 중 하나인 AWS(Amazon Web Services)에 가입하는 방법에 대해 알아볼 예정입니다. AWS는 신규회원에 한해서 Free Tier라는 서비스를 제공해주며, 이를 이용하여 일반적으로 12개월 동안 특정 서비스들을 무료로 사용해볼 수 있습니다. 해당 기간동안은 과금이 되지 않는 선에서 테스트가 가능하지만, 자칫하면 요금이 부과될 수 있으니 해당부분은 Amazon에서 제공하는 문서를 참조하여 잘 확인 후 이용할 필요가 있습니다. 해당 서비스를 잘 이용하면 클라우드 서비스에 대한 다양한 실습과 간단한 프로젝트 진행시 활용할 수 있으니 계정 생성 후 유용하게 이용하면 되겠습니다. Free Tier에 대한 간단한 설명과 문서를 확.. 2023. 7. 1. [환경설정] IBM Data Studio 설치 안녕하세요. 바른 호랑이입니다. 이번 게시글에서는 DB의 IDE중 하나인 IBM Data Studio설치에 대해 알아볼 예정입니다. 기본적으로 IBM 사이트 계정이 존재하면 무료로 다운로드 받아 사용이 가능하며, CLI가 아닌 GUI를 제공하기에 DB를 활용하고 조작하는데 유용한 Tool들 중 하나입니다. 설치 실습은 이전에 설치한 Db2를 활용하여 진행할 예정이며, 해당내용이 궁금하신 분들은 아래의 게시글을 참조해주시기 바랍니다. ※ IBM Db2 설치 [환경설정] IBM DB2 설치 안녕하세요. 바른 호랑이입니다. 이번 게시글에서는 대표적인 DB중 하나인 IBM의 Db2 설치에 대해서 알아볼 예정입니다. 설치는 무료로도 이용이 가능한 IBM Db2 Community Edition을 설치할 예정이며, .. 2023. 7. 1. [환경설정] IBM DB2 설치 안녕하세요. 바른 호랑이입니다. 이번 게시글에서는 대표적인 DB중 하나인 IBM의 Db2 설치에 대해서 알아볼 예정입니다. 설치는 무료로도 이용이 가능한 IBM Db2 Community Edition을 설치할 예정이며, 설치 파일 다운로드부터 기본으로 제공해주는 DB인 SAMPLE DB 생성까지 진행해볼 예정입니다. 보다 자세한 절차는 아래 내용을 참고하시면 되겠습니다. ※ IBM Db2 Community Edition 다운로드 공식 홈페이지 Db2 database - 개요 강력한 애플리케이션을 개발합니다. Db2는 Java, .Net, Ruby, Python, R, Perl, C, C++, pureXML, Gremlin, XQuery, Mongo, FLWOR Expression, JSON과 같은 프로그.. 2023. 7. 1. [Python Data Analytics] Python을 활용한 Machine Learning 안녕하세요. 바른 호랑이입니다.이번 게시글에서는 실제 데이터들과 Python을 활용하여 다양한 Machine Learning 실습을 진행해볼 예정입니다.결국 데이터를 잘 가공하고 전처리하는 과정을 통해 얻어내고자 하는 것은 그 데이터 속의 패턴을 분석하여 결과를 예측함으로써 보다 더 나은 판단을 하기 위함입니다. 이와 같은 예측을 보다 편리하게 할 수 있게 Python은 여러가지 ML(Machine Learning)패키지들을 제공하고 있으며, 이를 활용하여 보다 편리하게 패턴을 파악하고 결과를 예측할 수 있습니다. ML에는 크게 지도학습, 비지도학습으로 분류할 수 있으며, 이번에는 이와 같은 학술적이고 이론적인 부분들을 다루기 보다는 실제로 그와 같은 모델들을 어떤 식으로 사용하고 코딩해야하는지에 .. 2023. 6. 23. [Python Data Analytics] Python을 활용한 데이터 전처리(2) ※ Python을 활용한 데이터 전처리 [Python Data Analytics] Python을 활용한 데이터 전처리(1) 안녕하세요. 바른 호랑이입니다. 이번 게시글에서는 Python을 활용한 데이터 전처리 방법에 대해 알아볼 예정입니다. 데이터 분석이라고 하면 많은 사람들이 AI, 머신러닝, 딥러닝과 같은 부분들 data-is-power.tistory.com 안녕하세요. 바른 호랑이입니다. 이번 게시글에서는 저번 게시글에 이어서 Python을 활용한 데이터 전처리 방법에 대해 알아볼 예정입니다. 이전 게시글에서 누락, 중복 데이터 처리 및 데이터 표준화에 대해서 알아본 것에 이어서 함수적용방법, 열 순서변경 및 분리방법, 값 필터링 방법, 데이터프레임 병합 , 조인, 분리, 그룹핑 방법들에 대해서 알.. 2023. 6. 20. [Python Data Analytics] Python을 활용한 데이터 전처리(1) 안녕하세요. 바른 호랑이입니다. 이번 게시글에서는 Python을 활용한 데이터 전처리 방법에 대해 알아볼 예정입니다. 데이터 분석이라고 하면 많은 사람들이 AI, 머신러닝, 딥러닝과 같은 부분들을 먼저 떠올리지만 데이터 분석의 대부분의 업무는 그와 같은 모델들보다는 로우 데이터들을 얼마나 잘 가공하는가에 집중되어 있다고 해도 과언이 아니라고할 수 있습니다. 이와 같은 데이터 전처리를 지원하기 위해 Python에서는 Pandas, sklearn과 같은 다양한 패키지들이 작성되어있어 참고하기 쉽고, 이를 통해 데이터 전처리과정을 보다 원활하게 진행할 수 있습니다. 데이터 전처리라고 지칭되기는 하나 그 범위가 상당히 넓기 때문에 이번에는 가장 기본적인 부분인 누락, 중복 데이터 처리, 데이터 표준화 등과 같은.. 2023. 6. 19. [Python Data Analytics] Pandas를 활용한 데이터 개요확인 안녕하세요. 바른 호랑이입니다. 이번 게시글에서는 Python의 데이터 분석을 위해 사용되는 Open source Library인 Pandas를 활용한 데이터 개요확인방법에 대해 알아볼 예정입니다. 데이터 분석을 시작하게 되면 EDA(Exploratory Data Analysis : 탐색적 데이터 분석)를 먼저 수행하고 본격적인 데이터 분석을 진행하는 경우가 많습니다. EDA란 수집한 데이터의 구조 및 이상치등과 같은 부분들을 간단하게 검토하여 데이터를 기초 통계수치나 그래프로 분석하여 데이터를 직관적으로 이해하는 일련의 과정이라고 할 수 있으며, Pandas에서는 이를 위해 여러가지 함수와 메소드들을 제공하고 있습니다. 모든 코드는 Colab 환경을 기준으로 작성하였으며, 보다 자세한 내용은 아래의 실.. 2023. 6. 18. 이전 1 ··· 4 5 6 7 8 9 10 ··· 12 다음 728x90 반응형