Language/Python 4

[Python] Pandas 기초 및 실습

💡 Pandas? Pandas는 데이터 조작과 분석을 위한 파이썬 소프트웨어 라이브러리 입니다. Pandas에서는 표 형태의 데이터를 다루기 위한 두 가지 주요 데이터 구조인 Serise(1차원)와 DataFrame(2차원)이 존재합니다. 💡 Series? Series는 1차원의 데이터를 다룹니다. 1차원 리스트와 유사하지만, 리스트와의 큰 차이점은 시리즈는 인덱스 이름을 부여할 수 있다는 점 입니다. 💡 DataFrame? DataFrame은 판다스의 2차원 자료구조 입니다. 시리즈들의 집합이며 행과 열이 있는 테이블 형태를 가집니다. 1. Series Series 객체 생성 import pandas as pd value = pd.Series(['가','나','다','라']) print(value) v..

Language/Python 2022.03.14

[Python] 웹 크롤링 하여 csv 파일로 저장

해외 유명 편집샵인 매치스패션,마이테레사,컬티즘,육스 웹 사이트에서 세일하고 있는 제품을 Python을 활용하여 데이터를 추출하고 csv파일로 저장해보겠습니다. 1. 라이브러리 설치 requests 모듈은 간단한 HTTP 요청 처리를 위해 사용된다. pip install requests HTML 태그를 파싱 하여 사진, 글, 콘텐츠를 사용자가 편리하게 가져올 수 있게 제공해준다. pip install beautifulsoup4 lxml은 XML 및 HTML을 구문 분석하기 위한 매우 간단하고 강력한 API를 제공한다. pip install lxml 2. 웹 페이지 접속 유명한 해외 쇼핑몰인 매치스패션에 세일 중인 상품들을 크롤링해보겠습니다. 먼저 url 주소를 GET 요청을 보내서 서버에서 응답을 받을 ..

Language/Python 2022.03.01

[Python] input()함수로 값 여러개 입력 받기

1. input() 파이썬에서 input() 함수를 사용해서 입력을 받습니다. input() 함수는 입력한 값을 모두 문자열 취급합니다. # 1,2,3 입력 a = input() # 123 출력 print(a) 2.split() split()함수는 특정 문자를 기준으로 문자열을 잘라 리스트로 만들어주는 함수이다. input()에 split()을 사용하면 입력한 값을 공백 기준으로 구분하여 변수에 순서대로 저장할 수 있습니다. # 입력받은 값을 공백을 기준으로 구분 # 1,2,3 입력 a,b,c = input().split() # 1,2,3 출력 print(a) print(b) print(c) 3.map() map() 함수는 여러 개의 데이터를 한 번에 다른 형태로 변환시켜 주는 함수입니다. map(변환 ..

Language/Python 2022.01.17

[Python] 패키지(package)와 모듈(module) 알아보기

💡 모듈(module) 파이썬에서 모듈은 특정 요소(변수, 함수, 클래스 등)를. py 파일 단위로 작성한 것입니다.. 모듈을 불러오면 모듈 내의 요소를 사용할 수 있습니다. 💡 패키지(package) 패키지는 모듈을 모아놓은 폴더라고 할 수 있습니다. 패키지는 라이브러리라고도 부르지만 라이브러리는 패키지의 집합으로 패키지보다 포괄적인 개념이지만, 혼용해서 사용하기도 합니다. 파이썬 3.3버전 미만은 패키지 폴더 안에 __init__. py 파일이 있어야만 패키지로 인식합니다. 💡 __init__ 용도 __init__.py 파일은 해당 디렉터리가 패키지의 일부임을 알려주는 역할을 합니다. 패키지에서 모든 것(*)을 from 패키지.패키지 import * 하고 싶으면 해당 디렉터리의 __init__. py..

Language/Python 2022.01.16