본문 바로가기

하루에 하나 배우기/Python

(3)
[2020-09-01-Python] plotly를 이용한 Bubble chart, 시계열 데이터까지 plotly를 이용한 Bubble chart 하루에 하나 배운다는 목표와는 다르게 정확히 이틀에 하나씩 업로드를 하고 있다. 다시 하루에 하나 배운다는 마인드로 파이팅 해야겠다. 오늘 살펴볼 것은 polty 라이브러리를 사용하여 이쁜 그래프를 그려보는 것이다. 개인적인 생각으로 복잡한 과정 없이 다른 라이브러리보다 이쁘게 그래프를 그릴 수 있는 것 같다. 내가 제일 맘에 들었던 차트인 Bubble chart를 바로 그려보자 코드 # plotly 라이브러리중 express 모듈 import import plotly.express as px # px.data 내부에 있는 데이터 가져오기 df = px.data.gapminder() # px.scatter 함수 내에 인자 넣어주기 fig = px.scatter..
[2020-08-30-Python] Pandas pandas.concat() 함수 Pandas.concat() 파이썬에서 유용하게 사용되는 라이브러리 pandas. 그 중 두 개의 Data Frame 또는 Series를 병합하는 함수인 concat() 함수에 대해 간단히 작성해보려고 한다. concat 함수는 여러 parameters를 가지고 있지만, 그 중 자주 이용되는 것은 몇 가지로 추려진다. 공식 홈페이지에 나와있는 예제를 따라해보자. 예제1 import pandas as pd s1 = pd.Series(['a', 'b']) s2 = pd.Series(['c', 'd']) result = pd.concat([s1, s2]) print(result) 출력 결과 0 a 1 b 0 c 1 d dtype: object 첫 예제는 두 Series형 데이터를 수직으로 합치는 예제이다. 그..
[2020-08-28-Python] if __name__ == "__main__" if __name__ == "__main__" 의 의미 1. __name__ 변수는 현재 파일이 어떻게 실행됐는지를 알려준다 이번에 웹 크롤링의 병렬 처리를 위해서 multiprocessing을 import 하면서 생겼던 일이다. import Pool from multiprocessing ''' 생략 ''' with Pool() as pool# 프로세스 개수 최대로 사용 tagsList = list(pool.imap(CL_tags_from_post, row[4])) #row[4] = postList 다음과 같은 코드를 실행하려는데, (CL_tags_from_post는 웹 크롤링 함수이다.) 자꾸 파이썬 코드가 처음부터 다시 실행되는(그것도 프로세스 개수만큼) 이상한 현상이 발생했다. 구글링을 통해 알아낸..