odenのメモ帳

いっつも解決したことを書き留めなくて,後々後悔するので,それを防ごうプロジェクト

pandasで何かするときメモ

pandasのdataframe操作を毎回忘れるので随時適当にメモしていく.
自分のためだけなので記事ですら無い.

フィルタリング
df[df['col'] > val]
左結合
import pandas as pd
m_df = pd.merge(df1, df2, how='left')
既存列から新たな列追加
df['new_col'] = df['col1'] + df['col2']

これでnew_col列がdfに追加されている

四分位取得
q1 = df['col'].describe()['25%']
q3 = df['col'].describe()['75%']
散布図行列
from pandas.tools.plotting import scatter_matrix
scatter_matrix(df)