Pandasデータ処理の実践的テクニック12選
はじめに
Pandasは、Python環境において高速で強力がかつ使いやすいデータ分析・操作ツールです。pipコマンドでかんたんにインストールできます。
pip install pandas
コード内でPandasを使用する場合は、まずインポートを行います。
import pandas as pd
本記事では、頻繁に使用される12のデータ処理操作を紹介します。
# サンプルデータの作成
sample_data = pd. ...
6月24日 18:12 投稿
Pandas Seriesオブジェクトの詳細解説と実践例
データ型変換における問題と解決策
実務で以下のエラーに遭遇することがあります:
TypeError: unsupported operand type(s) for -: 'str' and 'float'
このエラーは文字列型と浮動小数点型の間で減算演算を実行しようとした際に発生します。
基本的な問題例
str_value = "5"
float_value = 3.14
result = str_value - float_value # 文字列と浮動小数点の減算は不可能
...
6月16日 21:47 投稿
PandasによるExcelデータ処理の実践ガイド
Pandasを用いたExcel操作の基本から応用までを解説する。
ファイルの読み込みと書き出し
Excelファイルの読み込みには pd.read_excel() を使用する。ヘッダー行の指定やインデックス列の設定も同時に行える。
import pandas as pd
# 基本的な読み込み
df = pd.read_excel('data/sample.xlsx')
# ヘッダー行を3行目に指定
df = pd.read_excel('data/sample.xlsx', header= ...
5月26日 21:13 投稿
Pandasの基本と応用:APIの詳細解説と実践例
環境準備とライブラリインポート
データ分析に必要なPandasとその関連ライブラリをセットアップします。
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
# 表示設定(オプション)
pd.set_option('display.max_columns', None)
pd.set_option('display.width', 1000)
主要なデータ構造:SeriesとDataFrame
これらのデータ構造は、データ ...
5月18日 16:42 投稿
Python Pandas DataFrame の活用術:生成からデータ操作まで
Pandas DataFrame の概要
Pandas は Python 環境で広く利用されるデータ分析ライブラリであり、その中核をなす DataFrame は二次元の表形式データ構造です。Excel のスプレッドシートに類似しており、行と列で構成されます。各列には整数、浮動小数点数、文字列など異なるデータ型を割り当てることが可能で、各行には固有のインデックス識別子が付与されます。
DataFrame ...
5月15日 15:55 投稿
Python PandasライブラリのDataFrameデータ構造
データの基本操作
DataFrameはPandasライブラリの中核となるデータ構造です。以下は基本的な操作例です。
import pandas as pd
import numpy as np
# 5行4列の乱数データでDataFrameを作成
df = pd.DataFrame(np.random.rand(5, 4),
columns=['A', 'B', 'C', 'D'])
# データの表示
print(df)
出力例:
A B C ...
5月10日 16:03 投稿