Pythonでのxlsxファイルの読み込み方法

python
記事内に広告が含まれています。

Pythonは、データ処理に優れたプログラミング言語で、Excelファイルの読み込みにも多くのライブラリが提供されています。

この記事では、Pythonを使ったxlsxファイルの読み込み方法を詳細に解説します。

特に初心者向けに、具体的なコード例を交えてわかりやすく説明していきます。

DMM WEBCAMP
  • 未経験者向けプログラミングスクール
  • 現役エンジニアがしっかりサポート
  • 卒業後も安心の転職・副業サポート

Pythonでのxlsxファイルの基本的な読み込み方法

Pythonでxlsxファイルを読み込むには、ライブラリを使用するのが一般的です。

pandasやopenpyxlなどのライブラリを活用することで、簡単にファイルを読み込み、データを処理できます。

これからその具体的な方法を説明していきます。

pandasを使った簡単な読み込み

import pandas as pd

# Excelファイルを読み込む
df = pd.read_excel('data.xlsx')
print(df.head())

このコードでは、pandasを使用してExcelファイルを読み込んでいます。

data.xlsxファイルの内容をデータフレームに変換し、最初の5行を表示しています。

openpyxlを使ったファイル操作

from openpyxl import load_workbook

# Excelファイルを読み込む
wb = load_workbook('data.xlsx')
sheet = wb.active
print(sheet['A1'].value)

openpyxlライブラリを使用して、Excelシートのセルを読み取ることが可能です。

ファイルパスの指定に関する注意点

ファイルパスを指定する際、絶対パスと相対パスに注意する必要があります。

特に、システムの環境によってパスの書き方が異なるため、柔軟に対応しましょう。

CodeCamp
  • 現役エンジニアからスキルを学べる
  • 満足度は驚異の97.4%
  • 300社以上のIT企業で研修に導入
  • 毎日9時〜21時まで、無料カウンセリングを開催中!

pandasを使った高度なデータ処理

pandasを使うと、読み込んだデータに対して多彩な処理を行うことができます。

フィルタリングや集計、データの整形などを簡単に実現できます。

データのフィルタリング

# データフレームから特定の行を抽出
filtered_df = df[df['column_name'] > 100]
print(filtered_df)

このコードでは、特定の列の値が100を超える行を抽出しています。

フィルタリングは大規模データセットを効率的に扱うのに役立ちます。

データの集計

# データを集計
grouped_df = df.groupby('category_column').sum()
print(grouped_df)

カテゴリごとにデータを集計し、その合計を出力するコードです。

欠損値の処理

# 欠損値を埋める
df.fillna(0, inplace=True)

このコードでは、データフレーム内の欠損値を0で埋めています。

【リモートワークには必須】
キャリアに合わせてお得に光回線を利用しよう
ドコモ光
開通後、最短一ヶ月で35,000円のキャッシュバック!
 
auひかり
難しい条件一切なしで、最大12,7000円のキャッシュバック!
 
ソフトバンク光
高額キャッシュバックや豪華特典をお届け!

openpyxlを使ったカスタム操作

openpyxlでは、Excelファイルの高度な操作が可能です。

セルの書き換えや、新しいシートの追加、データの書き込みなどが行えます。

セルの値を書き換える

# セルの値を変更
sheet['A1'] = '新しい値'
wb.save('data.xlsx')

このコードでは、セルA1の値を「新しい値」に変更し、ファイルを保存しています。

新しいシートを追加する

# 新しいシートを追加
wb.create_sheet('NewSheet')
wb.save('data.xlsx')

Excelファイルに新しいシートを追加する方法です。

データをExcelに書き込む

# データを書き込む
for row in range(1, 10):
    sheet[f'A{row}'] = row
wb.save('data.xlsx')

1から9までのデータをセルA1からA9に書き込むコードです。

プログラミングスクール受講時には教育訓練給付制度を利用することで、受講料の最大80%の給付を受けることが可能です。

Pythonでのxlsxファイル操作の注意点

Pythonでのxlsxファイル操作には、いくつかの注意点があります。

これらを理解しておくことで、エラーを未然に防ぐことができます。

ファイルの保存とクローズ処理

from openpyxl import Workbook

# 新しいExcelファイルを作成
wb = Workbook()
sheet = wb.active
sheet['A1'] = '保存テスト'

# ファイルを保存
wb.save('test.xlsx')

# ファイルを閉じる(openpyxlでは明示的なクローズは必要ないが、他のライブラリでは必要な場合がある)
wb.close()

このコードでは、新しいExcelファイルを作成し、セルA1に「保存テスト」という値を入れ、ファイルを保存しています。

openpyxlでは明示的なクローズ処理は不要ですが、他のライブラリでは必要な場合があるので、ドキュメントを確認しましょう。

データ型に注意する

from openpyxl import Workbook

wb = Workbook()
sheet = wb.active

# セルに文字列を挿入
sheet['A1'] = '100'
# セルに数値を挿入
sheet['A2'] = 100

# データ型の違いを確認
print(type(sheet['A1'].value))  # 出力: 
print(type(sheet['A2'].value))  # 出力: 

wb.save('datatype_test.xlsx')

このコードでは、同じ「100」という値を文字列と数値としてそれぞれセルに挿入し、データ型の違いを確認しています。

Excelファイル内でのデータ型に注意する必要があり、正しい型で処理することが重要です。

ライブラリのバージョンに注意

Excel操作に使用するライブラリのバージョンによって、サポートされている機能や互換性が異なることがあります。

import openpyxl

print(openpyxl.__version__)  # ライブラリのバージョンを確認するコード

使用しているopenpyxlライブラリのバージョンを確認するためのコードです。

バージョンによって使用できる機能が異なる場合があるため、バージョン管理をしっかり行いましょう。

techgym
  • 20000人が学んだpythonの教材
  • 正しい情報をまとめて入手
  • 様々なゲームを作成しながら楽しくpythonが身に付く
  • 自主学習派はこれ一択!

今なら1年間有効なzoomサポート付き!

まとめ: Pythonでのxlsxファイル操作をマスターしよう

Pythonを使ったxlsxファイルの読み込みや操作は非常に強力です。

この記事で紹介した方法を使えば、効率的にデータを扱うことができ、業務の効率化に繋がります。

【給付金が受けられる】おすすめプログラミングスクール!
  • DMM WEBCAMP
    転職成功率98%&離職率2.3%
    転職できなければ全額返金DMM.comグループならで非公開求人も多数
  • テックアカデミー
    【転職保証】受講生の100%が内定獲得!9割以上が未経験からスタート!LINEヤフー監修&万全サポート
  • Aidemy Premium
    【給付金利用の相談歓迎】AI・データ分析学ぶならAidemy Premium
  • ウズウズカレッジ
    初心者・文系出身者でもOK、IT未経験からの専門的な就業サポート

コメント

タイトルとURLをコピーしました