Skip to main content

Pandas Kütüphanesi ve Metotları

Pandas (Python Data Analysis) kütüphanesi data analizi ve manipülasyonu için kullanılır.

"pandas" kütüphanesini bilgisayarınıza kurmak için aşağıdaki komut kullanılabilir.

pip install pandas

"pandas" kütüphanesini aşağıdaki kod ile programınıza dahil edebilirsiniz.

import pandas as pd

Pandas Kütüphanesinin Dosya Okuma Yazma Methodları


read_csv() metodu sayesinde csv dosyalarının içeriğini bir okuyarak bu içeriği bir veri çerçevesine (dataframe) atayabiliriz. Parantez içerisine mutlaka okunacak dosyanın yolu ve adı yazılmalıdır. Bu metodun bazı önemli parametreleri şunlardır:

  • sep=: Öntanımlı değeri ',' virgül işaretidir. Csv dosyanızda veri ";" ile ayrılmış ise sep=";" parametresini yazmanız gerekir.
  • delimiter=: sep= ile aynı işlevi görür. İkisinden sadece birini kullanmak gerekir.
  • header=: Öntanımlı değeri "0" rakamıdır. Değişken (sütun) başlıklarının hangi satırda yer aldığını belirtmek için kullanılır.

Örnek:

okullar = pd.read_csv('/home/egitimportali/okul_listesi.csv', sep=',', header=0)


DataFrame.to_csv(dosya_yolu, sep, ...): Veri çerçevesini "csv" dosyası olarak kaydetmek için kullanılır. Örnek:

okullar.to_csv('/home/egitimportali/yeni_liste.csv', sep=';')


Yukarıdaki "csv" örneklerinde olduğu gibi diğer formattaki dosyaları okumak ve yazmak için:

  • read_pickle(dosya_yolu, ...): Pickle dosyalarını okumak için.
  • DataFrame.to_pickle(dosya_yolu, ...): Pickle nesnelerini dosyaya yazmak için.
  • read_table(dosya_yolu, sep, ...): Tablo şeklinde ayrılmış dosyaları okumak için.
  • read_excel(dosya_yolu, ...): "xls" ve "xlsx" uzantılı dosyaları okumak için kullanılır. Okunacak sayfa adı için sheet_name='sayfa_adi' ve sütun başlıklarının olduğu satırı belirtmek için header=sayi parametreleri kullanılır.
  • DataFrame.to_excel(dosya_yolu): Veriyi "xls" veya "xlsx" uzantılı dosyalara yazmak için.
  • read_json(dosya_yolu, ...): JSON dosyalarını okumak için.
  • DataFrame.to_json(dosya_yolu): Veriyi JSON dosyasına yazmak için.
  • read_html(dosya_yolu, ...): HTML dosyalarını okumak için.
  • DataFrame.to_html(dosya_yolu): Veriyi HTML dosyasına yazmak için.
  • read_xml(dosya_yolu, ...): XML dosyalarını okumak için.
  • DataFrame.to_xml(dosya_yolu): Veriyi XML dosyasına yazmak için.
  • read_parquet(dosya_yolu, ...): Parquet dosyalarını okumak için.
  • DataFrame.to_parquet(dosya_yolu): Veriyi parquet dosyasına yazmak için.

Pandas Kütüphanesinin Veri Görüntüleme Methodları

head() metodu sayesinde bir veri çerçevesinin ilk "n" satırı görülür. "n"in öntanımlı değeri 5'tir. Örneğin veri setinin ilk 7 satırını görüntülemek için:

okullar.head(7)


tail() metodu sayesinde bir veri çerçevesinin en son "n" satırı görülür. "n"in öntanımlı değeri 5'tir. Örneğin veri setinin son 8 satırını görüntülemek için:

okullar.tail(8)