Download Dataset dari Kaggle di Google Colab

Download Dataset dari Kaggle di Google Colab

Diposting pada 6.506 views

Mulai Menggunakan Token API Kaggle

Apa itu token API Kaggle? Token API Kaggle yang saya maksud adalah sebuah berkas dengan format JSON (JavaScript Object Notation) yang berisi informasi nama pengguna dan sebuah kunci yang dapat digunakan untuk mengakses Kaggle melalui CLI (Command Line Interface). Kamu bisa mengikuti langkah-langkah berikut untuk mendapatkan berkas token API ini.

Mendapatkan Token API Kaggle

Pertama, pastikan kamu sudah login terlebih dahulu ke Kaggle ( https://kaggle.com ) menggunakan akun kamu ya. Jika kamu belum memiliki akun, silahkan melakukan registrasi terlebih dahulu.

Selanjutnya kamu bisa menuju menu Account dengan cara klik profil (sebelah pojok kanan atas), kemudian pilih Account.

menu akun kaggle

Ketika berada pada halaman Account, kamu akan menemukan tombol Create New API Token. Kamu bisa klik saja tombol tersebut dan sebuah berkas bernama kaggle.json akan terdownload.

membuat token kaggle API baru

Mengupload Token API Kaggle ke Google Colab

Setelah berhasil mendapatkan berkas kaggle.json, kita akan membuat sebuah notebook di Google Colab terlebih dahulu. Kamu bisa langsung menuju laman Google Colab ( https://colab.research.google.com ) lalu klik New notebook

Baca Juga : Mengubah Theme Google Colab, Bisa Dark Mode!

membuat notebook baru di Google Colab

Kemudian tampil sebuah notebook yang masih kosong seperti screenshot berikut ini. Kamu bisa mengganti nama notebooknya sesuka hatimu ya.

notebook baru yang berhasil dibuat

Lalu kamu harus menghubungkan notebooknya ke runtime dengan menekan tombol Connect dan tunggu hingga muncul tanda centang beserta keterangan penggunaan RAM dan penyimpanannya.

tombol Connect pada notebook Google Colab
notebook yang berhasil terhubung dengan runtime

Selanjutnya kamu bisa membuka panel Files dengan meng-klik icon folder. Setelah itu kamu bisa mengupload berkas kaggle.json dengan klik icon Upload atau bisa juga dengan drag-n-drop secara langsung. Jika muncul peringatan bahwa berkas tidak akan tersimpan permanen, klik OK saja.

Saat berkasnya berhasil terupload, kita akan meletakkannya di folder .kaggle agar dapat digunakan dalam perintah CLI. Kamu bisa jalankan perintah berikut ini untuk membuat folder .kaggle dan menyalin berkas kaggle.json-nya ya.

!mkdir -p ~/.kaggle
!cp kaggle.json ~/.kaggle/
!chmod 600 /root/.kaggle/kaggle.json

Mulai download dataset langsung di Google Colab

Pada contoh ini saya akan mencoba download dataset Iris Species. Untuk mendownloadnya melalui Google Colab, kamu bisa klik opsi (titik tiga) lalu pilih Copy API command.

menyalin perintah API untuk download dataset

Kemudian tempel perintahnya ke Google Colab, pastikan kamu menambahkan tanda seru (!) terlebih dahulu seperti berikut ini. Lalu jalankan.

!kaggle datasets download -d uciml/iris
berhasil mendownload dataset

Yeay..! Kita telah berhasil mendownload datasetnya. Sangat mudah bukan? Cukup dengan beberapa langkah tersebut hidup kamu sudah jauh lebih mudah 🥳 .

Eits, tapi ada satu tips lagi jika kamu tidak ingin terus-terusan mengupload berkas kaggle.json setiap membuka notebook Google Colab. Caranya adalah dengan menyalin berkas kaggle.json tersebut ke Google Drive. Penasaran? Yuk geser lagi ke halaman selanjutnya…