Open Dataset Indonesia dan Global untuk Data Mining dengan Machine Learning di Python

3 mins read.
Open Dataset Indonesia dan Global untuk Data Mining dengan Machine Learning di Python

Dataset adalah bagian terpenting sebelum melakukan pengolahan data ataupun analisis terhadap data yang akan dicari sesuatu tujuan tertentu sehingga dengan suatu proses tertentu dengan motode tertentu dapat dihasilkan sebuah informasi yang sangat berguna dari data sets tersebut.</p>

Faktanya setiap hari kita menghasilkan berjuta data dan akhirnya dari banyaknya data tersebut hanya menjadi sampah jika tanpa diolah menghasilkan sebuah informasi baru.

Sekarang Zamannya Big Data yang artinya data mulai disebar luaskan dengan Open Data. Oleh karena itu mulailah muncul pekerjaan baru yang mulai diminati yaitu Data Scientists and Machine Learning Engineers.

Apa itu Data ?

Data adalah fakta atau bagian dari fakta yang mengandung arti yang dihubungkan dengan kenyataan melalui angka, huruf, kata, gambar, atau simbol yang menunjukkan kondisi atau situasi dan “dataset” atau kumpulan data merujuk data yang terepresentasikan dalam bentuk tabular maupun non-tabular yang pada dasarnya dalam situs dapat diunduh, divisualisasikan, ditautkan, atau diproses kembali dengan berbagai metode digital lainnya.

Apa itu Open Data?

Data terbuka atau open data adalah data yang memiliki kaidah “terbuka”, dapat digunakan secara bebas, dimanfaatkan, dan didistribusikan kembali oleh siapapun tanpa syarat kecuali dengan mengutip sumber, pemilik data.

Definisi ini adalah definisi umum yang disadur dari Open Data Handbook yang dikeluarkan oleh OKFN (Open Knowledge Foundation Network). Anda bisa merujuk pada definisi lengkapnya di sini: Open Data Handbook

Berikut ada beberapa referensi dataset yang dapat kamu gunakan untuk menjelajahi data sehingga kamu bisa menemukan informasi yang baru.

Tidak hanya itu, Dataset ini berguna dalam belajar mengolah data dengan mengimplementasikan Machine Learning dan Kamu dapat menggunakan python, karena python itu mudah.

Open Dataset

berikut listnya “Open Dataset Indonesia dan Global untuk Data Mining dengan Machine Learning di Python” :

Kaggle

Kaggle adalah salah satu web untuk komunitas online para data scientis dan machine learning. kaggale dengan gratis membagikan data sets dan kita dapat dengan mudah menjelajahi data-data untuk pembelajaran machine learning, AI dan di kaggle ada sebuah kompetisi untuk pemecahan solusi dengan data science. Faktanya pada delapan maret 2017 kaggle diakuisisi dan kini milik google. Lihat : Datasets Kaggle

Satu Data Indonesia

Satu data Indonesia atau data.go.id adalah sebuah portal resmi dari pemerintah Indonesia terkait dengan data terbuka Indonesia yang terdiri atas dan tidak terbatas hanya Kementerian, lembaga pemerintahan, pemerintahan daerah, dan semua instansi lain yang terkait yang menghasilkan data yang berhubungan dengan Indonesia.

Data World

Data.world adalah sebuahs web katalog pintar untuk data dan analisis. kamu dapat mencari data-data diseluruh dunia. dan lihat keterangannya ada status untuk data seperti datanya terbuka atau tidak. Lihat : Datasets Data World Indonesia

Knoema

Knoema adalah sebuah web untuk pengambilan keputusan. kerennya di Knoema adalah dapat memvisualisasikan data yang ada dengan menentukan sendiri hal-hal yang diperlukan. Terdapat beberapa produk untuk akses gratis, profesional dan enterprise. kamu harus daftar dan login terlebih dahulu untuk lebih jelasnya pada web knoema ini. Lihat : Knoema Datasets Indonesia

Datahub.io

Datahub adalah web tentang publikasi data. kekurangannya adalah masih sedikit tersedianya data disini untuk akses yang gratis. Lihat : Datahub.io Datasets Indonesia

Information & Computer Science, Universitas of California (UCI)

UCI adalah sebuah kampus di irvine, california. Pada UCI terdapat fakultas Informasi dan Ilmu Komputer yang memberikan datasets secara gratis untuk penelitian dan pembelajaran pada bidang data science dan machine learning. Lihat : Datasets UCI Machine Learning Repository

Data.Gov

Data.gov adalah web referensi untuk pencarian data dalam penelitian, pengembangan dan memvisualisasikan data. Data.gov dikelola oleh U.S. General Services Administration, United States of America. Lihat : Datasets Data.gov Indonesia

Demikian hasil ulasan dari saya irfnrdh, semoga bermanfaat ^_^

comments powered by Disqus