Skip to content

This repository is made for my book: "Data Mining and Big Data Analytics". It contains all the codes and the dataset used in the book.

Notifications You must be signed in to change notification settings

ferryastika/Data-Mining-and-Big-Data-Analytics-Book

 
 

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

93 Commits
 
 
 
 
 
 
 
 

Repository files navigation

Data-Mining-and-Big-Data-Analytics-Book

Selamat datang di halaman resmi buku "Data Mining & Big Data Analytics: Teori dan Implementasi Menggunakan Python & Apache Spark". Bagi yang belum memiliki bukunya, bisa didapatkan di sini. Halaman resmi di Github ini ditujukan untuk:

  1. Memuat semua update informasi terkait buku ini, seperti jika ada materi tambahan, revisi jika ditemukan kesalahan, bonus video, dst. Informasi tersebut juga akan kami emailkan jika diperlukan di kemudian hari. Bagi pembeli buku yang belum mengisikan emailnya, dimohon berkenan mengisikannya di sini.
  2. Memuat semua code dan dataset yang digunakan dalam buku ini. Adapun code dan dataset tersebut dapat di download di folder/repository ini (lihat di atas).

Penting!

Kami mendapatkan laporan dari beberapa pembeli jika ada 1,2 halaman yang tercetak kosong. Kami sudah melaporkan dan melakukan komplain ke penerbit, tetapi tidak ditanggapi dengan serius. Untuk cetakan-cetakan berikutnya, kami akan mempertimbangkan penerbit yang lebih terpercaya. Adapun solusi yang kami tawarkan, jika cetakan buku yang rekan-rekan terima terdapat halaman yang kosong, kami akan segera kirimkan softfile untuk halaman tersebut. Mohon dapat melaporkan ke: [email protected], dilengkapi dengan foto halaman yang kosong. Semoga ini tidak mengurangi semangat kita untuk terus belajar dan berkarya. Terima kasih :)

Software yang dibutuhkan

Berikut adalah software-software yang dibutuhkan dalam buku ini. Sebenarnya, di dalam bukunya sudah ditunjukkan satu per satu cara mendapatkan softwarenya dari website resminya masing-masing. Akan tetapi, akan kami rekap di sini, sekiranya dapat membantu dan memudahkan.

  1. Anaconda [klik di sini]
  2. IDE PyCharm [klik di sini]
  3. JDK-8 [klik di sini]
  4. Apache Spark [klik di sini]. Adapun versi yang digunakan dalam buku ini adalah versi 2.2.0.
  5. Software Scala [klik di sini]
  6. File binary Hadoop [klik di sini]

Video-video terkait

Berikut ini adalah video-video yang terkait dengan buku ini.

  1. Video bonus tutorial pemrograman Python [klik di sini]
  2. Tutorial cara menginstall Python (menggunakan Anaconda dan PyCharm) [klik di sini]
  3. Tutorial install Apache Spark [klik di sini]
  4. Tutorial membuat klaster komputer untuk Apache Spark [klik di sini]
  5. Penjelasan tentang konvolusi dan korelasi pada image [klik di sini]

Daftar isi buku dan sampel isi buku

Bagi yang belum memiliki bukunya, dapat melihat daftar isi dari bukunya di sini dan sampel isi bukunya di sini.

Catatan untuk file coding

Semua file coding yang ada di dalam repository ini sesuai dengan yang telah dijelaskan di dalam bukunya. Adapun terdapat satu pengecualian untuk implementasi dari metode EM Clustering, yakni menggunakan bahasa pemrograman C++ sesuai dengan alasan yang telah dijelaskan di dalam bukunya. Pada implementasi EM Clustering tersebut, digunakan library OpenCV yang diperlukan untuk men-scaling data gambar MNIST. Bagi yang belum familiar mengenai cara melakukan setting library OpenCV, dapat melihat panduan video berikut. [klik di sini]

Revisi

Tiada gading yang tak retak. Begitu pula buku kami pada edisi cetakan pertama ini. Pertama-tama, kami mengucapkan terima kasih atas segala pihak yang telah memberikan saran dan masukan terkait buku ini. Semoga buku ini dapat bermanfaat dan dapat menjadi referensi bagi siapa saja yang ingin mendalami bidang-bidang yang berkaitan dengan: data mining, data science, big data dan machine learning. Hingga saat ini, berikut adalah beberapa revisi minor dalam buku ini, pada edisi cetakan pertama.

  1. Di halaman 278 sub-bab 17.4 tertulis "...yang memberikan nilai varian yang tinggi antar kelasnya dan memberikan nilai varian yang tinggi dalam kelasnya". Yang benar adalah "...yang memberikan nilai varian yang tinggi antar kelasnya dan memberikan nilai varian yang rendah dalam kelasnya".

Kontak lebih lanjut

Jika para pembaca sekalian menemukan kesulitan, kesalahan; ingin memberikan saran/masukan, atau ada pertanyaan lainnya, dapat mengontak via email berikut: [email protected]. Email tersebut dikelola dan akan dibalas langsung oleh penulis buku.

About

This repository is made for my book: "Data Mining and Big Data Analytics". It contains all the codes and the dataset used in the book.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages

  • Jupyter Notebook 57.1%
  • Python 37.5%
  • C++ 5.4%