Jasa Pembuatan Python | Cluster Analysis Unsupervised Machine Learning Python
Yang akan Anda pelajari
-
Pahami algoritme K-Means reguler
-
Pahami dan sebutkan kelemahan K-Means Clustering
-
Pahami algoritma Soft atau Fuzzy K-Means Clustering
-
Menerapkan Soft K-Means Clustering dalam Kode
-
Memahami Hierarchical Clustering
-
Jelaskan secara algoritme bagaimana Hierarchical Agglomerative Clustering bekerja
-
Menerapkan library Hierarchical Clustering Scipy ke data
-
Memahami cara membaca dendrogram
-
Pahami berbagai metrik jarak yang digunakan dalam pengelompokan
-
Pahami perbedaan antara tautan tunggal, tautan lengkap, tautan lingkungan, dan UPGMA
-
Memahami model campuran Gaussian dan cara menggunakannya untuk estimasi densitas
-
Tulis GMM dalam kode Python
-
Jelaskan kapan GMM setara dengan K-Means Clustering
-
Jelaskan algoritma ekspektasi-maksimalisasi
-
Pahami bagaimana GMM mengatasi beberapa kelemahan K-Means
-
Pahami masalah Singular Covariance dan cara memperbaikinya
Persyaratan
-
Ketahui cara membuat kode dengan Python dan Numpy
-
Instal Numpy dan Scipy
-
Aritmatika matriks, probabilitas
Deskripsi
Analisis klaster adalah inti dari pembelajaran mesin tanpa pengawasan dan ilmu data .
Ini sangat berguna untuk penambangan data dan data besar karena secara otomatis menemukan pola dalam data, tanpa memerlukan label, tidak seperti pembelajaran mesin yang diawasi.
Dalam lingkungan dunia nyata, Anda dapat membayangkan bahwa robot atau kecerdasan buatan tidak selalu memiliki akses ke jawaban yang optimal, atau mungkin tidak ada jawaban benar yang optimal. Anda ingin robot itu dapat menjelajahi dunianya sendiri, dan mempelajari berbagai hal hanya dengan mencari pola.
Apakah Anda pernah bertanya-tanya bagaimana kami mendapatkan data yang kami gunakan dalam algoritme pembelajaran mesin yang diawasi?
Kami sepertinya selalu memiliki CSV atau tabel yang bagus, lengkap dengan X dan Y yang sesuai.
Jika Anda belum terlibat dalam memperoleh data sendiri, Anda mungkin tidak memikirkan hal ini, tetapi seseorang harus membuat data ini!
“Y” itu harus datang dari suatu tempat, dan seringkali melibatkan kerja manual.
Terkadang, Anda tidak memiliki akses ke informasi semacam ini atau tidak mungkin atau mahal untuk mendapatkannya.
Tapi Anda masih ingin memiliki gambaran tentang struktur data. Jika Anda melakukan analitik data, mengotomatiskan pengenalan pola dalam data Anda akan sangat berharga.
Di sinilah pembelajaran mesin tanpa pengawasan berperan.
Dalam kursus ini pertama kita akan berbicara tentang clustering. Di sinilah alih-alih melatih label, kami mencoba membuat label sendiri! Kami akan melakukan ini dengan mengelompokkan data yang mirip.
Ada 2 metode pengelompokan yang akan kita bicarakan: k-means clustering dan hierarchical clustering .
Selanjutnya, karena dalam pembelajaran mesin kami suka berbicara tentang distribusi probabilitas, kami akan masuk ke model campuran Gaussian dan estimasi kepadatan kernel , di mana kami berbicara tentang cara “mempelajari” distribusi probabilitas dari sekumpulan data.
Satu fakta menarik adalah bahwa dalam kondisi tertentu, model campuran Gaussian dan pengelompokan k-means persis sama! Kami akan membuktikan bagaimana hal ini terjadi.
Semua algoritme yang akan kita bicarakan dalam kursus ini adalah pokok dalam pembelajaran mesin dan ilmu data, jadi jika Anda ingin mengetahui cara menemukan pola secara otomatis dalam data Anda dengan penambangan data dan ekstraksi pola, tanpa perlu seseorang melakukan pekerjaan manual untuk beri label data itu, maka kursus ini untuk Anda.
Semua materi untuk kursus ini GRATIS. Anda dapat mengunduh dan menginstal Python, Numpy, dan Scipy dengan perintah sederhana di Windows, Linux, atau Mac .
Untuk siapa kursus ini:
- Pelajar dan profesional yang tertarik dengan pembelajaran mesin dan ilmu data
- Orang-orang yang menginginkan pengenalan pembelajaran mesin tanpa pengawasan dan analisis klaster
- Orang yang ingin tahu cara menulis kode pengelompokan mereka sendiri
- Profesional yang tertarik dengan penambangan data kumpulan data besar untuk mencari pola secara otomatis