Pembelajaran mesin (ML) adalah studi ilmiah tentang algoritma dan model statistik yang digunakan sistem komputer untuk melakukan tugas tertentu tanpa menggunakan instruksi eksplisit, dengan mengandalkan pola dan inferensi sebagai gantinya. Itu dilihat sebagai bagian dari kecerdasan buatan. Algoritma pembelajaran mesin membangun model matematika berdasarkan data sampel, yang dikenal sebagai "data pelatihan", untuk membuat prediksi atau keputusan tanpa diprogram secara eksplisit untuk melakukan tugas.:2 Algoritma pembelajaran mesin digunakan dalam berbagai aplikasi, seperti sebagai penyaringan email dan visi komputer, di mana sulit atau tidak layak untuk mengembangkan algoritma konvensional untuk melakukan tugas secara efektif.
Pembelajaran mesin terkait erat dengan statistik komputasi, yang berfokus pada membuat prediksi menggunakan komputer. Studi tentang optimasi matematika memberikan metode, teori dan domain aplikasi ke bidang pembelajaran mesin. Penambangan data adalah bidang studi dalam pembelajaran mesin, dan berfokus pada analisis data eksplorasi melalui pembelajaran tanpa pengawasan. Dalam penerapannya di seluruh masalah bisnis, pembelajaran mesin juga disebut sebagai analytics prediktif.
Pembelajaran mesin nama diciptakan di 1959 oleh Arthur Samuel. Tom M. Mitchell memberikan definisi algoritma yang dipelajari dalam bidang pembelajaran mesin yang dikutip secara luas dan lebih formal: "Sebuah program komputer dikatakan belajar dari pengalaman E sehubungan dengan beberapa kelas tugas T dan pengukuran kinerja P jika kinerjanya di tugas di T, yang diukur dengan P, membaik dengan pengalaman E. " Definisi tugas-tugas yang terkait dengan pembelajaran mesin ini menawarkan definisi operasional yang mendasar daripada mendefinisikan bidang dalam hal kognitif. Ini mengikuti proposal Alan Turing dalam makalahnya "Mesin Komputasi dan Kecerdasan", di mana pertanyaan "Dapatkah mesin berpikir?" diganti dengan pertanyaan "Bisakah mesin melakukan apa yang dapat (sebagai entitas yang berpikir) dapat lakukan?". Dalam proposal Turing, berbagai karakteristik yang dapat dimiliki oleh mesin pemikiran dan berbagai implikasi dalam membangunnya diekspos.
Tugas pembelajaran mesin diklasifikasikan ke dalam beberapa kategori besar. Dalam pembelajaran terawasi, algoritma membangun model matematika dari sekumpulan data yang berisi input dan output yang diinginkan. Misalnya, jika tugas menentukan apakah suatu gambar berisi objek tertentu, data pelatihan untuk algoritma pembelajaran yang diawasi akan mencakup gambar dengan dan tanpa objek (input), dan setiap gambar akan memiliki label (output) yang menentukan apakah itu berisi objek. Dalam kasus khusus, input mungkin hanya tersedia sebagian, atau terbatas pada umpan balik khusus. Algoritma pembelajaran semi-diawasi mengembangkan model matematika dari data pelatihan tidak lengkap, di mana sebagian dari input sampel tidak memiliki label.
Algoritma klasifikasi dan algoritma regresi adalah jenis pembelajaran yang diawasi. Algoritma klasifikasi digunakan ketika output dibatasi untuk satu set nilai terbatas. Untuk algoritme klasifikasi yang memfilter email, input akan berupa email masuk, dan hasilnya adalah nama folder tempat file email tersebut. Untuk algoritme yang mengidentifikasi email-email spam, hasilnya adalah prediksi "spam" atau "bukan spam", yang diwakili oleh nilai-nilai Boolean benar dan salah. Algoritma regresi dinamai untuk output kontinu mereka, yang berarti mereka memiliki nilai apa pun dalam suatu rentang. Contoh nilai kontinu adalah suhu, panjang, atau harga suatu objek.
Dalam pembelajaran tanpa pengawasan, algoritma membangun model matematika dari satu set data yang hanya berisi input dan tidak ada label output yang diinginkan. Algoritma pembelajaran tanpa pengawasan digunakan untuk menemukan struktur dalam data, seperti pengelompokan atau pengelompokan poin data. Pembelajaran tanpa pengawasan dapat menemukan pola dalam data, dan dapat mengelompokkan input ke dalam kategori, seperti dalam pembelajaran fitur. Pengurangan dimensi adalah proses mengurangi jumlah "fitur", atau input, dalam satu set data.
Algoritma pembelajaran aktif mengakses output yang diinginkan (label pelatihan) untuk serangkaian input terbatas berdasarkan anggaran, dan mengoptimalkan pilihan input yang akan memperoleh label pelatihan. Ketika digunakan secara interaktif, ini dapat disajikan kepada pengguna manusia untuk pelabelan. Algoritma pembelajaran penguatan diberikan umpan balik dalam bentuk penguatan positif atau negatif dalam lingkungan yang dinamis, dan digunakan dalam kendaraan otonom atau dalam belajar bermain game melawan lawan manusia.:3 Algoritma khusus lainnya dalam pembelajaran mesin termasuk pemodelan topik, di mana program komputer diberikan satu set dokumen bahasa alami dan menemukan dokumen lain yang mencakup topik serupa. Algoritma pembelajaran mesin dapat digunakan untuk menemukan fungsi kepadatan probabilitas yang tidak dapat diobservasi dalam masalah estimasi kepadatan. Algoritma pembelajaran meta mempelajari bias induktif mereka sendiri berdasarkan pengalaman sebelumnya. Dalam perkembangan robotika, algoritma pembelajaran robot menghasilkan urutan pengalaman belajar mereka sendiri, juga dikenal sebagai kurikulum, untuk secara kumulatif memperoleh keterampilan baru melalui eksplorasi yang dipandu sendiri dan interaksi sosial dengan manusia. Robot ini menggunakan mekanisme bimbingan seperti pembelajaran aktif, pematangan, sinergi motorik, dan imitasi.
Arthur Samuel, seorang pelopor Amerika di bidang permainan komputer dan kecerdasan buatan, menciptakan istilah "Pembelajaran Mesin" di 1959 saat berada di IBM. Sebuah buku representatif dari penelitian pembelajaran mesin selama 1960 adalah buku Nilsson tentang Learning Machines, yang sebagian besar berurusan dengan pembelajaran mesin untuk klasifikasi pola. Minat pembelajaran mesin terkait dengan pengenalan pola berlanjut selama 1970s, seperti yang dijelaskan dalam buku Duda dan Hart dalam 1973. Dalam 1981 sebuah laporan diberikan tentang penggunaan strategi pengajaran sehingga jaringan saraf belajar mengenali karakter 40 (huruf 26, angka 10, dan simbol khusus 4) dari terminal komputer. Sebagai upaya ilmiah, pembelajaran mesin tumbuh dari pencarian kecerdasan buatan. Sudah di hari-hari awal AI sebagai disiplin akademis, beberapa peneliti tertarik untuk memiliki mesin belajar dari data. Mereka berusaha untuk mendekati masalah dengan berbagai metode simbolik, serta apa yang kemudian disebut "jaringan saraf"; ini sebagian besar perceptrons dan model lain yang kemudian ditemukan reinvention dari model linear statistik umum. Penalaran probabilistik juga digunakan, terutama dalam diagnosis medis otomatis.:488
Namun, peningkatan penekanan pada pendekatan logis, berbasis pengetahuan menyebabkan keretakan antara AI dan pembelajaran mesin. Sistem probabilistik diganggu oleh masalah teoritis dan praktis dari akuisisi dan representasi data .:488 Oleh 1980, sistem pakar mendominasi AI, dan statistik tidak disukai. Pekerjaan pembelajaran simbolis / berbasis pengetahuan memang berlanjut dalam AI, yang mengarah ke pemrograman logika induktif, tetapi garis penelitian yang lebih statistik sekarang berada di luar bidang AI, dalam pengenalan pola dan pencarian informasi.:708–710; 755 Penelitian jaringan saraf telah ditinggalkan oleh AI dan ilmu komputer sekitar waktu yang sama. Baris ini juga dilanjutkan di luar bidang AI / CS, sebagai "koneksionisme", oleh para peneliti dari disiplin ilmu lain termasuk Hopfield, Rumelhart dan Hinton. Keberhasilan utama mereka datang di pertengahan 1980s dengan penemuan kembali backpropagation.:25
Pembelajaran mesin, ditata ulang sebagai bidang terpisah, mulai berkembang di 1990s. Bidang ini mengubah tujuannya dari mencapai kecerdasan buatan menjadi mengatasi masalah yang sifatnya praktis. Ini mengalihkan fokus dari pendekatan simbolis yang diwarisi dari AI, dan menuju metode dan model yang dipinjam dari statistik dan teori probabilitas. Ini juga mendapat manfaat dari meningkatnya ketersediaan informasi digital, dan kemampuan untuk mendistribusikannya melalui Internet.
Pembelajaran mesin dan penambangan data sering menggunakan metode yang sama dan tumpang tindih secara signifikan, tetapi sementara pembelajaran mesin berfokus pada prediksi, berdasarkan pada properti yang diketahui dipelajari dari data pelatihan, penambangan data berfokus pada penemuan (sebelumnya) properti yang tidak diketahui dalam data (ini adalah langkah analisis penemuan pengetahuan dalam database). Penambangan data menggunakan banyak metode pembelajaran mesin, tetapi dengan tujuan yang berbeda; di sisi lain, pembelajaran mesin juga menggunakan metode penambangan data sebagai "pembelajaran tanpa pengawasan" atau sebagai langkah preprocessing untuk meningkatkan akurasi pelajar. Banyak kebingungan antara dua komunitas penelitian ini (yang sering memiliki konferensi dan jurnal terpisah, ECML PKDD menjadi pengecualian utama) berasal dari asumsi dasar mereka bekerja: dalam pembelajaran mesin, kinerja biasanya dievaluasi sehubungan dengan kemampuan untuk mereproduksi pengetahuan yang diketahui, sedangkan dalam penemuan pengetahuan dan penambangan data (KDD) tugas utama adalah penemuan pengetahuan yang sebelumnya tidak diketahui. Dievaluasi sehubungan dengan pengetahuan yang diketahui, metode yang tidak diinformasikan (tidak diawasi) akan dengan mudah dikalahkan oleh metode yang diawasi lainnya, sedangkan dalam tugas KDD yang khas, metode yang diawasi tidak dapat digunakan karena tidak tersedianya data pelatihan.
Pembelajaran mesin juga memiliki hubungan erat dengan optimisasi: banyak masalah pembelajaran dirumuskan sebagai minimalisasi beberapa fungsi kerugian pada serangkaian contoh pelatihan. Fungsi kerugian menyatakan perbedaan antara prediksi model yang sedang dilatih dan instance masalah aktual (misalnya, dalam klasifikasi, seseorang ingin menetapkan label pada instance, dan model dilatih untuk memprediksi dengan benar label yang telah ditetapkan sebelumnya dari serangkaian contoh). Perbedaan antara dua bidang muncul dari tujuan generalisasi: sementara algoritma optimasi dapat meminimalkan kerugian pada set pelatihan, pembelajaran mesin berkaitan dengan meminimalkan kerugian pada sampel yang tidak terlihat.
Pembelajaran mesin dan statistik adalah bidang yang terkait erat dalam hal metode, tetapi berbeda dalam tujuan utamanya: statistik menarik kesimpulan populasi dari sampel, sementara pembelajaran mesin menemukan pola prediksi yang dapat digeneralisasikan. Menurut Michael I. Jordan, gagasan pembelajaran mesin, mulai dari prinsip metodologis hingga alat teoretis, telah memiliki pra-sejarah panjang dalam statistik. Dia juga menyarankan istilah ilmu data sebagai pengganti untuk memanggil bidang keseluruhan.
Leo Breiman membedakan dua paradigma pemodelan statistik: model data dan model algoritmik, di mana "model algoritme" berarti kurang lebih algoritma pembelajaran mesin seperti Random forest.
Beberapa ahli statistik telah mengadopsi metode dari pembelajaran mesin, yang mengarah ke bidang gabungan yang mereka sebut pembelajaran statistik.
Tujuan inti seorang pelajar adalah untuk menggeneralisasi dari pengalamannya. Generalisasi dalam konteks ini adalah kemampuan mesin pembelajaran untuk melakukan secara akurat pada contoh / tugas baru yang tidak terlihat setelah mengalami kumpulan data pembelajaran. Contoh-contoh pelatihan berasal dari beberapa distribusi probabilitas yang umumnya tidak diketahui (dianggap mewakili ruang kejadian) dan pelajar harus membangun model umum tentang ruang ini yang memungkinkannya untuk menghasilkan prediksi yang cukup akurat dalam kasus-kasus baru.
Analisis komputasi algoritma pembelajaran mesin dan kinerjanya adalah cabang ilmu komputer teoretis yang dikenal sebagai teori pembelajaran komputasi. Karena set pelatihan terbatas dan masa depan tidak pasti, teori pembelajaran biasanya tidak menghasilkan jaminan kinerja algoritma. Sebaliknya, batasan probabilistik pada kinerja cukup umum. Dekomposisi bias-varians adalah salah satu cara untuk mengukur kesalahan generalisasi.
Untuk kinerja terbaik dalam konteks generalisasi, kompleksitas hipotesis harus sesuai dengan kompleksitas fungsi yang mendasari data. Jika hipotesis kurang kompleks dari fungsi, maka model memiliki data yang kurang sesuai. Jika kompleksitas model meningkat dalam respons, maka kesalahan pelatihan berkurang. Tetapi jika hipotesisnya terlalu kompleks, maka modelnya tunduk pada overfitting dan generalisasi akan lebih buruk.
Selain batas kinerja, ahli teori belajar mempelajari kompleksitas waktu dan kelayakan belajar. Dalam teori pembelajaran komputasi, perhitungan dianggap layak jika dapat dilakukan dalam waktu polinomial. Ada dua jenis hasil kompleksitas waktu. Hasil positif menunjukkan bahwa kelas fungsi tertentu dapat dipelajari dalam waktu polinomial. Hasil negatif menunjukkan bahwa kelas-kelas tertentu tidak dapat dipelajari dalam waktu polinomial.
Kembali ke atas