Alat Pembelajaran Mesin sumber Terbuka Teratas

Google, Facebook, IBM, Microsoft, dan raksasa teknologi lainnya termasuk pengembang terkenal telah mengambil langkah gesit menuju Pembelajaran Mesin dan Kecerdasan Buatan untuk mewujudkan impian manusia dalam menciptakan engine yang sangat cerdas. Dan untuk mempersenjatai orang lain untuk mengambil bagian dalam perjalanan membangun engine yang sadar untuk masa depan, ada cukup banyak alat open source yang digunakan oleh raksasa teknologi untuk mengintegrasikan kecerdasan buatan ke dalam aplikasi.

12 Alat atau Kerangka Pembelajaran Mesin Sumber Terbuka 2020

Namun, kecerdasan buatan dan pembelajaran engine berada pada tahap yang sangat awal, jadi jangan berharap sesuatu seperti film fiksi ilmiah, namun pengembang yang menyukai AI dan ML dapat menggunakan perangkat lunak sumber terbuka yang akan kita diskusikan untuk menulis aplikasi untuk pengenalan suara yang lebih baik, Pengenalan gambar, Bantuan suara, mengembangkan jaringan saraf, dan banyak lagi… Artikel ini memberikan ikhtisar tentang beberapa solusi sumber terbuka yang paling populer.

TensorFlow

Kerangka kerja pengembangan AI TensorFlow adalah inovasi dari Tim Otak Google yang menggunakan pustaka sumber terbuka untuk pembelajaran engine. Pengembang dapat menggunakan ekosistem alat dan sumber daya komunitas yang fleksibel untuk mengembangkan aplikasi modern yang didukung ML. Ini juga termasuk perpustakaan CUDA Deep Neural Network.

Untuk membangun dan melatih model, ia menggunakan API Keras tingkat tinggi dan menawarkan beberapa tingkat abstraksi sehingga seseorang dapat memilih yang tepat untuk proyeknya.

Selanjutnya, untuk perangkat seluler, Google pada tahun 2017 telah merilis Tensor Flow lite untuk menggunakan model pembelajaran mendalam di smartphone dan di aplikasi mereka. Ini menjadi semakin populer, dan beberapa perangkat sekarang bahkan menggunakan chip akselerator khusus untuk aplikasi yang sesuai. Untuk lebih meningkatkan useran perpustakaan pembelajaran engine Tensorflow. Untuk tugas pelatihan ML besar, Distribution Strategy API tersedia untuk pelatihan terdistribusi pada konfigurasi perangkat keras yang berbeda tanpa mengubah definisi model.

Untuk menginstalnya diperlukan pip, jika sudah memiliki pip maka berikut adalah perintah untuk Tensorflow versi CPU dan GPU:

pip instal tensorflow

Pelajari lebih lanjut tentang penginstalan TensorFlow.

Caffe- Kerangka Pembelajaran Mendalam

Caffe adalah proyek sumber terbuka arsitektur C ++ / CUDA murni yang mendukung interface command line, Python, dan MATLAB; Anda dapat beralih langsung antara CPU dan GPU. Model dan pengoptimalan terkait diberikan dalam teks, bukan kode. Caffe memberikan definisi model, pengaturan pengoptimalan, dan bobot yang telah dilatih sebelumnya, sehingga mudah untuk segera memulai.

Caffe digunakan dalam kombinasi dengan cuDNN untuk menguji model AlexNet. Hanya membutuhkan waktu 1,17 ms untuk memproses setiap gambar di K40. Anda dapat menggunakan berbagai jenis lapisan yang disediakan oleh Caffe untuk menentukan model Anda sendiri.

Caffe dapat digunakan, misalnya, untuk pengenalan suara, pengenalan dan klasifikasi gambar atau untuk pengembangan bahasa alami di perangkat AI.

Lihat halaman Github proyek ini.

Anda dapat menginstal di Ubuntu untuk CPU Sudo apt install caffe-cpu dan untuk GPU Sudo apt install caffe-cuda

PyTorch

PyTorch adalah kerangka kerja pembelajaran engine sumber terbuka lainnya. Ini termasuk TorchScript, kompiler yang mengubah model PyTorch menjadi grafik yang diketik secara statis. Ilmuwan data kemudian dapat melakukan pengoptimalan dan penyesuaian dalam mode bersemangat dan dengan demikian secara bertahap mengonversi model mereka ke TorchScript. Ini dapat digunakan untuk mengimplementasikan arsitektur jaringan seperti RNN, CNN, LSTM, dll dan algoritma tingkat tinggi lainnya.

PyTorch telah mengetahui format Open Neural Network eXchange (ONNX) untuk mengekspor model terlatih atau tidak terlatih ke format standar untuk beberapa waktu. ONNX memungkinkan pertukaran antara kerangka kerja yang berbeda dan, misalnya, menyederhanakan transfer model dari PyTorch ke TensorFlow dan sebaliknya. Selain itu, koneksi ke TensorBoard itu termasuk perpustakaan berbasis Python berdasarkan Toch seperti torchaudio, torchtext, torchvision dan banyak lagi.

Ketahui lebih banyak tentang PyTorch di situs webnya dan GitHub

Microsoft CNTK- Perangkat pembelajaran engine sumber terbuka

Computational Network Toolkit (CNTK) Microsoft pada awalnya dikembangkan untuk membuat kemajuan lebih cepat di bidang pengenalan suara. Oleh karena itu, perangkat pembelajaran mendalam digunakan secara internal untuk meningkatkan pengenalan suara asisten digital Cortana. Microsoft kemudian merilis perangkat lunak di GitHub di bawah lisensi sumber terbuka. Jadi, siapa pun sekarang dapat mencobanya. CNTK juga merupakan salah satu alat pembelajaran mendalam pertama yang mendukung format Open Neural Network Exchange ONNX.

Microsoft Cognitive Toolkit mewakili jaringan saraf sebagai serangkaian langkah komputasi melalui grafik terarah dengan bantuan Network Description Language (NDL).

Ini fleksibel dan mendukung C++, C#, Java, dan Python.

Situs Web dan Tautan Github

scikit-learn – pembelajaran engine dengan Python

Scikit-learn adalah kerangka kerja pembelajaran engine berbasis perpustakaan Python lainnya yang berasal dari SciPy Toolkit. Ia menggunakan paket seperti NumPy, SciPy, atau Matplotlib untuk menulis program matematika, ilmiah atau statistik dengan Python. Ini dapat digunakan untuk penambangan data dan analisis data.

Ini juga open-source dan tersedia untuk tujuan komersial. Kita dapat menggunakannya untuk membangun aplikasi untuk berbagai kategori seperti tujuan klasifikasi untuk mengidentifikasi kategori mana yang dimiliki suatu objek; dalam memprediksi atribut bernilai berkelanjutan yang terkait dengan suatu objek; pengelompokan otomatis objek serupa ke dalam set; membandingkan, memvalidasi dan memilih parameter dan model; Mengubah data input seperti teks untuk digunakan dengan algoritme pembelajaran engine, bot AI, dan lainnya…

Jika Anda ingin bekerja dengan pembelajaran engine dan kecerdasan buatan berbasis Python, Anda harus melihat kemungkinan pembelajaran scikit. Penyedia juga menyediakan berbagai tutorial yang dapat digunakan pengembang untuk bekerja dengan Python dan scikit-learn.

Situs web dan GitHub

Apache Mahout – Pembelajaran Mesin untuk Big Data

Mahout adalah proyek sumber terbuka di bawah Apache Software Foundation (ASF) berdasarkan Apache Hadoop dan MapReduce. Ini menyediakan beberapa implementasi algoritme klasik yang dapat diskalakan di bidang pembelajaran engine untuk membantu pengembang dalam membuat aplikasi pintar dengan lebih mudah dan cepat. Mahout mencakup banyak implementasi, termasuk pengelompokan, klasifikasi, pemfilteran, dan penambangan data. Selain itu, Mahout dapat diperluas secara efektif ke cloud dengan menggunakan perpustakaan Apache Hadoop.

Situs web

Spark MLlib

Apache Spark adalah engine komputasi yang cepat dan serba guna yang dirancang untuk pemrosesan data skala besar. Spark adalah kerangka kerja paralel tujuan umum seperti Hadoop MapReduce yang bersumber terbuka dari lab AMP UC Berkeley (Lab AMP UC Berkeley). Spark memiliki keunggulan Hadoop MapReduce; tetapi tidak seperti MapReduce, output antara pekerjaan dapat disimpan dalam memori, sehingga tidak perlu lagi membaca dan menulis HDFS, sehingga Spark dapat lebih cocok untuk penambangan data dan algoritma pembelajaran engine yang membutuhkan algoritma MapReduce iteratif.

MLlib (Machine Learning lib) adalah library implementasi Spark untuk algoritme pembelajaran engine yang umum digunakan. Ini juga mencakup tes terkait dan generator data. MLlib saat ini mendukung 4 masalah pembelajaran engine yang umum: klasifikasi, regresi, pengelompokan, dan pemfilteran kolaboratif. Spark MLlib dapat digunakan dengan Java, Scala, Python dan R. MLlib menggunakan API Spark dan berinteraksi dengan NumPy dengan Python. NumPy adalah pustaka Python yang dapat digunakan untuk menangani vektor, matriks, dan array multidimensi…

Situs web

Keras: Pustaka Pembelajaran Jauh Python

Keras adalah API jaringan saraf tingkat tinggi, ditulis dengan Python, mampu berjalan di atas TensorFlow, CNTK, Theano, atau MXNet. Sejak rilis awal pada Maret 2015, telah mendapatkan dukungan untuk kemudahan useran dan kesederhanaan sintaksis, memfasilitasi pengembangan yang cepat. Ini didukung oleh Google.

Ini tidak seperti kerangka pembelajaran engine ujung ke ujung lainnya dan berfungsi sebagai interface. Ini menggunakan abstraksi tingkat tinggi, dengan demikian, mudah untuk menangani konfigurasi jaringan saraf tanpa memberikan banyak perhatian pada jenis kerangka kerja yang sedang dikerjakannya.

Situs web dan GitHub

Theano

Theano didasarkan pada Python dan merupakan perpustakaan yang baik dalam memproses array multi-dimensi (mirip dengan NumPy dalam hal ini). Itu dirancang untuk melakukan operasi algoritma jaringan saraf skala besar dalam pembelajaran mendalam. Pengembang awal Theano adalah Yoshua Bengio dan Ian Goodfellow. Karena latar belakang akademis mereka, itu pada awalnya dirancang untuk penelitian akademis. Jika digabungkan dengan library deep learning lainnya, akan sangat cocok untuk eksplorasi data.

Theano dapat lebih dipahami sebagai kompiler untuk ekspresi matematika: tentukan hasil yang Anda inginkan dalam bahasa simbolis, dan kerangka kerja akan mengkompilasi program Anda untuk berjalan secara efisien pada GPU atau CPU.

Untuk waktu yang lama di masa lalu, Theano telah menjadi standar industri untuk pengembangan dan penelitian pembelajaran mendalam. Dibandingkan dengan perpustakaan pembelajaran yang mendalam, ini lebih seperti platform penelitian. Anda perlu melakukan banyak pekerjaan dari bawah untuk membuat model yang Anda butuhkan, yang berarti sangat fleksibel.

Tidak peduli seberapa bagus alatnya, mereka telah ditarik dari panggung sejarah. Tak terkecuali Theano, yang pernah memenangkan hati civitas akademika.

Namun, pengembang utama kerangka pembelajaran mendalam ini telah menghentikan kontribusinya pada tahun 2017, namun komunitasnya masih aktif mendukung proyek yang dapat dilihat dengan jelas di Github.

Situs web dan Github

Oryx- Kerangka pembelajaran mendalam

Oryx juga merupakan kerangka kerja yang menggunakan data dari Kafka dan Spark untuk membantu user Hadoop membangun model untuk pembelajaran engine skala besar secara real-time. Data dapat diproses secara real-time dari berbagai sumber.

Ini adalah kerangka kerja untuk membangun aplikasi tetapi juga termasuk paket, aplikasi ujung ke ujung untuk penyaringan kolaboratif, klasifikasi, regresi dan pengelompokan.

Situs web dan Github

Kerangka Pembelajaran Mesin Accord.NET

Kerangka kerja pembelajaran engine Accord.NET berbasis.NET yang menyediakan berbagai kemungkinan, dapat digunakan untuk pembelajaran engine, statistik, audio dan sinyal, metode Kernel, uji hipotesis, Kecerdasan buatan, pengelompokan, visi komputer, dan pemrosesan gambar untuk useran komersial di Microsoft Windows, Xamarin, Unity3D, Linux atau seluler.

Ini dapat membuktikan pilihan yang baik untuk menangani optimasi numerik jaringan saraf tiruan dan bahkan visualisasi.

Untuk informasi lebih lanjut kunjungi: Accord.net atau Github

MLPack: perpustakaan pembelajaran engine C++

mlpack adalah untuk mereka yang mencari platform pembelajaran engine yang fleksibel dan ramah memori yang ditulis dalam C++. Ini cepat dengan binding Python dan kelas C++ yang kemudian dapat diintegrasikan ke dalam solusi pembelajaran engine skala besar. Nah, dalam hal dokumentasi, user bisa kesulitan.

Github dan Tautan situs web

Dikirim oleh Penulis Guest: Tejas Arya

Artikel lainnya:

  • Tren edutech teratas untuk menguasai ruang belajar virtual India pada tahun 2020
  • Pembelajaran Mesin dan Kecerdasan Buatan. Persamaan dan perbedaannya