Minggu, 08 Mei 2016

Review Jurnal "Combining heterogeneous classifiers for relational databases"

Berikut merupakan pembahasan Jurnal mengenai relational database dengan jurnal yang berjudul "Menggabungkan Pengklasifikasi Heterogen untuk Database Relasional"

Abstrak

Penggunaan praktis dari pembelajaran mesin semakin penting strategis dalam perusahaan mencari bisnis intelijen. Namun, sebagian besar data perusahaan didistribusikan di beberapa database relasional dengan Expert-dirancang skema. Menggunakan teknik pembelajaran mesin tabel tunggal tradisional lebih data tersebut tidak hanya dikenakan hukuman komputasi untuk mengkonversi ke bentuk datar (mega-bergabung), bahkan manusia yang ditentukan informasi semantik hadir dalam hubungan yang hilang. Dalam tulisan ini, kami menyajikan praktis, dua-fase algoritma meta-klasifikasi hirarkis untuk database relasional dengan membagi semantik dan menaklukkan pendekatan. Kami mengusulkan, teknik agregasi prediksi rekursif lebih pengklasifikasi heterogen diterapkan pada tabel database individu. Algoritma yang diusulkan dievaluasi pada tiga dataset beragam, yaitu TPCH, PKDD dan UCI tolok ukur dan menunjukkan penurunan yang cukup besar dalam waktu klasifikasi tanpa kehilangan akurasi prediksi.

Kami mengusulkan, algoritma klasifikasi heterogen praktis untuk database relasional, menggunakan 2-fase pendekatan meta-klasifikasi dengan mekanisme agregasi baru. Premis utama kami adalah bahwa sejak kebanyakan database yang dirancang dengan baik oleh para ahli, kita perlu menggunakan ini semantik implisit. Algoritma yang disajikan memiliki heterogen klasifikasi dan metode menerapkannya pada hubungan praktis database yang digunakan dalam kehidupan nyata. Untuk membuat ini mungkin, kami telah disajikan teknik agregasi rekursif baru untuk menyusun heterogen pengklasifikasi diterapkan di meja individu. Kami telah menunjukkan baik peningkatan waktu pelatihan klasifikasi untuk TPCH dan membuktikan bahwa tidak ada kehilangan akurasi karena agregasi. Kami juga menunjukkan manfaat dari pendekatan kami atas upaya sebelumnya. Sebagai langkah berikutnya, kita akan ingin memperpanjang teknik ini untuk memasukkan auto-pemilihan kanan classifier di tingkat meja. Kedua, akurasi klasifikasi dapat ditingkatkan dengan menghilangkan beberapa meja non-kontribusi. Untuk ini, kita berencana untuk mengaitkan metrik entropi dengan tabel database individu dan pilih subgraph yang tepat dari Bergabunglah Grafik yang meminimalkan kehilangan informasi.