Persepsi dalam Artificial Intelligence

Definisi AI didasarkan pada sifat masalah yang ditanganinya, yaitu yang mana manusia saat ini mengungguli komputer. Juga, itu termasuk tugas-tugas kognitif. Bagian dari dua aspek tersebut, ada banyak tugas lain (yang juga jatuh dalam bidang ini) seperti ketrampilan dasar dan keterampilan motorik di mana hewan yang lebih rendah memiliki kemampuan yang fenomenal dibandingkan dengan komputer.

Persepsi melibatkan menafsirkan pemandangan, suara, bau dan sentuhan. Tindakan meliputi kemampuan untuk negatif melalui dunia dan memanipulasi objek. Jika kita ingin membangun robot yang hidup di dunia, kita harus memahami proses ini. Gambar 1 menunjukkan desain untuk robot otonom lengkap. Sebagian besar AI hanya peduli dengan kognisi, kita hanya akan menambahkan sensor dan efektor kepada mereka. Tetapi masalah dalam persepsi dan tindakan substansial dalam hak mereka sendiri dan sedang ditangani oleh para peneliti di bidang robotika.

Di masa lalu, robotika dan AI sebagian besar merupakan upaya independen, dan mereka telah mengembangkan teknik yang berbeda untuk memecahkan berbagai masalah. Salah satu perbedaan utama antara program AI dan robot adalah bahwa program AI biasanya beroperasi di dunia yang dirangsang komputer, robot harus beroperasi di dunia fisik. Misalnya, dalam kasus gerakan catur, program AI dapat mencari jutaan simpul di pohon permainan tanpa harus merasakan atau menyentuh apa pun di dunia nyata. Robot permainan catur yang lengkap, di sisi lain, harus mampu menggenggam keping, mengartikan posisi papan secara visual, dan melakukan sejumlah aksi lainnya. Perbedaan antara dunia nyata dan dunia simulasi memiliki beberapa implikasi seperti yang diberikan di bawah ini:

Gambar 1 : Design untuk Robot Otonom

Desain untuk Robot Autonomous:

  1. Input ke program AI adalah simbolik dalam bentuk (contoh: kalimat bahasa Inggris yang diketik), sedangkan input ke robot biasanya merupakan sinyal analog, seperti gambar video dua dimensi atau bentuk gelombang wicara.
  2. Robot memerlukan perangkat keras khusus untuk memahami dan mempengaruhi dunia, sementara program AI hanya memerlukan komputer untuk tujuan umum.
  3. Sensor robot tidak akurat, dan efektornya terbatas dalam presisi.
  4. banyak robot harus bereaksi secara real time. Sebuah pesawat tempur robot, misalnya, tidak mampu mencari secara optimal atau menghentikan pemantauan dunia selama pengumpulan data LISP.
  5. dunia nyata tidak dapat diprediksi, dinamis, dan tidak pasti. permasalahannya tidak dapat berharap untuk mempertahankan deskripsi dunia yang benar dan lengkap. Ini berarti bahwa robot harus mempertimbangkan trade-off antara merencanakan dan melaksanakan rencana. Pertukaran ini memiliki beberapa aspek. Untuk satu hal robot mungkin tidak memiliki informasi yang cukup tentang dunia untuk itu untuk melakukan perencanaan yang berguna. Dalam hal ini, pertama-tama harus terlibat dalam aktivitas pengumpulan informasi. Selanjutnya, setelah mulai menjalankan rencana, robot harus terus menerus melakukan tindakannya. Jika hasilnya tidak terduga, maka perencanaan ulang mungkin diperlukan.
  6. Karena robot harus beroperasi di dunia nyata, penelusuran dan pelacakan kembali dapat menjadi mahal.

Beberapa tahun terakhir telah melihat upaya untuk mengintegrasikan penelitian dalam robotika dan AI. Ide lama hanya sensor dan efektor untuk program AI yang ada telah memberi jalan untuk memikirkan kembali serius algoritma AI dasar dalam terang masalah yang terlibat dalam berurusan dengan dunia fisik. Penelitian dalam robotika juga dipengaruhi oleh teknik AI, karena alasan tentang tujuan dan rencana sangat penting untuk memetakan persepsi ke tindakan yang tepat.

Pada titik ini orang mungkin bertanya apakah robot fisik diperlukan untuk tujuan penelitian. Karena program AI saat ini sudah beroperasi di dunia simulasi, mengapa tidak membuat simulasi yang lebih realistis, yang lebih baik meniru dunia nyata? Simulator semacam itu memang ada. Ada beberapa keuntungan menggunakan dunia simulasi: Percobaan dapat dilakukan dengan sangat cepat, kondisi dapat dengan mudah direplikasi, program dapat kembali ke keadaan sebelumnya tanpa biaya, dan masukan sensorik dapat diperlakukan tidak ada bagian mekanik yang rapuh dan mahal. Kelemahan utama untuk simulator adalah mencari tahu faktor-faktor mana yang harus dibangun. Pengalaman dengan robot nyata terus-menerus untuk mengekspos masalah sulit yang tidak muncul bahkan pada simulator tercanggih sekalipun. dunia ternyata – tidak mengherankan menjadi model yang sangat baik dari dirinya sendiri, dan yang sudah tersedia.

Kami merasakan lingkungan kami melalui banyak saluran: penglihatan, suara, sentuhan, bau, rasa. Banyak hewan memproses kemampuan persepsi yang sama ini, dan yang lainnya juga dapat memantau saluran yang sepenuhnya berbeda. Robot juga dapat memproses informasi visual dan pendengaran, dan mereka juga dapat dilengkapi dengan sensor yang lebih eksotis. Seperti laser rangefinders, speedometers dan radar.

Dua saluran sensorik yang sangat penting bagi manusia adalah penglihatan dan bahasa lisan. Melalui dua fakultas inilah kita mengumpulkan hampir semua pengetahuan yang mendorong perilaku pemecahan masalah kita.

Visi: Visi mesin yang akurat membuka dunia baru aplikasi komputer. Aplikasi ini termasuk navigasi robot bergerak, analisis tugas manufaktur kompleks dari citra satelit, dan pemrosesan gambar medis. Pertanyaannya adalah bagaimana kita dapat mengubah gambar kamera mentah menjadi informasi yang bermanfaat tentang dunia.

Kamera Video menyediakan komputer dengan gambar yang diwakili sebagai kisi tingkat intensitas dua dimensi. Setiap elemen grid, atau piksel, dapat menyimpan sedikit informasi (yaitu, hitam / putih) atau banyak bit (mungkin pengukuran intensitas dan informasi warna yang bernilai nyata). Gambar visual terdiri dari ribuan piksel. Hal-hal apa yang mungkin ingin kita lakukan dengan gambar seperti itu? Berikut adalah empat operasi, dalam rangka meningkatkan kerumitan:

  1. Pemrosesan Sinyal: – Meningkatkan citra, baik untuk konsumsi manusia atau sebagai masukan ke program lain.
  2. Analisis Pengukuran: – Untuk gambar yang mengandung satu objek, tentukan luas dua dimensi dari objek yang digambarkan.
  3. Pattern Recognition: – Untuk gambar single-object, calssifying objek ke dalam kategori yang diambil dari sejumlah kemungkinan terbatas.
  4. Pemahaman gambar: – Untuk gambar yang berisi banyak objek, mencari objek dalam gambar, mengklasifikasikannya, dan membangun model tiga dimensi dari pemandangan.

Ada algoritma yang melakukan dua operasi pertama. Operasi ketiga, pengenalan pola bervariasi dalam kesulitannya. Adalah mungkin untuk mengklasifikasikan objek dua dimensi (2-D), seperti bagian-bagian mesin yang menuruni ban berjalan, tetapi mengelompokkan objek 3-D lebih sulit karena banyaknya kemungkinan orientasi untuk setiap objek. Pemahaman gambar adalah tugas visual yang paling sulit, dan telah menjadi subjek studi paling banyak di AI. Sementara beberapa aspek pemahaman gambar mengurangi ke analisis pengukuran dan pengenalan pola, seluruh masalah tetap tidak terpecahkan, karena kesulitan yang meliputi hal-hal berikut:

Ada algoritma yang melakukan dua operasi pertama. Operasi ketiga, pengenalan pola bervariasi dalam kesulitannya. Adalah mungkin untuk mengklasifikasikan objek dua dimensi (2-D), seperti bagian-bagian mesin yang menuruni ban berjalan, tetapi mengelompokkan objek 3-D lebih sulit karena banyaknya kemungkinan orientasi untuk setiap objek. Pemahaman gambar adalah tugas visual yang paling sulit, dan telah menjadi subjek studi paling banyak di AI. Sementara beberapa aspek pemahaman gambar mengurangi ke analisis pengukuran dan pengenalan pola, seluruh masalah tetap tidak terpecahkan, karena kesulitan yang meliputi hal-hal berikut:

  1. Gambar adalah dua dimensi, sementara dunia tiga dimensi, beberapa informasi selalu hilang ketika gambar dibuat.
  2. Satu gambar mungkin berisi beberapa objek, dan beberapa objek dapat menutup sebagian yang lain.
  3. Nilai satu piksel dipengaruhi oleh banyak fenomena yang berbeda, termasuk warna objek, sumber cahaya, angale dan jarak kamera, polusi di udara, dll. Sulit untuk menguraikannya. efek.

Akibatnya, gambar 2-D sangat ambigu. Mengingat satu gambar, kita bisa membuat sejumlah dunia 3-D yang akan menghasilkan gambar. tidak mungkin untuk memutuskan apa yang 3-D padat itu harus menggambarkan. Untuk menentukan interpretasi yang paling mungkin dari suatu adegan, kita harus menerapkan beberapa jenis pengetahuan.

Speech Recognition: Sistem pemahaman Bahasa Alami biasanya menerima masukan yang diketik, tetapi untuk sejumlah aplikasi ini tidak dapat diterima. Bahasa lisan adalah bentuk komunikasi yang lebih alami di banyak antarmuka manusia-komputer. Sistem pengenalan ucapan telah tersedia untuk beberapa waktu, tetapi keterbatasannya telah mencegah penggunaan yang luas. Di bawah ini lima masalah desain utama dalam sistem bicara. Isu-isu ini juga menyediakan dimensi di mana sistem dapat dibandingkan satu sama lain.

Posted on: February 21, 2018, by :

Leave a Reply

Your email address will not be published.