Digital Marketing RWD Indonesia

Minggu ini di AI: Teknologi besar mempertaruhkan miliaran alat pembelajaran mesin

Mengikuti industri yang bergerak cepat seperti AI adalah hal yang sulit. Jadi sampai AI dapat melakukannya untuk Anda, inilah rangkuman praktis dari cerita minggu lalu di dunia pembelajaran mesin, bersama dengan penelitian dan eksperimen penting yang tidak kami bahas sendiri.

Jika belum jelas, lanskap kompetitif di AI — khususnya subbidang yang dikenal sebagai AI generatif — sangat panas. Dan semakin panas. Minggu ini, Dropbox meluncurkan dana ventura korporat pertamanya, Dropbox Ventures, yang menurut perusahaan akan berfokus pada perusahaan rintisan yang membangun produk bertenaga AI yang “membentuk masa depan pekerjaan”. Tidak mau kalah, AWS meluncurkan program senilai $100 juta untuk mendanai inisiatif AI generatif yang dipelopori oleh mitra dan pelanggannya.

Ada banyak uang yang dihabiskan di ruang AI, pastinya. Salesforce Ventures, divisi VC Salesforce, berencana menggelontorkan $500 juta ke perusahaan rintisan yang mengembangkan teknologi AI generatif. Hari kerja baru-baru ini menambahkan $250 juta ke dana VC yang ada secara khusus untuk mendukung AI dan startup pembelajaran mesin. Dan Accenture dan PwC telah mengumumkan bahwa mereka berencana untuk menginvestasikan masing-masing $3 miliar dan $1 miliar di AI.

Tapi orang bertanya-tanya apakah uang adalah solusi untuk tantangan luar biasa di bidang AI.

Dalam panel yang mencerahkan selama konferensi Bloomberg di San Francisco minggu ini, Meredith Whittaker, presiden aplikasi perpesanan aman Signal, menyatakan bahwa teknologi yang mendukung beberapa aplikasi AI paling populer saat ini menjadi sangat buram. Dia mencontohkan seseorang yang masuk ke bank dan meminta pinjaman.

⭐ Baca juga :  LlamaIndex menambahkan data pribadi ke model bahasa besar

Orang itu dapat ditolak untuk pinjaman dan “tidak tahu bahwa ada sistem di belakang yang mungkin didukung oleh Microsoft API yang ditentukan, berdasarkan memo media sosial, bahwa saya tidak layak kredit,” kata Whittaker. “Saya tidak akan pernah tahu (karena) tidak ada mekanisme bagi saya untuk mengetahui hal ini.”

Bukan modal yang jadi masalah. Sebaliknya, itu adalah hierarki kekuasaan saat ini, kata Whittaker.

“Saya sudah berada di meja seperti, 15 tahun, 20 tahun. saya sudah pernah di meja. Berada di meja tanpa kekuatan bukanlah apa-apa, ”lanjutnya.

Tentu saja, mencapai perubahan struktural jauh lebih sulit daripada mencari-cari uang – terutama ketika perubahan struktural tidak selalu menguntungkan kekuatan yang ada. Dan Whittaker memperingatkan apa yang mungkin terjadi jika tidak ada cukup penolakan.

Saat kemajuan dalam AI semakin cepat, dampak sosial juga semakin cepat, dan kami akan terus menuju “jalan yang dipenuhi sensasi menuju AI,” katanya, “di mana kekuatan itu mengakar dan dinaturalisasi dengan kedok kecerdasan dan kami diawasi untuk titik (memiliki) hak pilihan yang sangat, sangat kecil atas kehidupan individu dan kolektif kita.”

⭐ Baca juga :  Kebijakan teknologi AS harus mengimbangi inovasi AI

Itu sebaiknya memberikan industri jeda. Entah itu sebenarnya akan adalah masalah lain. Itu mungkin sesuatu yang akan kita dengar didiskusikan ketika dia tampil di Disrupt pada bulan September.

Berikut adalah berita utama AI lainnya dari beberapa hari terakhir:

  • AI DeepMind mengontrol robot: DeepMind mengatakan bahwa mereka telah mengembangkan model AI, yang disebut RoboCat, yang dapat melakukan berbagai tugas di berbagai model lengan robot. Itu saja tidak terlalu baru. Tetapi DeepMind mengklaim bahwa model tersebut adalah yang pertama yang dapat menyelesaikan dan beradaptasi dengan banyak tugas dan melakukannya dengan menggunakan robot dunia nyata yang berbeda.
  • Robot belajar dari YouTube: Berbicara tentang robot, asisten profesor CMU Robotics Institute Deepak Pathak minggu ini memamerkan VRB (Vision-Robotics Bridge), sistem AI yang dirancang untuk melatih sistem robotik dengan menonton rekaman manusia. Robot mengawasi beberapa informasi penting, termasuk titik kontak dan lintasan, dan kemudian mencoba menjalankan tugas.
  • Otter masuk ke game chatbot: Layanan transkripsi otomatis Berang-berang mengumumkan chatbot bertenaga AI baru minggu ini yang memungkinkan peserta mengajukan pertanyaan selama dan setelah rapat serta membantu mereka berkolaborasi dengan rekan satu tim.
  • UE menyerukan regulasi AI: Regulator Eropa berada di persimpangan tentang bagaimana AI akan diatur — dan pada akhirnya digunakan secara komersial dan nonkomersial — di wilayah tersebut. Minggu ini, kelompok konsumen terbesar UE, Organisasi Konsumen Eropa (BEUC), ditimbang dengan posisinya sendiri: Berhentilah berlambat-lambat, dan “luncurkan penyelidikan mendesak terhadap risiko AI generatif” sekarang, katanya.
  • Vimeo meluncurkan fitur bertenaga AI: Minggu ini, Vimeo mengumumkan serangkaian alat bertenaga AI yang dirancang untuk membantu pengguna membuat skrip, merekam rekaman menggunakan teleprompter bawaan, dan menghapus jeda panjang dan disfluensi yang tidak diinginkan seperti “ahs” dan “ums” dari rekaman.
  • Modal untuk suara sintetik: ElevenLab, platform bertenaga AI viral untuk menciptakan suara sintetik, telah mengumpulkan $19 juta dalam putaran pendanaan baru. ElevenLabs mengambil tenaga agak cepat setelah diluncurkan pada akhir Januari. Tapi publisitasnya tidak selalu positif – terutama sekali aktor yang buruk mulai mengeksploitasi platform untuk tujuan mereka sendiri.
  • Mengubah audio menjadi teks: Gladia, startup AI Prancis, telah meluncurkan platform yang memanfaatkan model transkripsi Whisper OpenAI untuk — melalui API — mengubah audio apa pun menjadi teks hampir secara real time. Gladia berjanji dapat menyalin satu jam audio seharga $0,61, dengan proses transkripsi memakan waktu sekitar 60 detik.
  • Harness menganut AI generatif: Memanfaatkan, sebuah startup yang membuat toolkit untuk membantu pengembang beroperasi lebih efisien, minggu ini menyuntikkan platformnya dengan sedikit AI. Sekarang, Harness dapat secara otomatis menyelesaikan kegagalan pembangunan dan penerapan, menemukan dan memperbaiki kerentanan keamanan, dan memberikan saran untuk mengendalikan biaya cloud.
⭐ Baca juga :  Deal Dive: Mengapa startup ini memilih untuk menjual dirinya sendiri daripada menaikkan Seri A

Pembelajaran mesin lainnya

Minggu ini adalah CVPR di Vancouver, Kanada, dan saya berharap saya bisa pergi karena pembicaraan dan makalah terlihat sangat menarik. Jika Anda hanya dapat menonton satu, periksa Keynote Yejin Choi tentang kemungkinan, ketidakmungkinan, dan paradoks AI.

Kredit Gambar: CVPR/YouTube

Profesor UW dan penerima hibah MacArthur Genius pertama-tama membahas beberapa batasan tak terduga dari model paling mumpuni saat ini. Secara khusus, GPT-4 sangat buruk dalam perkalian. Ia gagal menemukan produk dari dua angka tiga digit dengan benar pada tingkat yang mengejutkan, meskipun dengan sedikit bujukan ia dapat melakukannya dengan benar 95% setiap saat. Mengapa penting bahwa model bahasa tidak bisa mengerjakan matematika, Anda bertanya? Karena seluruh pasar AI saat ini didasarkan pada gagasan bahwa model bahasa menggeneralisasi dengan baik untuk banyak tugas menarik, termasuk hal-hal seperti melakukan pajak atau akuntansi. Maksud Choi adalah bahwa kita harus mencari batasan AI dan bekerja ke dalam, bukan sebaliknya, karena ini memberi tahu kita lebih banyak tentang kemampuan mereka.

⭐ Baca juga :  Spline, alat desain tanpa kode untuk membuat aset 3D, menghasilkan $15 juta

Bagian lain dari ceramahnya sama-sama menarik dan menggugah pikiran. Anda dapat menonton semuanya di sini.

Rod Brooks, diperkenalkan sebagai “pembunuh hype”, memberikan sejarah yang menarik tentang beberapa konsep inti pembelajaran mesin — konsep yang hanya tampak baru karena kebanyakan orang yang menerapkannya tidak ada saat ditemukan! Kembali ke masa lalu, dia menyentuh McCulloch, Minsky, bahkan Hebb — dan menunjukkan bagaimana ide-ide itu tetap relevan jauh di luar waktu mereka. Ini adalah pengingat yang bermanfaat bahwa pembelajaran mesin adalah bidang yang berdiri di pundak para raksasa sejak era pascaperang.

Banyak, banyak makalah yang diajukan dan dipresentasikan di CVPR, dan sangat reduktif untuk hanya melihat pemenang penghargaan, tetapi ini adalah kumpulan berita, bukan tinjauan literatur yang komprehensif. Jadi, inilah yang menurut para juri di konferensi paling menarik:

Kredit Gambar: AI2

VISPROG, dari para peneliti di AI2, adalah semacam meta-model yang melakukan tugas manipulasi visual yang rumit menggunakan kotak alat kode serbaguna. Katakanlah Anda memiliki gambar beruang grizzly di atas rerumputan (seperti yang digambarkan) – Anda dapat mengatakannya untuk “mengganti beruang dengan beruang kutub di salju” dan mulai bekerja. Ini mengidentifikasi bagian-bagian gambar, memisahkannya secara visual, mencari dan menemukan atau menghasilkan pengganti yang sesuai, dan menjahit semuanya kembali dengan cerdas, tanpa perlu dorongan lebih lanjut dari pihak pengguna. Antarmuka “meningkatkan” Blade Runner mulai terlihat benar-benar pejalan kaki. Dan itu hanyalah salah satu dari sekian banyak kemampuannya.

⭐ Baca juga :  Google mulai membuka akses ke kemampuan AI generatif barunya di Penelusuran

“Pengemudian otonom yang berorientasi pada perencanaan,” dari kelompok riset multi-institusi Cina, berupaya menyatukan berbagai bagian dari pendekatan yang agak sedikit demi sedikit yang telah kami lakukan pada mobil yang dapat mengemudi sendiri. Biasanya ada semacam proses bertahap “persepsi, prediksi, dan perencanaan”, yang masing-masing mungkin memiliki sejumlah sub-tugas (seperti menyegmentasikan orang, mengidentifikasi hambatan, dll). Model mereka mencoba untuk menempatkan semua ini dalam satu model, seperti model multi-modal yang kita lihat yang dapat menggunakan teks, audio, atau gambar sebagai input dan output. Demikian pula model ini dalam beberapa hal menyederhanakan saling ketergantungan kompleks dari tumpukan penggerak otonom modern.

DynIBaR menunjukkan metode interaksi berkualitas tinggi dan kuat dengan video menggunakan “Bidang Radiasi Neural dinamis”, atau NeRF. Pemahaman yang mendalam tentang objek dalam video memungkinkan hal-hal seperti stabilisasi, gerakan dolly, dan hal-hal lain yang biasanya tidak Anda harapkan setelah video direkam. Sekali lagi… “tingkatkan.” Ini jelas merupakan hal yang Apple pekerjakan untuk Anda, dan kemudian dipuji di WWDC berikutnya.

⭐ Baca juga :  Arm meluncurkan chip baru untuk kinerja smartphone yang lebih cepat selama Computex

DreamBooth Anda mungkin ingat dari awal tahun ini ketika halaman proyek ditayangkan. Ini adalah sistem terbaik untuk, tidak ada jalan lain untuk mengatakannya, membuat deepfake. Tentu saja sangat berharga dan kuat untuk melakukan operasi gambar semacam ini, belum lagi menyenangkan, dan peneliti seperti yang ada di Google bekerja untuk membuatnya lebih mulus dan realistis. Konsekuensi… nanti, mungkin.

Penghargaan makalah siswa terbaik diberikan kepada metode untuk membandingkan dan mencocokkan jaring, atau awan titik 3D – terus terang terlalu teknis bagi saya untuk mencoba menjelaskannya, tetapi ini adalah kemampuan penting untuk persepsi dunia nyata dan peningkatan dipersilakan. Lihat kertas di sini untuk contoh dan info lebih lanjut.

Hanya dua nugget lagi: Intel pamer model yang menarik ini, LDM3D, untuk menghasilkan citra 3D 360 seperti lingkungan virtual. Jadi saat Anda berada di metaverse dan Anda mengatakan “letakkan kami di reruntuhan yang ditumbuhi tanaman di hutan”, itu hanya menciptakan yang baru sesuai permintaan.

Dan Meta dirilis alat sintesis suara yang disebut Voicebox itu sangat bagus dalam mengekstraksi fitur suara dan mereplikasinya, bahkan saat masukannya tidak bersih. Biasanya untuk replikasi suara Anda memerlukan jumlah dan variasi rekaman suara bersih yang bagus, tetapi Voicebox melakukannya lebih baik daripada banyak lainnya, dengan data lebih sedikit (pikirkan seperti 2 detik). Untungnya mereka menyimpan jin ini di dalam botol untuk saat ini. Bagi mereka yang merasa perlu mengkloning suaranya, lihat Acapela.

⭐ Baca juga :  Startup mungkin memiliki ruang untuk berinovasi karena penyedia perusahaan memikirkan cara menentukan harga alat AI

*******

Source: techcrunch.com
FullbloggerBlog Internet Marketing And Online Business

Artikel Terkait :

Leave a Comment

Digital Marketing RWD Indonesia
Home
About Me
Kontak
Tools
Cari