Kecerdasan buatan
Dari Siri ke ReALM: Perjalanan Apple Menuju Asisten Suara yang Lebih Pintar
Sejak peluncuran Siri pada 2011, Apple secara konsisten berada di garis depan inovasi asisten suara, menyesuaikan diri dengan kebutuhan pengguna global. Pengenalan ReALM menandai titik signifikan dalam perjalanan ini, menawarkan gambaran tentang peran asisten suara yang berkembang dalam interaksi kita dengan perangkat. Artikel ini memeriksa dampak ReALM pada Siri dan arah potensial untuk asisten suara di masa depan.
Munculnya Asisten Suara: Genesis Siri
Perjalanan dimulai ketika Apple mengintegrasikan Siri, sistem kecerdasan buatan yang canggih, ke dalam perangkatnya, mengubah cara kita berinteraksi dengan teknologi. Berasal dari teknologi yang dikembangkan oleh SRI International, Siri menjadi standar emas untuk asisten yang diaktifkan oleh suara. Pengguna dapat melakukan tugas seperti pencarian internet dan penjadwalan melalui perintah suara sederhana, mendorong batas antarmuka konversasi dan memicu perlombaan kompetitif di pasar asisten suara.
Siri 2.0: Era Baru Asisten Suara
Ketika Apple mempersiapkan diri untuk peluncuran iOS 18 di Konferensi Pengembang Dunia (WWDC) pada Juni 2024, antisipasi membangun dalam komunitas teknologi untuk apa yang diharapkan menjadi evolusi signifikan dari Siri. Fase baru ini, yang disebut Siri 2.0, berjanji untuk membawa kemajuan kecerdasan buatan generatif ke garis depan, berpotensi mengubah Siri menjadi asisten virtual yang lebih canggih. Sementara peningkatan pasti masih dirahasiakan, dunia teknologi bergetar dengan prospek Siri mencapai ketinggian baru dalam kecerdasan konversasi dan interaksi pengguna yang dipersonalisasi, memanfaatkan model pembelajaran bahasa canggih seperti yang terlihat di teknologi seperti ChatGPT. Dalam konteks ini, pengenalan ReALM, model bahasa kompak, menunjukkan peningkatan potensial yang Siri 2.0 mungkin tawarkan kepada penggunanya. Bagian berikut akan membahas peran ReALM dan pengaruh potensialnya sebagai langkah penting dalam kemajuan Siri yang berkelanjutan.
Memperkenalkan ReALM
ReALM, yang singkatan dari Reference Resolution As Language Modeling, adalah model bahasa khusus yang terampil dalam memecahkan referensi kontekstual dan ambigu dalam percakapan, seperti “itu” atau “ini”. Ia menonjol karena kemampuannya untuk memproses referensi konversasi dan visual, mengubahnya menjadi format teks. Kemampuan ini memungkinkan ReALM untuk menafsirkan dan berinteraksi dengan tata letak layar dan elemen secara mulus dalam dialog, fitur kritis untuk menangani kueri dengan akurat dalam konteks yang bergantung pada visual.
Arsitektur ReALM, mulai dari versi yang lebih kecil seperti ReALM-80M hingga yang lebih besar seperti ReALM-3B, dioptimalkan untuk efisiensi komputasi untuk integrasi ke perangkat mobile. Efisiensi ini memungkinkan kinerja konsisten dengan penggunaan daya yang berkurang dan beban sumber daya pemrosesan yang lebih rendah, penting untuk memperpanjang umur baterai dan menyediakan waktu respon yang cepat di berbagai perangkat.
Selain itu, desain ReALM mengakomodasi pembaruan moduler, memfasilitasi integrasi mulus dari kemajuan terbaru dalam resolusi referensi. Pendekatan moduler ini tidak hanya meningkatkan kemampuan adaptasi dan fleksibilitas model, tetapi juga memastikan viabilitas dan efektivitas jangka panjangnya, memungkinkan ReALM untuk memenuhi kebutuhan pengguna yang berkembang dan standar teknologi di berbagai spektrum perangkat.
ReALM vs. Model Bahasa
Sementara model bahasa tradisional seperti GPT-3.5 terutama memproses teks, ReALM mengambil rute multimodal, serupa dengan model seperti Gemini, dengan bekerja pada teks dan visual. Tidak seperti fungsionalitas yang lebih luas dari GPT-3.5 dan Gemini, yang menangani tugas seperti generasi teks, pemahaman, dan pembuatan gambar, ReALM khusus ditujukan untuk memecahkan konteks konversasi dan visual. Namun, tidak seperti model multimodal seperti Gemini yang memproses data visual dan teks secara langsung, ReALM menerjemahkan konten visual layar ke teks, mengannotasi entitas dan detail spasialnya. Konversi ini memungkinkan ReALM untuk menafsirkan konten layar dalam cara tekstual, memfasilitasi identifikasi dan pemahaman referensi layar yang lebih akurat.
Bagaimana ReALM Dapat Mengubah Siri?
ReALM dapat secara signifikan meningkatkan kemampuan Siri, mengubahnya menjadi asisten yang lebih intuitif dan sadar konteks. Berikut adalah bagaimana ReALM dapat mempengaruhi:
- Pemahaman Kontekstual yang Lebih Baik: ReALM berspesialisasi dalam memecahkan referensi ambigu dalam percakapan, berpotensi sangat meningkatkan kemampuan Siri untuk memahami kueri yang bergantung pada konteks. Ini akan memungkinkan pengguna untuk berinteraksi dengan Siri lebih alami, karena Siri dapat memahami referensi seperti “putar lagu itu lagi” atau “telepon dia” tanpa detail tambahan.
- Interaksi Layar yang Ditingkatkan: Dengan keahliannya dalam menafsirkan tata letak layar dan elemen dalam dialog, ReALM dapat memungkinkan Siri untuk berintegrasi lebih mulus dengan konten visual perangkat. Siri kemudian dapat menjalankan perintah yang terkait dengan item layar, seperti “buka aplikasi di sebelah Mail” atau “gulir ke bawah di halaman ini”, memperluas utilitasnya dalam berbagai tugas.
- Personalisasi: Dengan mempelajari interaksi sebelumnya, ReALM dapat meningkatkan kemampuan Siri untuk menawarkan respons yang dipersonalisasi dan adaptif. Seiring waktu, Siri mungkin dapat memprediksi kebutuhan dan preferensi pengguna, menyarankan atau memulai tindakan berdasarkan perilaku sebelumnya dan pemahaman kontekstual, serupa dengan asisten pribadi yang berpengetahuan.
- Aksesibilitas yang Ditingkatkan: Kemampuan ReALM untuk memahami referensi dan konteks dapat secara signifikan mendukung aksesibilitas, membuat teknologi lebih inklusif. Siri, yang ditenagai oleh ReALM, dapat menafsirkan perintah yang tidak jelas atau sebagian dengan akurat, memfasilitasi penggunaan perangkat yang lebih mudah dan alami bagi orang dengan disabilitas fisik atau visual.
ReALM dan Strategi AI Apple
Peluncuran ReALM mencerminkan aspek kunci dari strategi AI Apple, menekankan kecerdasan pada perangkat. Pengembangan ini selaras dengan tren industri yang lebih luas dari komputasi edge, di mana data diproses secara lokal pada perangkat, mengurangi latensi, menghemat bandwidth, dan mengamankan data pengguna pada perangkat itu sendiri.
Proyek ReALM juga menunjukkan tujuan AI yang lebih luas dari Apple, yang tidak hanya fokus pada eksekusi perintah tetapi juga pada pemahaman dan prediksi kebutuhan pengguna yang lebih dalam. ReALM merepresentasikan langkah menuju inovasi masa depan di mana perangkat dapat menyediakan dukungan yang lebih dipersonalisasi dan prediktif, dipandu oleh pemahaman mendalam tentang kebiasaan dan preferensi pengguna.
Intinya
Pengembangan Apple dari Siri ke ReALM menyoroti evolusi berkelanjutan dalam teknologi asisten suara, dengan fokus pada pemahaman konteks yang ditingkatkan dan interaksi pengguna. ReALM menandai pergeseran menuju asisten suara yang lebih pintar, dipersonalisasi, dan peduli privasi, selaras dengan tren industri komputasi edge untuk pemrosesan dan keamanan perangkat yang ditingkatkan.












