Terhubung dengan kami

Bersatu.AI

Kunal Kejriwal

"Seorang insinyur berdasarkan profesi, seorang penulis dengan hati". Kunal adalah seorang penulis teknis dengan kecintaan mendalam & pemahaman AI dan ML, berdedikasi untuk menyederhanakan konsep kompleks di bidang ini melalui dokumentasinya yang menarik dan informatif.

Kecerdasan Buatanbulan 11 lalu

SHOW-O: Sebuah Transformator Tunggal yang Menyatukan Pemahaman dan Pembangkitan Multimoda

Kemajuan signifikan dalam model bahasa besar (LLM) telah menginspirasi pengembangan model bahasa besar multimodal (MLLM). Upaya MLLM awal, seperti LLaVA, MiniGPT-4, dan InstructBLIP,...
Kecerdasan Buatanbulan 12 lalu

EAGLE: Menjelajahi Ruang Desain untuk Model Bahasa Besar Multimodal dengan Campuran Encoder

Kemampuan untuk menafsirkan informasi visual yang kompleks secara akurat merupakan fokus penting dari model bahasa besar multimoda (MLLM). Penelitian terbaru menunjukkan bahwa persepsi visual yang ditingkatkan secara signifikan...
Kecerdasan Buatanbulan 12 lalu

Sapiens: Fondasi untuk Model Penglihatan Manusia

Keberhasilan luar biasa dari prapelatihan skala besar yang diikuti oleh penyempurnaan tugas khusus untuk pemodelan bahasa telah menetapkan pendekatan ini sebagai praktik standar. Demikian pula, metode visi komputer...
Kecerdasan Buatan1 tahun lalu

LongWriter: Melepaskan 10,000+ Pembuatan Kata dari LLM Konteks Panjang

Model bahasa besar (LLM) konteks panjang saat ini dapat memproses masukan hingga 100,000 token, namun mereka kesulitan untuk menghasilkan keluaran yang bahkan melebihi 2,000...
Kecerdasan Buatan1 tahun lalu

SGLang: Eksekusi Program Model Bahasa Terstruktur yang Efisien

Model bahasa besar (LLM) semakin banyak digunakan untuk tugas-tugas kompleks yang memerlukan panggilan beberapa generasi, teknik dorongan tingkat lanjut, aliran kontrol, dan input/output terstruktur. Namun, sistem yang efisien untuk...
Kecerdasan Buatan1 tahun lalu

MINT-1T: Menskalakan Data Multimodal Sumber Terbuka sebesar 10x

Melatih model multimodal besar (LMM) frontier memerlukan kumpulan data berskala besar dengan urutan gambar dan teks yang disisipkan dalam bentuk bebas. Meskipun LMM sumber terbuka telah berkembang pesat, ada...
Kecerdasan Buatan1 tahun lalu

DIAMOND: Detail Visual Penting dalam Atari dan Difusi untuk Pemodelan Dunia

Pada tahun 2018, ide pembelajaran penguatan dalam konteks model dunia jaringan saraf pertama kali diperkenalkan, dan segera,...
Kecerdasan Buatan1 tahun lalu

In-Paint3D: Pembuatan Gambar menggunakan Model Difusi Tanpa Petir

Munculnya model AI generatif yang mendalam telah secara signifikan mempercepat pengembangan AI dengan kemampuan luar biasa dalam pembuatan bahasa alami, pembuatan 3D, pembuatan gambar, dan...
Kecerdasan Buatan1 tahun lalu

MARKLLM: Perangkat Sumber Terbuka untuk LLM Watermarking

Watermarking LLM, yang mengintegrasikan sinyal yang tidak terlihat namun dapat dideteksi dalam keluaran model untuk mengidentifikasi teks yang dihasilkan oleh LLM, sangat penting untuk mencegah penyalahgunaan bahasa besar...
Kecerdasan Buatan1 tahun lalu

Kemenag: Pemutakhiran Tingkat Tinggi untuk Penyempurnaan Parameter yang Efisien

Karena kinerjanya yang kuat dan penerapan yang luas jika dibandingkan dengan metode lain, LoRA atau Adaptasi Tingkat Rendah adalah salah satu PEFT atau Parameter...
Kecerdasan Buatan1 tahun lalu

LightAutoML: Solusi AutoML untuk Ekosistem Jasa Keuangan Besar

Meskipun AutoML mulai populer beberapa tahun yang lalu, karya awal AutoML dimulai pada awal tahun 90an ketika para ilmuwan menerbitkan makalah pertama...
Kecerdasan Buatan1 tahun lalu

LLaVA-UHD: LMM yang Memahami Rasio Aspek Apa Pun dan Gambar Resolusi Tinggi

Kemajuan dan kemajuan Model Bahasa Besar baru-baru ini telah mengalami peningkatan yang signifikan dalam kemampuan penalaran, pemahaman, dan interaksi bahasa penglihatan. Kerangka kerja modern mencapai hal ini dengan...
Kecerdasan Buatan1 tahun lalu

Uni-MoE: Menskalakan LLM Multimodal Terpadu dengan Campuran Pakar

Kemajuan terkini dalam arsitektur dan kinerja Model Bahasa Besar Multimodal atau MLLM telah menyoroti pentingnya data dan model yang dapat diskalakan untuk meningkatkan...
Kecerdasan Buatan1 tahun lalu

MambaOut: Apakah Kita Benar-Benar Membutuhkan Mamba untuk Penglihatan?

Dalam kerangka pembelajaran mesin dan kecerdasan buatan modern, transformator adalah salah satu komponen yang paling banyak digunakan di berbagai domain termasuk seri GPT, dan BERT di...
Kecerdasan Buatan1 tahun lalu

CameraCtrl: Mengaktifkan Kontrol Kamera untuk Pembuatan Teks-ke-Video

Kerangka kerja terbaru yang mencoba membuat model difusi pemanfaatan teks ke video atau T2V untuk menambah stabilitas dalam proses pelatihan mereka, dan Model Difusi Video, salah satu...

Menampilkan lebih banyak

Halaman 1 dari 612 3 4 5 6