peň

Kunal Kejriwal, autor v Unite.AI - Strana 2 z 5

Spojte sa s nami

Kunal Kejriwal

"Povolaním inžinier, srdcom spisovateľ." Kunal je technický spisovateľ s hlbokou láskou a porozumením AI a ML, ktorý sa venuje zjednodušovaniu zložitých konceptov v týchto oblastiach prostredníctvom svojej pútavej a informatívnej dokumentácie.

Umelá inteligencia2 mesiacmi
AnimateLCM: Urýchlenie animácie prispôsobených modelov difúzie
Za posledných niekoľko rokov dosiahli difúzne modely obrovský úspech a uznanie pre úlohy generovania obrázkov a videa. Najmä modely šírenia videa boli...
Umelá inteligencia3 mesiacmi
YOLO-World: Detekcia objektov otvoreného slovníka v reálnom čase
Detekcia objektov bola základnou výzvou v priemysle počítačového videnia s aplikáciami v robotike, pochopení obrazu, autonómnych vozidlách a rozpoznávaní obrazu. V posledných rokoch,...
Umelá inteligencia3 mesiacmi
InstantID: Vygenerovanie nulového záberu na zachovanie identity v priebehu niekoľkých sekúnd
Technológia generovania obrazu poháňaná AI zaznamenala v posledných rokoch pozoruhodný rast, odkedy veľké modely šírenia textu do obrazu, ako sú DALL-E, GLIDE, Stable Diffusion,...
Umelá inteligencia3 mesiacmi
Mobilní agenti: Autonómny multimodálny agent mobilných zariadení s vizuálnym vnímaním
Príchod multimodálnych veľkých jazykových modelov (MLLM) odštartoval novú éru agentov mobilných zariadení, schopných porozumieť svetu a komunikovať s ním...
Umelá inteligencia3 mesiacmi
Sprievodca úpravami obrázkov na základe pokynov prostredníctvom multimodálnych veľkých jazykových modelov
Nástroje vizuálneho dizajnu a modely jazyka vízie majú široké uplatnenie v multimediálnom priemysle. Napriek výraznému pokroku v posledných rokoch, solídne pochopenie týchto nástrojov...
Umelá inteligencia3 mesiacmi
OLMo: Posilnenie vedy o jazykových modeloch
Vývoj a pokrok jazykových modelov v posledných rokoch poznačil ich prítomnosť takmer všade, nielen vo výskume NLP, ale aj v...
Umelá inteligencia4 mesiacmi
HD-Painter: Textovo vedené maľovanie obrázkov vo vysokom rozlíšení s difúznymi modelmi
Difúzne modely nepochybne spôsobili revolúciu v priemysle AI a ML, pričom ich aplikácie v reálnom čase sa stali neoddeliteľnou súčasťou nášho každodenného života. Po predstavení modelov prevodu textu na obrázok...
Umelá inteligencia4 mesiacmi
TinySAM: Posúvanie hraníc pre segmentový model čohokoľvek
Segmentácia objektov je základnou a kriticky dôležitou oblasťou moderného počítačového videnia. Hrá dôležitú úlohu v aplikáciách vyžadujúcich rozsiahle vizuálne komponenty, ako sú...
Umelá inteligencia4 mesiacmi
OpenVoice: Všestranné okamžité klonovanie hlasu
V syntéze textu na reč (TTS) umožňuje okamžité klonovanie hlasu (IVC) modelu TTS klonovať hlas akéhokoľvek referenčného reproduktora pomocou krátkej zvukovej vzorky bez...
Umelá inteligencia4 mesiacmi
Ladenie vizuálnych pokynov pre porozumenie na úrovni pixelov s Osprey
S nedávnym vylepšením metód ladenia vizuálnych inštrukcií preukázali multimodálne veľké jazykové modely (MLLM) pozoruhodné univerzálne schopnosti videnia jazyka. Tieto schopnosti z nich robia kľúčovú budovu...
Umelá inteligencia4 mesiacmi
Paint3D: Model difúzie bez osvetlenia na generovanie obrázkov
Rýchly vývoj generatívnych modelov AI, najmä hlbokých generatívnych modelov AI, má výrazne pokročilé možnosti v oblasti generovania prirodzeného jazyka, 3D generovania, generovania obrázkov a reči...
Umelá inteligencia4 mesiacmi
Ako funguje 3D rekonštrukcia s jedným zobrazením?
Modely na rekonštrukciu objektov s jedným pohľadom postavené na konvolučných neurónových sieťach tradične vykazovali pozoruhodný výkon v úlohách rekonštrukcie. V posledných rokoch sa objavila jednopohľadová 3D rekonštrukcia...
Umelá inteligencia5 mesiacmi
PowerInfer: Rýchle poskytovanie veľkého jazykového modelu s GPU spotrebiteľskej úrovne
Vďaka svojim výnimočným schopnostiam tvorby obsahu sú teraz generatívne veľké jazykové modely v popredí revolúcie AI s neustálym úsilím o zlepšenie ich...
Umelá inteligencia5 mesiacmi
Fretka: Odporučte a uzemnite s akoukoľvek zrnitosťou
Umožnenie priestorového porozumenia v modeloch učenia sa jazyka vízie zostáva hlavnou výskumnou výzvou. Toto pochopenie podporuje dve kľúčové schopnosti: uzemnenie a odkazovanie. Odkazovanie umožňuje modelu...
Umelá inteligencia5 mesiacmi
Splatter Image: Ultra-rýchla 3D rekonštrukcia s jedným pohľadom
Rekonštrukcia 3D objektov s jedným pohľadom pomocou konvolučných sietí preukázala pozoruhodné schopnosti. Jednopohľadové 3D rekonštrukčné modely generujú 3D model akéhokoľvek objektu pomocou jedného obrázku...

Ďalšie príspevky

Strana 2 z 5123 4 5