Connect with us

Myslitelé

Proč je problém dat v zemědělství problémem AI — a co mohou rostliny udělat proti tomu

mm mm

Každých pár let se v sektoru zemědělských technologií objeví nová stříbrná kulka. V roce 2013 šlo o big data, která měly transformovat řízení farem — akvizice Climate Corporation firmou Monsanto za 1,1 miliardy dolarů měla zahájit novou éru prediktivního zemědělství. O několik let později měly AI poháněné skleníky přinést druhou zelenou revoluci. Poté přišel slib robotického sklízení, poté generativní AI agronomové a nyní agentic AI, která má údajně činit rozhodnutí autonomně za farmáře po celém světě.

Tento vzorec by měl být známý: každá vlna hype staví na té předchozí, a přesto AgTech investice do venture kapitálu pokračují v zklamání, a transformační výsledky zůstávají nedostupné. Proč? Ne proto, že inženýři nejsou talentovaní, nebo protože základní AI věda je vadná. Problém sahá hlouběji do samotných dat, na kterých závisí zemědělské AI systémy.

Dokud fundamentálně nepřemýšlíme o tom, jaká data sbíráme a jak je sbíráme, zůstane zemědělská AI revoluce slibem rather než skutečností.

Tři důvody, proč zemědělská AI stále selhává

Zemědělství je jedním z nejnesnesitelnějších prostředí pro vývoj AI. Výzvy nejsou triviálními inženýrskými problémy — jsou strukturální. Zde je to, co dělá tento domén tak odolný vůči obvyklému AI playbook:

Smůlové smyčky, které se pohybují rychlostí biologie, ne software.

Moderní AI systémy jsou navrženy kolem rychlé iterace. Softwarový model lze přeškolit za hodiny; klinická studie trvá roky. Zemědělství se nachází blíže k druhému. Inovace Normana Borlauga, která byla částečně oceněna Nobelovou cenou v 70. letech, spočívala částečně ve zkrácení cyklů chovu plodin z jednou na dvakrát ročně. Dnes nejmodernější semenářské společnosti zvládnou tři cykly ročně; stále však velmi pomalu podle standardů AI. Když vaše ground truth přichází se sklizní, časové osy pro zlepšení modelu se táhnou přes roky, ne sprinty.

Zemědělská komplexita porušuje obvyklá předpoklad AI

Zeptejte se zdánlivě jednoduché otázky — kolik dusíku by mělo toto pole dostat? — a proměnné se množí rychle: složení půdy, předchozí rotace plodin, historie patogenů, mikroklima, historie hospodářských zvířat sahající desetiletí zpět, zadržování vody, praktiky orbě a desítky dalších interagujících faktorů. Výzkum o omezeních AI rozumu ukazuje, že přesnost modelu se zhroutí ve vysokodimenzionálních prostředích. Zemědělství není jen vysokodimenzionální; je to jedno z nejvyšších dimenzionálních domén, které lidé kdy snažili modelovat.

Každá farma je svým vlastním edge případem.

Neexistuje sférický kráva v reálném zemědělství. Každá operace má svou vlastní kombinaci technologického přístupu, filozofie práce, omezení kapitálu a tolerance vůči riziku. Model školený na velkých středozápadních operacích s plodinami bude selhat dramaticky, když se aplikuje na malou diverzifikovanou farmu v Pacifickém severozápadě. Nic se nezobecní čistě, a budování pro každý edge případ tlačí dimenzionalitu ještě dále do nepracovatelného území.

Více dat není odpovědí — lepší data jsou

Instinkt Silicon Valley pro většinu tvrdých problémů je házet více výpočetního výkonu a více dat na ně. V zemědělství tento instinkt produkoval einige ohromující čísla: průměrná farma nyní generuje odhadem 500 000 datových bodů denně. Satelity zobrazují každé pole na Zemi. Senzory zaznamenávají teplotu, vlhkost a vlhkost půdy v detailním rozlišení.

A přesto, zemědělská AI komunita široce uznává deficit kvalitních dat. Problém není objem. Je to relevance. Všechna tato data ze senzorů, všechny tyto satelitní snímky, všechny tyto zprávy o půdě — zachycují, co se děje okolo rostliny. Žádné z nich nezachycuje, co se děje uvnitř rostliny.

Pomyslete si na analogii inženýra Formule 1, který se snaží optimalizovat čas kola pomocí pouze dat z GPS sledování. Rychlost, poloha a trajektorie vám dávají něco, s čím můžete pracovat, ale bez telemetrie motoru, teploty pneumatik a toku paliva bude váš model vždy jen hádat o příčinnosti. Externí zemědělská data jsou přesně stejná. Říkají vám, jaké podmínky existují v prostředí, ale nemohou říci, jak se plodina skutečně chová k těmto podmínkám.

To vysvětluje některé z nejviditelnějších selhání AI v zemědělství. Gro Intelligence získala přes 120 milionů dolarů na stavbu největšího úložiště zemědělských klimatických dat a nakonec byla uzavřena. Více externích dat, bez ohledu na to, jak přesně jsou shromážděna, nevyřeší základní problém: měříme špatnou věc.

Co to vlastně znamená poslouchat rostlinu

Nové biotechnologie nyní umožňují, poprvé, získat data přímo z vnitřku plodin, které pěstujeme. Základní myšlenka spočívá ve vyvinutí plodin, které signalizují své vlastní vnitřní biologické stavy — komunikují stres, infekci nebo potřeby zdrojů prostřednictvím měřitelných výstupů, spíše než vyžadují odhad z externích proxy.

… (zbytek překladu)

Dr. Christopher Seifert je Head of Software Product ve společnosti InnerPlant, kde vede datové a strojové učící systémy společnosti. Připojil se k InnerPlant po vybudování produktů a platforem napříč téměř všemi vrstvami zemědělského datového stacku, s zkušenostmi sahajícími od satelitního dálkového průzkumu, geoprostorové analytiky, softwaru pro správu farem a infrastruktury dat pro osivo a agroekonomiku. Jeho pozadí zahrnuje vedoucí role ve společnostech Granular a Corteva Agriscience, dřívější práci ve společnostech Google a The Climate Corporation a výzkumnou zkušenost v NASA a programu Stanfordu pro potravinovou bezpečnost a životní prostředí. Také spoluzaložil a působil jako CEO společnosti AcreValue, platformy pro hodnocení ceny zemědělské půdy, kterou získala společnost Granular. Tato šíře mu dává jasný pohled na to, kde zemědělská AI fungovala, kde se jí nedaří dodávat výsledky v terénu a co je potřeba k provozu spolehlivých, produkčních systémů v zemědělství. Dr. Seifert získal doktorát z Earth System Science a také magisterský a bakalářský titul z Earth Systems na Stanford University.

Chip Franzén is a Software Engineer at InnerPlant, where he designs and builds the company’s data and ML pipelines for agricultural sensing applications, with focus areas that include IoT, computer vision, and remote sensing. Prior to InnerPlant, he spent years applying machine learning to agriculture at companies including Granular and Indigo, working on land valuation, land cover identification using computer vision, spatial data pipelines, and MLOps for remote sensing-based agronomic models and inference APIs. At InnerPlant, he brings full-stack experience translating complex biological and geospatial signals into dependable, production-ready outputs that teams can use in real workflows. He holds a BA from Duke University and an M.Sc. in Data Science from Galvanize.