Connect with us

Tankeledare

Varför jordbrukets dataproblem är ett AI-problem — och vad växter kan göra åt det

mm mm

Varje fåtal år får jordbrukstekniksektorn en ny silverkula. 2013 var berättelsen stora data som förvandlar jordbruksledning — Monsantos förvärv av The Climate Corporation för 1,1 miljarder dollar skulle ange en ny era av prediktivt jordbruk. Ett par år senare skulle AI-drivna växthus leverera en andra Gröna revolution. Sedan kom löftet om robotisk skörd, sedan generativ AI-agronomer och nu agens AI som förmodligen kommer att fatta beslut autonomt på uppdrag av jordbrukare över hela världen.

Mönstret bör vara bekant: varje våg av hype bygger på den föregående, men AgTech-ventureinvesteringar fortsätter att besvika, och transformerande resultat förblir svåra att uppnå. Varför? Inte för att ingenjörerna inte är begåvade, eller för att den underliggande AI-vetenskapen är felaktig. Problemet är djupare och har att göra med de data som jordbruks-AI-systemen är beroende av.

Tills vi grundligt omprövar vilka data vi samlar in och hur vi samlar in dem, kommer den jordbruks-AI-revolutionen att förbli ett löfte snarare än en verklighet.

Tre skäl till varför jordbruks-AI fortsätter att misslyckas

Jordbruk är en av de mest ogästvänliga miljöerna man kan tänka sig för att utveckla AI. Utmaningarna är inte triviala ingenjörsproblem — de är strukturella. Här är vad som gör detta område så motståndskraftigt mot den vanliga AI-spelplanen:

Återkopplingsloopar som rör sig i biologisk takt, inte mjukvarutakt.

Modern AI-system är utformade kring snabb iteration. En mjukvarumodell kan återtränas på några timmar; en läkemedelsstudie tar år. Jordbruk ligger närmare den senare. Norman Borlaugs nobelprisbelönade innovation på 1970-talet handlade delvis om att komprimera grödans livscykel från en till två gånger per år. Idag kan de mest avancerade utsädesföretagen hantera tre cykler per år; fortfarande glacialt långsamt enligt AI-standarden. När din grundläggande sanning anländer med skörden, sträcker sig modellförbättringstiderna över år, inte sprinter.

Jordbrukskomplexitet bryter AI:s vanliga antaganden

Ställ en tydligen enkel fråga — hur mycket kväve bör detta fält få? — och variablerna förökar sig snabbt: jordens sammansättning, tidigare grödor, patogenhistoria, mikroklimat, djurhållningshistoria som sträcker sig tillbaka decennier, vattenhållning, bearbetningsmetoder och dussintals andra samverkande faktorer. Forskning om AI-resonemangsgränser visar att modellens noggrannhet kollapsar i högdimensionella miljöer. Jordbruk är inte bara högdimensionellt; det är ett av de högdimensionellaste områdena som människor har försökt att modellera.

Varje gård är sitt eget undantagsfall.

Det finns ingen sfärisk ko i riktigt jordbruk. Varje verksamhet har sin egen kombination av tekniktillgång, arbetsfilosofi, kapitalbegränsningar och risktolerans. En modell som tränats på stora jordbruksföretag i Mellanvästern kommer att misslyckas spektakulärt när den tillämpas på en liten diversifierad gård i nordvästra Stilla havet. Ingenting generaliserar renligt, och att bygga för varje undantagsfall förskjuter dimensionaliteten ännu mer in i ohanterbart område.

Mer data är inte svaret — bättre data är

Silicon Valleys instinkt för de flesta svåra problem är att kasta mer beräkningskraft och mer data på dem. I jordbruk har den instinkten producerat några häpnadsväckande siffror: den genomsnittliga gården genererar nu uppskattningsvis 500 000 datapunkter per dag. Satelliter avbildar varje fält på jorden. Sensorer loggar temperatur, fuktighet och jordfuktighet i detalj.

Och ändå, jordbruks-AI-gemenskapen erkänner allmänt en kvalitetsdatadeficit. Problemet är inte volymen. Det är relevansen. All den sensordata, alla satellitbilder, alla jordtestrapporter — de fångar vad som händer runtom växten. Ingenting fångar vad som händer inuti växten.

Tänk på analogin med en Formel 1-racingingenjör som försöker optimera varvtiden med hjälp av endast GPS-spårningsdata. Hastighet, position och bana ger dig något att arbeta med, men utan motortelemetri, däcktemperatursensorer och bränsleflödesdata kommer din modell alltid att gissa om orsaken. Yttre jordbruksdata är exakt detsamma. Den berättar vad förhållanden som finns i miljön, men den kan inte berätta hur grödan faktiskt svarar på dessa förhållanden.

Detta förklarar några av jordbrukets mest synliga AI-misslyckanden. Gro Intelligence samlade in över 120 miljoner dollar för att bygga världens största repository av jordbruksklimatdata och stängde till slut. Mer yttre data, hur exakt den än samlas in, löser inte det underliggande problemet: vi mäter fel sak.

Vad det faktiskt innebär att lyssna på växten

Nya biotekniker gör det nu möjligt, för första gången, att få data direkt från insidan av de grödor vi odlar. Den grundläggande idén är att konstruera grödor som signalerar sin egen inre biologiska tillstånd — kommunicerar stress, infektion eller resursbehov genom mätbara utdata snarare än att kräva antagande från yttre proxys.

Tidigare i år producerade en av dessa tillvägagångssätt ett genuint historiskt resultat — en sojaböna med konstruerad fluorescerande signalering avslöjade en svampinfektion i realtid innan några synliga symtom uppstod på växten. På 10 000 år av jordbruk har jordbrukare aldrig kunnat upptäcka sjukdomar i detta skede. Växtens egen immunreaktion utlöste signalen. Växten själv tillhandahöll data.

Detta är viktigt för praktiska jordbruksresultat. Tidigare sjukdomsdiagnos möjliggör tidigare ingripande, vilket minskar förluster och kemiska insatser. Men det är lika viktigt för jordbruks-AI, eftersom det representerar en grundligt ny klass av data.

Istället för att försöka härleda växtbiologi från yttre förhållanden — en uppgift som är inneboende bullrig, högdimensionell och benägen för störande faktorer — kan AI-system nu tränas på direkta mätningar av växtfysiologi. Dimensionalitetsproblemet minskar dramatiskt. Återkopplingslooparna förkortas. Undantagsfallsproblemet försvinner inte, men det blir mer hanterbart när du arbetar med signaler som växten själv sänder ut snarare än proxyvariabler i den omgivande miljön.

En ny dataparadigm för en ny era av jordbruks-AI

Jämförelsen med utvecklingen av autonoma fordon är instruktiv. Företag som Waymo lyckades inte genom att försöka träna sina modeller på befintliga allmänna vägdata ensamma. De byggde proprietära sensorarrayer och genererade massiva, högkvalitativa, förstapartsdata som fångade exakt vad deras modeller behövde lära sig. Datastrategin var lika viktig som modellarkitekturen.

Jordbruks-AI behöver en liknande omprövning. Vägen framåt är inte bättre modeller tillämpade på befintliga jordbruksdata. Dessa data är grundligt begränsade av det faktum att de endast observerar grödans miljö, inte grödan själv. Vägen framåt är att generera en ny kategori av data, grundad i faktisk växtbiologi, och bygga AI-system utformade för att lära sig från den.

Den typen av data — kontinuerlig, säsongslång biologisk telemetri från grödor över hela jordbruksområdet — existerar inte ännu i stor skala. Men teknologierna för att generera den blir verklighet. När den datan anländer kommer den att möjliggöra de typer av AI-modeller som kan genuint hjälpa jordbrukare att navigera komplexa beslut: inte genom att tvinga sig igenom en bullrig hav av yttre variabler, utan genom att förstå, i något som liknar realtid, vad grödan själv behöver.

Den kvalitetsdatagapet inom jordbruk har diskuterats i år. Vad som har förändrats är att vi nu har ett trovärdigt svar på det, och det börjar med växterna själva.

Den faktiska vägen till den nästa Gröna revolutionen

Att mata 8 miljarder människor på ett hållbart sätt — med ytterligare 2 miljarder förväntade till 2050 — samtidigt som man hanterar klimatförstöring, insatskostnader och vattenbrist är en av de mest definierande utmaningarna i detta århundrade. Jordbruks-AI har potentialen att hjälpa till med varje del av den utmaningen. Men bara om det byggs på data som faktiskt återspeglar vad som händer inuti de grödor vi försöker odla.

Under mer än ett decennium har branschen försökt att lösa det problemet genom att ackumulera mer yttre data och kasta mer beräkningskraft på det. Den tillvägagångssättet har producerat inkrementella vinster, men det har inte levererat genombrottet som sektorn behöver. Det kommer inte att göra det — eftersom det grundläggande dataproblemet förblir olöst.

Den nästa Gröna revolutionen kommer inte att sås av en annan lovande modellarkitektur eller ett annat välfinansierat startup med en bättre satellitavbildningspipeline. Den kommer att börja när AI-system kan höra vad grödan försöker säga.

Dr. Christopher Seifert är chef för mjukvaruprodukter på InnerPlant, där han leder företagets data- och maskinlärningssystem. Han gick med i InnerPlant efter att ha byggt produkter och plattformar över nästan varje lager i jordbruksdatastacken, med erfarenhet som omfattar satellitbaserad fjärranalys, geospatial analys, jordbruksprogramvara och utsädes- och agronomidatainfrastruktur. Hans bakgrund omfattar ledande roller på Granular och Corteva Agriscience, tidigare arbete på Google och The Climate Corporation, samt forskningserfarenhet på NASA och Stanford Program on Food Security and the Environment. Han var också med och grundade och tjänstgjorde som VD för AcreValue, en plattform för värdering av jordbruksmark som förvärvades av Granular. Denna bredd ger honom en tydlig vy över var jordbruks-AI har fungerat, var den har kämpat för att leverera på fältet och vad det kräver för att köra tillförlitliga, produktionsklassade system inom jordbruk. Han har en doktorsexamen i jordsystemvetenskap samt en master- och kandidatexamen i jordsystem från Stanford University.

Chip Franzén is a Software Engineer at InnerPlant, where he designs and builds the company’s data and ML pipelines for agricultural sensing applications, with focus areas that include IoT, computer vision, and remote sensing. Prior to InnerPlant, he spent years applying machine learning to agriculture at companies including Granular and Indigo, working on land valuation, land cover identification using computer vision, spatial data pipelines, and MLOps for remote sensing-based agronomic models and inference APIs. At InnerPlant, he brings full-stack experience translating complex biological and geospatial signals into dependable, production-ready outputs that teams can use in real workflows. He holds a BA from Duke University and an M.Sc. in Data Science from Galvanize.