Von der Theorie zur perfekten Knolle: Wie Computer das Sehen lernten
Haben Sie sich schon einmal gefragt, wie eine Maschine den Unterschied zwischen einem Erdklumpen und einer Kartoffel erkennt? Was für uns Menschen selbstverständlich ist – das mühelose Erkennen von Objekten in Sekundenbruchteilen – war für Computer jahrzehntelang eine schier unlösbare Aufgabe. Die Geschichte, wie Maschinen das „Sehen“ lernten, ist faszinierend und führt direkt zu der Technologie, die heute in modernen Sortieranlagen wie denen von Karevo steckt.
Der lange Weg zum maschinellen Sehen
In den Anfangsjahren der Künstlichen Intelligenz (KI) in den 1960er Jahren waren Forscher optimistisch. Man glaubte, das Problem des maschinellenSehens (Computer Vision) ließe sich in kurzer Zeit lösen, indem man Computern feste Regeln beibringt. Doch die Realität war komplexer: Ein Computer sieht keine Formen, sondern nur eine lange Liste von Zahlenwerten (Pixel). Jahrzehntelang bissen sich Wissenschaftler die Zähne daran aus, Maschinen beizubringen, einfache Objekte unter verschiedenen Lichtverhältnissen oder Blickwinkeln zuverlässig zu erkennen.
Dr. Fei-Fei Li und die Revolution durch Daten
Ein wichtiger Wendepunkt kam mit einer visionären Wissenschaftlerin: Dr. Fei-Fei Li. Während viele ihrer Kollegen versuchten, bessere Algorithmen zuschreiben, erkannte Li, dass das Problem woanders lag: den Maschinen fehlten die Erfahrungswerte. Wie ein Kind, das die Welt durch Beobachtung lernt, brauchten Computer Beispiele – und zwar viele davon.
Inspiriert von der menschlichen Fähigkeit, zehntausende von Objektkategorien zu unterscheiden, startete sie das Projekt ImageNet. Ihr Ziel war es, eineDatenbank zu schaffen, die die gesamte visuelle Welt abbildet. Das Ergebnis war eine Sammlung von Millionen von Bildern, die von Menschenhand sortiertund benannt wurden.
2012: Der Durchbruch durch das "Trio des Deep Learning"
Doch die Daten allein reichten nicht. Es brauchte eine Architektur, die diese Informationsflut verarbeiten konnte. Hier kommen drei Namen ins Spiel, die dieTechnikwelt für immer veränderten: Geoffrey E. Hinton, Alex Krizhevsky und Ilya Sutskever.
Im Jahr 2012 nahm dieses Team am ImageNet-Wettbewerb teil. Während andere Forscher noch mit klassischen Methoden arbeiteten, setzten Krizhevsky, Sutskever und Hinton auf sogenannte konvolutionale neuronale Netze (CNNs) – Algorithmen, die der Funktionsweise des menschlichen Gehirns und der visuellen Wahrnehmung nachempfunden sind.
Ihr Modell, bekannt als AlexNet, nutzte erstmals die Rechenkraft moderner Grafikkarten (GPUs), um ihr Model an riesigen Datenmengen zu trainieren. Das Ergebnis war eine Sensation: Sie senkten die Fehlerrate bei der Bilderkennung drastisch und ließen die Konkurrenz weit hinter sich. Man könnte diesen Moment auch als Geburtsstunde des modernen Deep Learning bezeichnen – eben jener Technologie, die heute selbstfahrende Autos steuert, hinter ChatGPT steckt und eben auch Kartoffeln sortiert.
Karevo: Hochtechnologie für den Acker
Bei Karevo nutzen wir genau diese Errungenschaften. Unsere Sortiermaschinen kombinieren die Prinzipien von Dr. Li (große Datenmengen von Kartoffelbildern) mit den neuronalen Netzarchitekturen, die von Hinton, Krizhevsky und Sutskever revolutioniert wurden.
Unsere Sortieranlage, die Karevo Duo85, setzt modernste Computer Vision ein, um das menschliche Auge nicht nur zu imitieren, sondern in Ausdauer und Objektivität zu übertreffen. Wir haben unsere KI darauf trainiert, die spezifischen Merkmale von Kartoffeln zu verstehen.
Das System arbeitet nicht mit starren, deterministischen Regeln, sondern hat gelernt, Defekte anhand von visuellen Mustern zu identifizieren. Das ermöglichtuns eine Erkennungsgenauigkeit von ca. 95%. Unser System erkennt zuverlässig:
- Krankheiten und Mängel: Von Grünfärbung und Schorf bis hin zu Drahtwurmbefall, Wachstumsrissen sowie Nass- und Trockenfäule.
- Fremdkörper: Steine und Kluten werden sicher von der Ernte unterschieden und aussortiert.
Genau wie die Modelle von Dr. Li, die lernten, Hunderte von Hunderassen zu unterscheiden, lernt Karevo dank Machine Learning ständig dazu und wird ständig durch neue Trainingsdaten verbessert.
Fazit
Die Technologie, die heute bis zu 5 Tonnen Kartoffeln pro Stunde sortieren kann, basiert auf jahrzehntelanger Forschung. Dank Pionierinnen wie Dr. Fei-Fei Li sind Computer heute in der Lage, die komplexen Nuancen der Natur zu verstehen. Für Landwirte bedeutet das: Weniger händische Arbeit, höhereQualitätssicherheit und eine Sortierung, bei der – wie wir bei Karevo sagen – jeder Pixel zählt.
Weiterführende Quellen
Li, Fei-Fei (2023): The Worlds I See: Curiosity, Exploration, and Discovery at the Dawn of AI. Flatiron Books: A Moment of Lift Book.
Krizhevsky, A., Sutskever, I., & Hinton, G. E. (2012). ImageNet classification with deep convolutional neural networks. In F. Pereira, C. J. C. Burges, L. Bottou, & K. Q. Weinberger (Eds.), Advances in Neural Information Processing Systems 25 (pp. 1097–1105). Curran Associates, Inc.
Marino, S., Beauseroy, P., & Smolarz, A. (2019). Weakly-supervised learning approach for potato defects segmentation. Engineering Applications of Artificial Intelligence, 85, 337–346. https://doi.org/10.1016/j.engappai.2019.06.024