APA/APA/THEMENBILD/BARBARA GINDL

Innsbrucker Forscher optimierten KI-Schmetterlingserkennung

Heute, 03:00 · Lesedauer 3 min

Forschende der Universität Innsbruck haben mithilfe von Supercomputern KI-Modelle auf die Erkennung von Schmetterlingsarten trainiert. Basis war ein Datensatz mit über 540.000 Fotos aus dem Citizen Science-Projekt "Schmetterlinge Österreichs". Das Projekt zeige eindrücklich, welches Potenzial die Integration von KI und Citizen Science für die Wissenschaft eröffnen könne, so Johannes Rüdisser, Leiter des Viel-Falter Monitoring Österreich, und Doktorandin Friederike Barkmann.

Schmetterlinge sind gute Biodiversitätsindikatoren, weil sie sensibel auf veränderte Umweltbedingungen reagieren. Um deren Bestandsentwicklung angesichts der Biodiversitäts- und Klimakrise zu überwachen, ist die Wissenschaft auf die Hilfe von Laien angewiesen. Rüdisser entwickelte daher das Monitoring viel-falter.at, bei dem zusätzlich zu Fachleuten auch Freiwillige Schmetterlingsbeobachtungen durchführen. Vielen Naturinteressierten sind inzwischen Apps vertraut, die aus Handyfotos mithilfe von Künstlicher Intelligenz Arten bestimmen. Für eine gute automatisierte Bestimmung brauchen die dahinter stehenden Machine-Learning-Modelle allerdings viele Trainingsdaten und viel Rechnerleistung.

Friederike Barkmann, Doktorandin im "Vielfalter"-Monitoring, befasste sich in ihrer zweiten Masterarbeit im Bereich Data Science mit der Bestimmungsgenauigkeit dieser KI-Modelle für die einzelnen Arten. Sie nutzte dazu den Datensatz, den über 25.000 Freiwillige im Rahmen des Projekts "Schmetterlinge Österreichs" der Billa-Stiftung Blühendes Österreich binnen zehn Jahren zusammengetragen haben. Er ist deutlich größer als jene, die bisher in ähnlichen Studien verwendet wurden. Mithilfe der über 540.000 Bilder von 185 in Österreich vorkommenden Tag- und Nachfalterarten wurde ein neuronales Netzwerk trainiert.

KI-Modelle bestimmten nach Training 97 Prozent der Arten richtig

Zunächst kam dafür der Innsbrucker Hochleistungsrechner LEO5 zum Einsatz, schließlich wurde der Prozess mithilfe von Andreas Lindner vom nationalen High-Performance Computing-Kompetenzzentrum EuroCC Austria optimiert. Schließlich erhielten die Forschenden Zugang zum Supercomputer LEONARDO, einem der leistungsstärksten Computer Europas. Infolge des Trainings konnten die ersten Modelle 97 Prozent der Arten korrekt bestimmen.

Die meisten Schmetterlingsarten, die als Biodiversitätsindikatoren wichtig sind, eignen sich laut Barkmanns Untersuchung gut für solche Modelle. In der Evaluierung zeigte sich aber, dass die Erkennung unterschiedlich gut funktionierte, weil es von einigen Arten bis zu 30.000 Fotos pro Art gab, von anderen dagegen deutlich weniger. "Einige Arten sind häufiger als andere, sind leichter zu erkennen oder werden bevorzugt von Citizen Scientists erfasst", begründete die Forscherin das in solchen Datensätzen durchaus übliche Ungleichgewicht.

Ergebnisse stehen Öffentlichkeit zur Verfügung

Während auffällige Falter wie Kleiner Fuchs oder Admiral von der KI also gut erkannt wurden, stieß sie bei schwer auseinander zu haltenden Arten, wie etwa der Familie der Dickkopffalter, an ihre Grenzen. Die Anwendung könnte aber optimiert werden, wenn Bilder mit unsicherem Ergebnis markiert und dann von Fachleuten nachbestimmt würden, so die Forschenden. Dadurch würde sich die Datenqualität von Citizen Science-Datensätzen erhöhen, gleichzeitig sinkt der Aufwand für Qualitätskontrolle und Nachbestimmung. Der verwendete Datensatz, Skripte und Modelle wurden nun der Öffentlichkeit zur Verfügung gestellt. Er soll laut Rüdisser "ganz im Sinne von Open (Citizen) Science" helfen, Bestimmungs-Algorithmen weiter zu verbessern und weiterführender Forschung als Ressource dienen.

(S E R V I C E - Barkmann, F., Lindner, A., Würflinger, R. et al. "Machine learning training data: over 500,000 images of butterflies and moths (Lepidoptera) with species labels". Link zur Originalpublikation: https://www.nature.com/articles/s41597-025-05708-z )

Zusammenfassung
  • Forschende der Universität Innsbruck haben mithilfe von Supercomputern KI-Modelle auf Basis von über 540.000 Fotos aus dem Citizen Science-Projekt 'Schmetterlinge Österreichs' trainiert, um Schmetterlingsarten zu erkennen.
  • Nach dem Training mit Daten von mehr als 25.000 Freiwilligen konnte die KI 97 Prozent der 185 in Österreich vorkommenden Tag- und Nachfalterarten korrekt bestimmen.
  • Der Datensatz, die Skripte und die Modelle wurden als Open Science-Ressource veröffentlicht und sollen die weitere Forschung und Entwicklung von Bestimmungs-Algorithmen unterstützen.