Ein KI-Algorithmus ist nur so intestine wie die Daten, die Sie ihm zuführen.
Es ist weder eine kühne noch eine unkonventionelle Aussage. KI hätte vor ein paar Jahrzehnten noch etwas weit hergeholt erscheinen können, aber künstliche Intelligenz und maschinelles Lernen haben seitdem einen wirklich langen Weg zurückgelegt.
Pc Imaginative and prescient hilft Computern, Beschriftungen und Bilder zu verstehen und zu interpretieren. Wenn Sie Ihren Pc mit den richtigen Bilddatensätzen trainieren, kann er die Fähigkeit erlangen, verschiedene Gesichtsmerkmale zu erkennen, zu verstehen und zu identifizieren, Krankheiten zu erkennen, autonome Fahrzeuge zu fahren und durch mehrdimensionales Organscannen auch Leben zu retten.
Es wird erwartet, dass der Pc-Imaginative and prescient-Markt an Bedeutung gewinnt 144,46 Milliarden US-Greenback bis 2028 von bescheidenen 7,04 Milliarden US-Greenback im Jahr 2020 und wächst zwischen 2021 und 2028 mit einer durchschnittlichen jährlichen Wachstumsrate von 45,64 %.
Der Bilddatensatz Sie füttern und trainieren Ihre maschinellen Lern- und Pc-Imaginative and prescient-Aufgaben, die für den Erfolg Ihres KI-Projekts von entscheidender Bedeutung sind. Ein qualitativ hochwertiger Datensatz ist ziemlich schwer zu bekommen. Abhängig von der Komplexität Ihres Projekts kann es zwischen einigen Tagen und einigen Wochen dauern, bis zuverlässige und relevante Datensätze für Pc-Imaginative and prescient-Zwecke vorliegen.
Hier stellen wir Ihnen eine Reihe (der Einfachheit halber kategorisiert) von Open-Supply-Bilddatensätzen zur Verfügung, die Sie sofort verwenden können.
Umfassende Liste von Bilddatensätzen zum Trainieren Ihres Pc-Imaginative and prescient-Modells
Allgemein:
-
ImageNet
ImageNet ist ein weit verbreiteter Datensatz und enthält erstaunliche 1,2 Millionen Bilder, die in 1000 Kategorien kategorisiert sind. Dieser Datensatz ist gemäß der WorldNet-Hierarchie organisiert und in drei Teile kategorisiert: Trainingsdaten, Bildbeschriftungen und Validierungsdaten.
-
Kinetik 700
Kinetics 700 ist ein riesiger, hochwertiger Datensatz mit mehr als 650.000 Clips aus 700 verschiedenen menschlichen Aktionsklassen. Zu jeder Sammelklage gehören etwa 700 Videoclips. Die Clips im Datensatz weisen Mensch-Objekt- und Mensch-Mensch-Interaktionen auf, die sich bei der Erkennung menschlicher Handlungen in Movies als sehr hilfreich erweisen.
-
CIFAR-10
CIFAR 10 ist einer der größten Pc-Imaginative and prescient-Datensätze mit 60.000 32 x 32 Farbbildern, die zehn verschiedene Klassen repräsentieren. Jede Klasse verfügt über etwa 6000 Bilder, die zum Trainieren von Pc-Imaginative and prescient-Algorithmen und maschinellem Lernen verwendet werden.
-
Oxford-IIIT-Datensatz für Haustierbilder
Der Haustierbilddatensatz umfasst 37 Kategorien mit 200 Bildern professional Klasse. Diese Bilder variieren in Maßstab, Pose und Beleuchtung und werden von Anmerkungen zur Rasse, zum Kopf-ROI und zur Trimap-Segmentierung auf Pixelebene begleitet.
-
Die offenen Bilder von Google
Mit beeindruckenden 9 Millionen URLs ist dies einer der größten Bilddatensätze auf der Liste und enthält Millionen von Bildern, die in 6.000 Kategorien gekennzeichnet sind.
-
Pflanzenbilder
Diese Zusammenstellung umfasst mehrere Bilddatensätze mit beeindruckenden 1 Million Pflanzenbildern, die etwa 11 Arten abdecken.
Gesichtserkennung:
-
Beschriftete Gesichter in freier Wildbahn
„Confronted within the Wild“ ist ein riesiger Datensatz mit mehr als 13.230 Bildern von quick 5.750 im Web entdeckten Personen. Dieser Gesichtsdatensatz soll das Studium der uneingeschränkten Gesichtserkennung erleichtern.
-
CASIA WebFace
CASIA Internet Face ist ein intestine gestalteter Datensatz, der maschinelles Lernen und wissenschaftliche Forschung zur uneingeschränkten Gesichtserkennung unterstützt. Mit mehr als 494.000 Bildern von quick 10.000 echten Identitäten ist es very best für Gesichtserkennungs- und Verifizierungsaufgaben.
-
UMD-Gesichterdatensatz
UMD steht vor einem intestine kommentierten Datensatz, der aus zwei Teilen besteht – Standbildern und Videobildern. Der Datensatz enthält mehr als 367.800 Gesichtsanmerkungen und 3,7 Millionen annotierte Videobilder von Probanden.
-
Erkennung von Gesichtsmasken
Dieser Datensatz enthält 853 Bilder, die in drei Klassen kategorisiert sind: „mit Maske“, „ohne Maske“ und „falsch getragene Maske“, zusammen mit ihren Begrenzungsrahmen im PASCAL VOC-Format.
-
FERET
Die FERET (Facial Recognition Know-how Database) ist ein umfassender Bilddatensatz mit über 14.000 kommentierten Bildern menschlicher Gesichter.
Handschrifterkennung:
-
MNIST-Datenbank
MNIST ist eine Datenbank mit Beispielen handgeschriebener Ziffern von 0 bis 9 sowie 60.000 und 10.000 Trainings- und Testbildern. MNIST wurde 1999 veröffentlicht und erleichtert das Testen von Bildverarbeitungssystemen im Deep Studying.
-
Datensatz künstlicher Zeichen
Beim Synthetic Characters Dataset handelt es sich, wie der Title schon sagt, um künstlich generierte Daten, die die englische Sprachstruktur in zehn Großbuchstaben beschreiben. Es enthält mehr als 6000 Bilder.