Färdiga öppna datamängder för AI/ML

Upptäck datauppsättningar med öppen källkod som får dig att träna ML -modeller

Öppna datauppsättningar

Öppen källkodsdata för dina AI/ML-modeller

Att hitta rätt datamängd för din AI-modell borde inte ta veckor. Det öppna datamängdsbiblioteket ger ML-team omedelbar tillgång till 100+ kurerade, mänskligt validerade datamängder som spänner över NLP, datorseende, tal och generativ AI – allt gratis att utforska.

Så om du vill starta ett nytt AI / ML-initiativ och nu inser du snabbt att hitta träningsdata av hög kvalitet kommer att vara en av de mer utmanande aspekterna av ditt projekt eftersom högkvalitativa datamängder är det bränsle som håller AI / ML-motorn går. Vi har samlat en lista över öppna datamängder som är fria att använda och träna framtidens AI / ML-modeller.

Fördjupning Data typ Dataset Namn Industri / Inst. Kommentar / användningsfall Länk
+NLP text Amazon Recensioner E-handel Sentimentanalys Länk
+NLP text Wikipedia länkar data Allmänt Länk
+NLP text Standford Sentiment Treebank Underhållning Sentimentanalys Länk
+NLP text Twitter US Airline Sentiment Flygbolag Sentimentanalys Länk
+CV Bild Imagenet Allmänt Länk
+CV Bild Googles öppna bilder Allmänt Länk
+NLP text Cornell-filmdialoger Underhållning dialog~~POS=TRUNC Länk
+NLP text MS MARCO Allmänt Frågeställning Länk
+NLP text Naturliga frågor Dataset Allmänt Frågeställning Länk
+NLP text DBPedia Allmänt Kunskap Diagram Länk
+NLP text YAGO Allmänt Kunskap Diagram Länk
+NLP text FreeBase Allmänt Kunskap Diagram Länk
+NLP text Ontonotes Allmänt Semantisk rollmärkning Länk
+CV Bild Kokos Allmänt Objektdetektion Länk
+CV Bild PASCAL VOC Allmänt Objektdetektion Länk
+CV Bild Stads Autonom körning Semantisk segmentering Länk
+CV Bild MNIST Allmänt Sifferklassificering Länk
+CV Bild Mode-MNIST Detaljhandeln Bildklassificering Länk
+NLP Audio LibriSpeech Allmänt ASR Länk
+NLP Audio TED-LIUM Allmänt ASR Länk
+NLP Audio TIMIT Allmänt Fonemigenkänning Länk
+NLP Audio Vanlig röst Allmänt ASR Länk
+NLP Audio VoxCeleb Allmänt Högtalarigenkänning Länk
+NLP text Wikipedia-dump Allmänt Språkmodellering Länk
+NLP text Gigaword Nyheter Språkmodellering Länk
+NLP text IMDB Recensioner Underhållning Sentimentanalys Länk
+CV Video Kinetics-700 Allmänt Action Recognition Länk
+CV Video UCF101 Allmänt Action Recognition Länk
+CV Video HMDB51 Allmänt Action Recognition Länk
+CV Bild CASIA-WebFace Allmänt Face Recognition Länk
+NLP text Trupp Allmänt Läsförståelse Länk
+NLP text MultiNLI Allmänt Naturlig språkinferens Länk
+NLP text SNLI Allmänt Naturlig språkinferens Länk
+CV Bild Oxford Flowers 102 botanik Finkornig klassificering Länk
+CV Bild CIFAR-10 Allmänt Bildklassificering Länk
+CV Bild CIFAR-100 Allmänt Bildklassificering Länk
+CV Bild VOC-personlayout Allmänt Pose uppskattning Länk
+CV Bild MPII Mänsklig Pose Allmänt Pose uppskattning Länk
+NLP text 20 nyhetsgrupper Allmänt Textklassificering Länk