Arabiska & thailändska & vietnamesiska & hindi & engelska & kinesiska språkdataset
Avgränsningsruta+text
Användningsfall: OCR
Format: Bild
Räkna: 150k
Anteckning: Ja
Beskrivning: Arabiska & thailändska & vietnamesiska & hindi & engelska & kinesiska språkdataset
Arabisk textdatauppsättning
Avgränsningsruta+text
Användningsfall: OCR
Format: Bild
Räkna: 1k
Anteckning: Ja
Beskrivning: Arabic Text Dataset innehåller en samling textexempel skrivna på arabiska. Det innehåller olika former av innehåll, såsom nyhetsartiklar, inlägg på sociala medier, litteratur och dialog, som spänner över olika ämnen och skrivstilar. Denna datauppsättning används för uppgifter som naturlig språkbehandling (NLP), textklassificering, sentimentanalys och maskinöversättning i arabiska språkapplikationer.
Kinesiska & engelska & tibetanska & uiguriska språkdataset
Avgränsningsruta+text
Användningsfall: OCR
Format: Bild
Räkna: 38k
Anteckning: Ja
Beskrivning: Kinesiska & engelska & tibetanska & uiguriska språkdataset
Kinesiska och engelska Meny Dataset
Avgränsningsruta+text
Användningsfall: OCR
Format: Bild
Räkna: 60k
Anteckning: Ja
Beskrivning: Den kinesiska och engelska menydatauppsättningen innehåller bilder eller textprover av restaurangmenyer som innehåller både kinesiska och engelska språk. Den innehåller olika typsnitt, layouter och menystrukturer, som presenterar tvåspråkiga rätters namn, beskrivningar och priser. Denna datauppsättning är användbar för uppgifter som optisk teckenigenkänning (OCR), maskinöversättning och menydigitalisering i flerspråkiga inställningar.
Kinesisk handskriven sammansättning Dataset
Avgränsningsruta+text
Användningsfall: OCR
Format: Bild
Räkna: 3k
Anteckning: Ja
Beskrivning: Den kinesiska handskrivna kompositionsdatauppsättningen innehåller exempel på handskriven kinesisk text, inklusive kompositioner, uppsatser och annan långformad text. Den har olika handskriftsstilar och komplexitetsnivåer och används för uppgifter som handskriftsigenkänning, textanalys och maskininlärningsmodellutbildning.
Kinesisk WIFI-promptdatauppsättning
Avgränsningsruta+text
Användningsfall: OCR
Format: Bild
Räkna: 1k
Anteckning: Ja
Beskrivning: Den kinesiska WIFI-promptdatauppsättningen består av textexempel som finns i WIFI-prompter och inloggningsskärmar skrivna på kinesiska. Det innehåller vanligtvis olika uppmaningar, instruktioner och felmeddelanden relaterade till att ansluta till eller hantera WIFI-nätverk. Denna datauppsättning används för uppgifter som textigenkänning, naturlig språkbehandling och förbättring av användargränssnitt för nätverksanslutning.
Engelsk och kinesisk handskriftsdatauppsättning
Avgränsningsruta+text
Användningsfall: OCR
Format: Bild
Räkna: 12k
Anteckning: Ja
Beskrivning: Den engelska och kinesiska handskriftsdatauppsättningen innehåller handskrivna exempel på både engelska och kinesiska, som visar olika skrivstilar och karaktärskomplexiteter. Det används vanligtvis för att träna och utvärdera modeller för handskriftsigenkänning, stödja flerspråkig textanalys och annan relaterad forskning. Datauppsättningen innehåller en mängd olika tecken, siffror, ord och meningar på båda språken.
Engelska och kinesiska Shopsign Dataset
Avgränsningsruta+text
Användningsfall: OCR
Format: Bild
Räkna: 30k
Anteckning: Ja
Beskrivning: Det engelska och kinesiska Shopsign-datasetet innehåller bilder av butiksskyltar som har både engelsk och kinesisk text. Den fångar olika skyltelement som butiksnamn, annonser, kampanjer och vägbeskrivningar, som visas i olika typsnitt, stilar och format. Denna datauppsättning används för uppgifter som textidentifiering och igenkänning, flerspråkig scenförståelse och förbättring av datorseendemodeller för tolkning av tvåspråkig skyltning.
Engelska och kinesiska specialvinkeltextdatauppsättning
Avgränsningsruta+text
Användningsfall: OCR
Format: Bild
Räkna: 50k
Anteckning: Ja
Beskrivning: Den engelska och kinesiska specialvinkeltextdatauppsättningen innehåller bilder av text som visas i olika vinklar och orienteringar på både engelska och kinesiska. Den innehåller text från källor som skyltar, annonser och dokument som inte presenteras i horisontella standardformat. Denna datauppsättning används för att träna och utvärdera modeller för textdetektering och igenkänning, särskilt de som kan hantera text i icke-traditionella orienteringar och perspektiv.
Engelska Meny Dataset
Avgränsningsruta+text
Användningsfall: OCR
Format: Bild
Räkna: 20k
Anteckning: Ja
Beskrivning: Den engelska menydatauppsättningen innehåller bilder eller textprover av restaurangmenyer skrivna på engelska. Den har en mängd olika typsnitt, layouter och formateringsstilar, med innehåll som sträcker sig från maträtternas namn till beskrivningar och priser. Denna datauppsättning används ofta för uppgifter som optisk teckenigenkänning (OCR), textextraktion och menydigitalisering i livsmedelsrelaterade applikationer.
Engelska Scener Text Dataset
Avgränsningsruta+text
Användningsfall: OCR
Format: Bild
Räkna: 33k
Anteckning: Ja
Beskrivning: Textdatasetet för engelska scener består av bilder som innehåller naturliga scener med inbäddad engelsk text. Texten förekommer i olika former, såsom skyltar, skyltar och affischer, ofta i olika typsnitt, storlekar och orienteringar. Denna datauppsättning används ofta för att träna och testa modeller i textdetektering, igenkänning och scenförståelse.
Handskriven textdatauppsättning
Användningsfall: Dokument AI
Format: HEIC (bilder) och .mov (videor)
Räkna: 94053
Anteckning: Nej
Beskrivning: Livefoton med handskriven text för japanska, koreanska och ryska
Inspelningsutrustning: iPhone & iPad kamera
Inspelningsvillkor: - Aggressiv belysning/bländning - Kamerablixt på - Färgat ljus - Lågt ljus, ingen kamerablixt - Normal
Japanska och koreanska språkdataset
Avgränsningsruta+text
Användningsfall: OCR
Format: Bild
Räkna: 40k
Anteckning: Ja
Beskrivning: Den japanska och koreanska språkdatauppsättningen innehåller textexempel på både japanska och koreanska. Den har en mängd innehåll som meningar, fraser och ord, som omfattar olika sammanhang och stilar. Denna datauppsättning används för uppgifter som naturlig språkbehandling (NLP), maskinöversättning och textanalys i flerspråkiga applikationer.