Arabiska & thailändska & vietnamesiska & hindi & engelska & kinesiska språkdataset

Avgränsningsruta+text

Arabiska & thailändska & vietnamesiska & hindi & engelska & kinesiska språkdataset

Användningsfall: OCR

Format: Bild

Räkna: 150k

Anteckning: Ja

X

Beskrivning: Arabiska & thailändska & vietnamesiska & hindi & engelska & kinesiska språkdataset

Arabisk textdatauppsättning

Avgränsningsruta+text

Arabisk textdatauppsättning

Användningsfall: OCR

Format: Bild

Räkna: 1k

Anteckning: Ja

X

Beskrivning: Arabic Text Dataset innehåller en samling textexempel skrivna på arabiska. Det innehåller olika former av innehåll, såsom nyhetsartiklar, inlägg på sociala medier, litteratur och dialog, som spänner över olika ämnen och skrivstilar. Denna datauppsättning används för uppgifter som naturlig språkbehandling (NLP), textklassificering, sentimentanalys och maskinöversättning i arabiska språkapplikationer.

Kinesiska & engelska & tibetanska & uiguriska språkdataset

Avgränsningsruta+text

Kinesiska & engelska & tibetanska & uiguriska språkdataset

Användningsfall: OCR

Format: Bild

Räkna: 38k

Anteckning: Ja

X

Beskrivning: Kinesiska & engelska & tibetanska & uiguriska språkdataset

Kinesiska och engelska Meny Dataset

Avgränsningsruta+text

Kinesiska och engelska Meny Dataset

Användningsfall: OCR

Format: Bild

Räkna: 60k

Anteckning: Ja

X

Beskrivning: Den kinesiska och engelska menydatauppsättningen innehåller bilder eller textprover av restaurangmenyer som innehåller både kinesiska och engelska språk. Den innehåller olika typsnitt, layouter och menystrukturer, som presenterar tvåspråkiga rätters namn, beskrivningar och priser. Denna datauppsättning är användbar för uppgifter som optisk teckenigenkänning (OCR), maskinöversättning och menydigitalisering i flerspråkiga inställningar.

Kinesisk handskriven sammansättning Dataset

Avgränsningsruta+text

Kinesisk handskriven sammansättning Dataset

Användningsfall: OCR

Format: Bild

Räkna: 3k

Anteckning: Ja

X

Beskrivning: Den kinesiska handskrivna kompositionsdatauppsättningen innehåller exempel på handskriven kinesisk text, inklusive kompositioner, uppsatser och annan långformad text. Den har olika handskriftsstilar och komplexitetsnivåer och används för uppgifter som handskriftsigenkänning, textanalys och maskininlärningsmodellutbildning.

Kinesisk WIFI-promptdatauppsättning

Avgränsningsruta+text

Kinesisk WIFI-promptdatauppsättning

Användningsfall: OCR

Format: Bild

Räkna: 1k

Anteckning: Ja

X

Beskrivning: Den kinesiska WIFI-promptdatauppsättningen består av textexempel som finns i WIFI-prompter och inloggningsskärmar skrivna på kinesiska. Det innehåller vanligtvis olika uppmaningar, instruktioner och felmeddelanden relaterade till att ansluta till eller hantera WIFI-nätverk. Denna datauppsättning används för uppgifter som textigenkänning, naturlig språkbehandling och förbättring av användargränssnitt för nätverksanslutning.

Engelsk och kinesisk handskriftsdatauppsättning

Avgränsningsruta+text

Engelsk och kinesisk handskriftsdatauppsättning

Användningsfall: OCR

Format: Bild

Räkna: 12k

Anteckning: Ja

X

Beskrivning: Den engelska och kinesiska handskriftsdatauppsättningen innehåller handskrivna exempel på både engelska och kinesiska, som visar olika skrivstilar och karaktärskomplexiteter. Det används vanligtvis för att träna och utvärdera modeller för handskriftsigenkänning, stödja flerspråkig textanalys och annan relaterad forskning. Datauppsättningen innehåller en mängd olika tecken, siffror, ord och meningar på båda språken.

Engelska och kinesiska Shopsign Dataset

Avgränsningsruta+text

Engelska och kinesiska Shopsign Dataset

Användningsfall: OCR

Format: Bild

Räkna: 30k

Anteckning: Ja

X

Beskrivning: Det engelska och kinesiska Shopsign-datasetet innehåller bilder av butiksskyltar som har både engelsk och kinesisk text. Den fångar olika skyltelement som butiksnamn, annonser, kampanjer och vägbeskrivningar, som visas i olika typsnitt, stilar och format. Denna datauppsättning används för uppgifter som textidentifiering och igenkänning, flerspråkig scenförståelse och förbättring av datorseendemodeller för tolkning av tvåspråkig skyltning.

Engelska och kinesiska specialvinkeltextdatauppsättning

Avgränsningsruta+text

Engelska och kinesiska specialvinkeltextdatauppsättning

Användningsfall: OCR

Format: Bild

Räkna: 50k

Anteckning: Ja

X

Beskrivning: Den engelska och kinesiska specialvinkeltextdatauppsättningen innehåller bilder av text som visas i olika vinklar och orienteringar på både engelska och kinesiska. Den innehåller text från källor som skyltar, annonser och dokument som inte presenteras i horisontella standardformat. Denna datauppsättning används för att träna och utvärdera modeller för textdetektering och igenkänning, särskilt de som kan hantera text i icke-traditionella orienteringar och perspektiv.

Engelska Meny Dataset

Avgränsningsruta+text

Engelska Meny Dataset

Användningsfall: OCR

Format: Bild

Räkna: 20k

Anteckning: Ja

X

Beskrivning: Den engelska menydatauppsättningen innehåller bilder eller textprover av restaurangmenyer skrivna på engelska. Den har en mängd olika typsnitt, layouter och formateringsstilar, med innehåll som sträcker sig från maträtternas namn till beskrivningar och priser. Denna datauppsättning används ofta för uppgifter som optisk teckenigenkänning (OCR), textextraktion och menydigitalisering i livsmedelsrelaterade applikationer.

Engelska Scener Text Dataset

Avgränsningsruta+text

Engelska Scener Text Dataset

Användningsfall: OCR

Format: Bild

Räkna: 33k

Anteckning: Ja

X

Beskrivning: Textdatasetet för engelska scener består av bilder som innehåller naturliga scener med inbäddad engelsk text. Texten förekommer i olika former, såsom skyltar, skyltar och affischer, ofta i olika typsnitt, storlekar och orienteringar. Denna datauppsättning används ofta för att träna och testa modeller i textdetektering, igenkänning och scenförståelse.

Handskriven textdatauppsättning

Handskriven textdatauppsättning

Användningsfall: Dokument AI

Format: HEIC (bilder) och .mov (videor)

Räkna: 94053

Anteckning: Nej

X

Beskrivning: Livefoton med handskriven text för japanska, koreanska och ryska

Inspelningsutrustning: iPhone & iPad kamera

Inspelningsvillkor: - Aggressiv belysning/bländning - Kamerablixt på - Färgat ljus - Lågt ljus, ingen kamerablixt - Normal

Japanska och koreanska språkdataset

Avgränsningsruta+text

Japanska och koreanska språkdataset

Användningsfall: OCR

Format: Bild

Räkna: 40k

Anteckning: Ja

X

Beskrivning: Den japanska och koreanska språkdatauppsättningen innehåller textexempel på både japanska och koreanska. Den har en mängd innehåll som meningar, fraser och ord, som omfattar olika sammanhang och stilar. Denna datauppsättning används för uppgifter som naturlig språkbehandling (NLP), maskinöversättning och textanalys i flerspråkiga applikationer.