Unicode

Wat is Unicode?

Unicode is een internationale standaard die aan ieder teken een unieke code toekent. Daardoor kan dezelfde tekst op verschillende systemen, apparaten en toepassingen consistent worden verwerkt. Denk aan gewone letters, accenten, aanhalingstekens, valutatekens, opsommingstekens, Arabische of Cyrillische letters en emoji.

Zonder zo’n standaard kunnen tekens verkeerd worden opgeslagen of onjuist verschijnen. Dat is niet alleen onhandig, maar kan ook gevolgen hebben voor de toegankelijkheid. Hulpsoftware moet namelijk kunnen herkennen welk teken er staat om het correct uit te spreken of weer te geven.

Waarom is Unicode relevant voor digitale toegankelijkheid?

Digitale toegankelijkheid vraagt om inhoud die technisch correct is opgebouwd en voor verschillende gebruikersagenten goed te interpreteren is. WCAG is erop gericht om content toegankelijk te maken voor mensen met verschillende beperkingen. Daarbij is niet alleen van belang wat er visueel op het scherm staat, maar ook hoe de inhoud onderliggend is gecodeerd.

Unicode ondersteunt toegankelijkheid op meerdere manieren:

1. Correcte uitspraak door schermlezers

Schermlezers lezen tekst niet op basis van hoe iets eruitziet, maar op basis van de onderliggende tekens. Wanneer een teken visueel lijkt op een ander teken, maar technisch een ander Unicode-teken is, kan hulpsoftware het anders of fout uitspreken. W3C noemt dit expliciet als risico: tekens die er hetzelfde uitzien, worden niet altijd hetzelfde verwerkt door text-to-speech.

Een bekend voorbeeld is het gebruik van een speciaal symbool of een teken uit een ander schrift als vervanging van een gewoon leesteken of letter. Voor ziende gebruikers lijkt dat vaak geen probleem, maar voor schermlezers kan het resultaat verwarrend zijn.

2. Ondersteuning van meerdere talen en scripts

Overheden en grotere organisaties publiceren steeds vaker content in meerdere talen. Unicode maakt het mogelijk om verschillende schriften binnen één digitale omgeving correct te verwerken, zoals Latijns, Grieks, Arabisch of Chinees. Dat is essentieel voor inclusieve communicatie en voor correcte verwerking door browsers, pdf-software en hulptechnologie.

3. Betere uitwisseling tussen systemen

Tekst gaat vaak van CMS naar website, van Word naar pdf, van zaaksysteem naar e-mail of van formulier naar backoffice. Als de tekencodering niet goed is ingericht, kunnen vreemde tekens ontstaan zoals Ã© in plaats van é. Dat tast de leesbaarheid aan en kan gebruikers laten twijfelen aan de betrouwbaarheid van de informatie.

4. Juist gebruik van leesvolgorde en richting

Bij talen die van rechts naar links worden geschreven, zoals Arabisch of Hebreeuws, spelen speciale Unicode-markeringen een rol bij de juiste weergave en volgorde van tekst. W3C beschrijft bijvoorbeeld dat een Unicode right-to-left mark nodig kan zijn om leestekens correct te positioneren.

Waar gaat het in de praktijk mis?

In veel digitale content ontstaan toegankelijkheidsproblemen niet door het ontbreken van tekst, maar door het gebruik van verkeerde of ongeschikte tekens.

Veelvoorkomende voorbeelden zijn:

Speciale symbolen gebruiken als betekenisdrager

Soms worden symbolen gebruikt om informatie over te brengen, bijvoorbeeld:

een vinkje om “goedgekeurd” aan te duiden
een sterretje om “verplicht veld” aan te geven
pijltjes of blokjes als enige navigatiehulp

Wanneer zo’n symbool geen duidelijke tekstuele context heeft, kan de betekenis voor sommige gebruikers onduidelijk zijn. WCAG vereist dat niet-tekstuele informatie waar nodig ook tekstueel beschikbaar is.

Visueel mooie, maar technisch ongeschikte tekens

Contentmakers kiezen soms voor typografisch opvallende tekens of tekens die lijken op gewone letters. Denk aan een decoratief bolletje, een mathematisch symbool of een letter uit een ander alfabet die er ongeveer hetzelfde uitziet. Visueel werkt dat misschien, maar technisch kan het fout gaan.

In de volgende voorbeelden staat de zin ‘Deze tekst ziet er mooi uit, maar wordt mogelijk niet opgelezen door een schermlezer.‘ in verschillende Unicode tekst stijlen als voorbeeld:

𝒟ℯ𝓏ℯ 𝓉ℯ𝓀𝓈𝓉 𝓏𝒾ℯ𝓉 ℯ𝓇 𝓂ℴℴ𝒾 𝓊𝒾𝓉, 𝓂𝒶𝒶𝓇 𝓌ℴ𝓇𝒹𝓉 𝓂ℴℊℯ𝓁𝒾𝒿𝓀 𝓃𝒾ℯ𝓉 ℴ𝓅ℊℯ𝓁ℯ𝓏ℯ𝓃 𝒹ℴℴ𝓇 ℯℯ𝓃 𝓈𝒸𝒽ℯ𝓇𝓂𝓁ℯ𝓏ℯ𝓇.
𝔻𝕖𝕫𝕖 𝕥𝕖𝕜𝕤𝕥 𝕫𝕚𝕖𝕥 𝕖𝕣 𝕞𝕠𝕠𝕚 𝕦𝕚𝕥, 𝕞𝕒𝕒𝕣 𝕨𝕠𝕣𝕕𝕥 𝕞𝕠𝕘𝕖𝕝𝕚𝕛𝕜 𝕟𝕚𝕖𝕥 𝕠𝕡𝕘𝕖𝕝𝕖𝕫𝕖𝕟 𝕕𝕠𝕠𝕣 𝕖𝕖𝕟 𝕤𝕔𝕙𝕖𝕣𝕞𝕝𝕖𝕫𝕖𝕣.
D͓̽e͓̽z͓̽e͓̽ ͓̽t͓̽e͓̽k͓̽s͓̽t͓̽ ͓̽z͓̽i͓̽e͓̽t͓̽ ͓̽e͓̽r͓̽ ͓̽m͓̽o͓̽o͓̽i͓̽ ͓̽u͓̽i͓̽t͓̽,͓̽ ͓̽m͓̽a͓̽a͓̽r͓̽ ͓̽w͓̽o͓̽r͓̽d͓̽t͓̽ ͓̽m͓̽o͓̽g͓̽e͓̽l͓̽i͓̽j͓̽k͓̽ ͓̽n͓̽i͓̽e͓̽t͓̽ ͓̽o͓̽p͓̽g͓̽e͓̽l͓̽e͓̽z͓̽e͓̽n͓̽ ͓̽d͓̽o͓̽o͓̽r͓̽ ͓̽e͓̽e͓̽n͓̽ ͓̽s͓̽c͓̽h͓̽e͓̽r͓̽m͓̽l͓̽e͓̽z͓̽e͓̽r͓̽.͓̽
D🅔🅩🅔 🅣🅔🅚🅢🅣 🅩🅘🅔🅣 🅔🅡 🅜🅞🅞🅘 🅤🅘🅣, 🅜🅐🅐🅡 🅦🅞🅡🅓🅣 🅜🅞🅖🅔🅛🅘🅙🅚 🅝🅘🅔🅣 🅞🅟🅖🅔🅛🅔🅩🅔🅝 🅓🅞🅞🅡 🅔🅔🅝 🅢🅒🅗🅔🅡🅜🅛🅔🅩🅔🅡.

Gekopieerde tekst uit andere bronnen

Tekst uit pdf’s, social media, Word-documenten of externe websites bevat soms verborgen of afwijkende Unicode-tekens. Bijvoorbeeld niet-afbreekbare spaties, rare aanhalingstekens of onzichtbare stuurtekens. Dat kan invloed hebben op zoekfuncties, schermlezeruitspraak en verwerking in formulieren of sjablonen.

Richtlijnen omtrent Unicode voor contentteams

Het onjuist gebruik van Unicode opmaak kan er dus voor zorgen dat gebruikers van assisterende software informatie missen. Gebruik daarom de volgende uitgangspunten bij tekstcontent in websites en pdf-documenten.

Let op bij kopiëren en plakken

Controleer content die uit andere systemen komt op vreemde tekens, onzichtbare spaties en foutieve aanhalingstekens. Plak voor de zekerheid tekst in je browserbalk of in Notepad om de opmaak van Word of andere programma’s te verwijderen.

Kies geen lookalikes

Gebruik geen tekens die alleen visueel op gewone letters of leestekens lijken. Wat er correct uitziet, hoeft technisch niet correct te zijn. Juist daar kunnen schermlezers last van hebben.

Test met assisternede software

Twijfel je over een symbool, speciaal teken of meertalige tekst? Test dan hoe een schermlezer dit uitspreekt. Problemen worden vaak pas duidelijk in daadwerkelijk gebruik. Dit punt is overigens altijd een goed advies.

Vincent van Brakel

In dit artikel

Inhoudsopgave