Wat dragen we vandaag: een hemd met blazer of een shirt met jasje?

Convergentie en divergentie binnen Nederlandse kledingtermen

 

What to wear today: een hemd met blazer (‘a dress shirt with suit jacket’) or een shirt met jasje (‘a dress shirt with suit jacket’)? Convergence and divergence in Dutch clothing terminology

This paper reports on a corpus-based investigation into naming preferences in Belgian Dutch and Netherlandic Dutch for fourteen clothing terms. The study is a follow-up of Geeraerts, Grondelaers and Speelman (1999), in which soccer and clothing terminology from 1950, 1970 and 1990 was analysed as an indicator of standardisation in Dutch. This study extends the clothing corpus with new, comparable data from 2012 collected from magazines and shop windows. A profile-based measure of linguistic uniformity quantifies the differences in naming preferences across the 14 concepts between different varieties of Dutch. The results shed new light on the current linguistic situation in the Low Countries. The diachronic convergence between Belgian Dutch and Netherlandic Dutch found in Geeraerts, Grondelaers and Speelman (1999) seems to have come to a halt in present-day Dutch. On the other hand, the recent data confirm that the distance between the language in the lower register shop windows and the standard language in magazines remains largest in Belgian Dutch.

Keywords
 

Eind vorige eeuw presenteerden Geeraerts, Grondelaers en Speelman (1999) een veelzijdige studie naar de verhouding tussen het Nederlands in België en dat in Nederland2. Lexicale variatie bij vijftien kledingconcepten en evenveel voetbalbegrippen werd kwantitatief bestudeerd om na te gaan of er diachroon sprake was van convergentie of divergentie tussen de twee taalvariëteiten. Hiertoe werd krant- en magazinemateriaal uit 1950, 1970 en 1990 verzameld. Tegelijk werd de contemporaine interne taalstructuur van het Belgisch Nederlands en het Nederlands Nederlands vergeleken door het bovengewestelijke schriftelijke standaardtaalgebruik, gerepresenteerd door de kledingtijdschriften, te plaatsen naast dat van het regionaal gekleurde substandaardtaalniveau, zoals te vinden op prijskaartjes en labels in winkeletalages. Een derde pijler van de studie vertrok van attitudinele gegevens om het effect van normatieve taalzorg na te gaan en onderzocht daarbij eveneens de waarde van geëliciteerde data naast feitelijk taalgebruik. Methodologisch bestond de uitdaging erin om een nieuwe maat in te voeren om de onderzoeksvragen op een kwantitatief eenduidige wijze te beantwoorden. De hiertoe ontwikkelde profielgebaseerde uniformiteitsmaat laat toe om van geobserveerd taalgebruik te vertrekken om de gestandaardiseerdheid van de taalsituatie in kwestie te onderzoeken. Het achterliggende idee is immers dat uit een gemeenschappelijke linguïstische norm, hier de Nederlandse standaardtaal, gemeenschappelijk taalgebruik volgt. Enerzijds steunt de profielgebaseerde uniformiteitsmaat op het idee dat de overlapping in woordkeuze bij het uitdrukken van een concept tussen twee taalvariëteiten aanduidt hoe uniform die laatste zijn. Anderzijds laat de maat ook toe om te aggregeren over verschillende concepten zodat algemenere uitspraken over lexicale variatie tussen taalvariëteiten mogelijk worden. De twee belangrijkste empirische vaststellingen die volgden uit Geeraerts, Grondelaers en Speelman (1999) zijn de diachrone lexicale convergentie tussen het Nederlands Nederlands en het Belgisch Nederlands, grotendeels op het conto van die laatste, en de synchroon grotere afstand tussen de onderzochte registers in Nederlandstalig België (zie de laatste alinea van sectie 2 voor een meer uitgebreid overzicht van de resultaten).

Sindsdien hebben verschillende studies voortgebouwd op deze basis. Grondelaers et al. (2001b) hernemen enerzijds het kledingtermenonderzoek en voegen een nieuw corpus van internetmateriaal toe als bijkomende vertegenwoordiging van het meer informele niveau. Anderzijds stappen de onderzoekers over van lexicale variatie bij inhoudswoorden naar die bij functiewoorden. In Grondelaers et al. (2001a) wordt dieper ingegaan op het gebruik van internetmateriaal bij onderzoek naar lexicale standaardisering. Zenner, Speelman en Geeraerts (2012) vertrekken van de uniformiteitsberekening om het succes van Engelse leenwoorden na te gaan bij persoonsaanduidende nomina. Daarnaast zijn er verscheidene studies waarbij de vergelijking van verschillende methodes centraal staat, terwijl vorderingen in het onderzoek naar automatische synoniem- en betekenisbepaling toelaten dat de schaal van het onderzoek aanzienlijk vergroot wordt, mede door de toenemende beschikbaarheid van grote corpora. Speelman, Grondelaers en Geeraerts (2003; 2006) vergelijken aan de hand van vijftien profielen (een aangepaste versie van) de profielgebaseerde uniformiteitsmaat uit Geeraerts, Grondelaers en Speelman (1999)3 met niet-profielgebaseerde methodes met als doel om taalvariëteiten zo goed mogelijk te classificeren. Met hetzelfde doel, maar om andere methodes te vergelijken, vertrekken Ruette, Speelman en Geeraerts (2011) van 1455 profielen met telkens een typisch Belgisch-Nederlands gemarkeerde variant en Heylen en Ruette (2013) van 218 semiautomatisch geselecteerde concepten.

Deze vervolgstudie keert terug naar de oorsprong en neemt twintig jaar later de draad van de kledingtermen weer op. Voor veertien kledingconcepten zijn opnieuw verscheidene Belgische en Nederlandse (mode)tijdschriften doorzocht en winkeletalages bezocht4. De diachrone dimensie wordt zo uitgebreid met een nieuwe sprong van een twintigtal jaar. De convergerende trend tussen Belgisch Nederlands en Nederlands Nederlands kan nu verder onderzocht worden met data uit het tweede decennium van de eenentwintigste eeuw. Daarbovenop, terwijl er in Geeraerts, Grondelaers en Speelman (1999) enkel synchrone data voorhanden waren om variatie binnen respectievelijk het Belgisch en het Nederlands Nederlands te onderzoeken, beschikken we met de toevoeging van het nieuwe etalagemateriaal ook over een diachroon stratificationeel perspectief tussen 1990 en 2012.

Zoals bij Geeraerts, Grondelaers en Speelman (1999) moet dit lexicale variatieonderzoek gezien worden in het licht van de taalpolitieke geschiedenis van het Nederlands in België en de positie die het daarbij inneemt ten opzichte van het Nederlands Nederlands. Voor een uitgebreide beschrijving van de historische en taalpolitieke achtergrond bij het standaardiseringsproces van het Belgisch Nederlands verwijzen we naar Geeraerts, Grondelaers en Speelman (1999, pp. 12-29) (maar zie ook Van Hoof en Jaspers 2012 voor een kritisch overzicht van de standaardiseringsacties in Vlaanderen in de periode 1950-1980). Het volstaat in deze context om te herhalen dat het Belgisch Nederlands een standaardiseringsachterstand heeft opgelopen onder meer door de invloed van het Frans en dat de taalpolitiek vanaf de jaren zestig van de vorige eeuw bewust aansluiting met de Nederlands-Nederlandse norm nastreefde. Die integrationistische visie staat in contrast met het particularisme, waar er ruimte is voor een eigen Belgisch-Nederlandse standaardtaal. In deze context kan niet onvermeld blijven dat het idee van een standaardiseringsachterstand van het Belgisch Nederlands betwist wordt (Van Hoof & Jaspers 2012, pp. 97-98), of alleszins als problematisch beschouwd wordt (Grondelaers & van Hout 2011a, p. 200). Die laatsten wijzen er immers op dat de beschrijving van de standaardisering van het Belgisch Nederlands in het gedrang komt wanneer de Nederlands-Nederlandse situatie als ijkpunt genomen wordt, doordat beide nationale variëteiten historisch zeer verschillende standaardiseringsprocessen kennen (2011a, p. 200).

Het onderzoek van Geeraerts, Grondelaers en Speelman (1999) neemt de tweedeling, integrationisme tegenover particularisme, als vertrekpunt, maar houdt een descriptieve benadering aan om na te gaan bij welke visie de feitelijke data het best aansluiten. Hetzelfde geldt overigens voor dit artikel. Met de empirische bevindingen in deze studie beogen we niet om uitspraken te doen over de historische standaardiseringsprocessen van het Belgisch en Nederlands Nederlands. Wel gaan we van naderbij bekijken welke verschillen er tussen deze twee nationale variëteiten bestaan in de kledingwoordenschat. Zo zal onder meer blijken dat in de laatste twintig jaar er in het Belgisch Nederlands andere verschuivingen plaatsvinden dan in het Nederlands Nederlands.

In sectie 2 van dit artikel wordt het onderzoek van Geeraerts, Grondelaers en Speelman (1999) samengevat, in het bijzonder het deel met betrekking tot het kledingmateriaal. We lichten ook uitvoerig de profielgebaseerde uniformiteitsmaat toe. Daarna wordt in sectie 3 het huidige vervolgonderzoek voorgesteld en enkele methodologische aanpassingen toegelicht. Eveneens wordt er uitgebreid ingegaan op de huidige resultaten en wordt de vergelijking gemaakt met de originele studie. Sectie 4 is gewijd aan de conclusies en we bespreken verdere uitbreidingen in het studiedomein.

 

Het onderzoek in Geeraerts, Grondelaers en Speelman (1999) vertrekt ruwweg van twee basishypotheses. De diachrone convergentiehypothese steunt op de verwachting dat in de loop van de standaardiseringsbeweging van het Belgisch Nederlands de twee nationale variëteiten convergeren als gevolg van de expliciete normatieve oriëntatie op het Nederlandse Nederlands, kortom de integrationistische visie. Daarnaast veronderstelt de synchrone stratificatiehypothese een grotere afstand tussen het regionale en supraregionale niveau in België door de veronderstelde standaardiseringsachterstand. Immers, de bovengewestelijke standaardtaal in het Belgisch Nederlands is gebaseerd op een exogene norm en is niet het gevolg van een natuurlijk proces dat vanuit een (uitverkoren) dialect begonnen is.

Om na te gaan in welke mate er uniformiteit is tussen en binnen het Belgisch Nederlands en het Nederlands Nederlands werd een gebalanceerd corpus samengesteld met een geografische, diachrone en stratificationele dimensie. Voor de synoniemen van vijftien kleding- en vijftien voetbalconcepten werden observaties uit Belgische en Nederlandse kranten en tijdschriften uit 1950, 1970 en 1990 verzameld. Daarbovenop werden voor het kledingmateriaal benamingen op labels en etiketten uit etalages in twee Belgische en twee Nederlandse steden opgenomen. Leuven en Leiden golden hierbij als vertegenwoordiging van respectievelijk de linguïstische centra Brabant en de Randstad, terwijl Kortrijk en Maastricht dan weer gelegen zijn in economische centra met een secundaire academische functie, en zich daarenboven bevinden in de periferie van het taalgebied. In tegenstelling tot de benamingen in tijdschriften, werden deze labels niet geredigeerd door taalprofessionals en is de relatie met de potentiële koper veel directer. Het lezerspubliek van het etalagemateriaal is bovendien ook beperkter dan dat van het tijdschriftenmateriaal, maar de ruime regionale commerciële functie van de geselecteerde steden belet dat we te maken hebben met zuiver dialectisch taalgebruik. Dit semiformele schriftelijk brontype vormt zo een aanvulling op het nationaal gerichte tijdschriftenmateriaal binnen het stratificationele continuüm van het Nederlands. De twee gekozen lexicale velden bestaan bovendien telkens uit een representatieve selectie van basisbegrippen binnen het veld. Een gedetailleerde omschrijving van de materiaalverzameling is te vinden in Geeraerts, Grondelaers en Speelman (1999, pp. 30-35; pp. 162-164), voor een summier overzicht verwijzen we naar onderstaande tabel:

 

Tabel 1 Kwantitatief overzicht per lexicaal veld, land en brontype in aantal woorden

 

Om de lexicale convergentie tussen het Belgisch Nederlands en het Nederlands Nederlands te meten, introduceerden Geeraerts, Grondelaers en Speelman (1999) de profielgebaseerde uniformiteitsmaat. Hierbij is het onomasiologisch profiel van een bepaald concept in een gegeven bron het geheel van alternatieve benamingen voor dat concept uitgedrukt in de frequentieverhouding in die bron. Onderstaande tabel5 geeft de onomasiologische profielen weer voor het concept OVERHEMD (MAN) in het Belgische en Nederlandse standaardtaalmateriaal uit 1990 (respectievelijk B90 en N90 genoemd):

 

Tabel 2 Onomasiologische profielen voor OVERHEMD (MAN) in het Belgische en Nederlandse materiaal uit 1990

 

De uniformiteitsmaat drukt uit in hoeverre twee onomasiologische profielen overeenkomen. We spreken van maximale uniformiteit wanneer twee taalvariëteiten, door een gedeelde norm, voor eenzelfde begrip dezelfde benaming gebruiken. Het is ook mogelijk dat verschillende benamingen gebruikt worden voor een gegeven concept, maar dan moet de distributie hiervan identiek zijn in de beide variëteiten. Wanneer dit niet het geval is, wanneer de alternatieve lexicaliseringen binnen een profiel slechts gedeeltelijk hetzelfde gedistribueerd zijn, is er sprake van partiële uniformiteit.

Om de uniformiteit voor een bepaald concept te berekenen, meten we de overlapping in alternatieve benamingen tussen twee profielen. Anders gezegd, voor iedere alternatieve lexicalisering nemen we de kleinste relatieve frequentie van de twee profielen (gemarkeerd in donkergrijs in Tabel 2) en hiervan berekenen we de som om tot de uniformiteitsmaat te komen. Voor het concept OVERHEMD (MAN) houdt dat in dat de keuze voor de variant hemd in 17% van de gevallen overlapt tussen België en Nederland. Voor overhemd delen Belgisch Nederlands en Nederlands Nederlands 46% voorkeur en doordat in België shirt niet gebruikt wordt om OVERHEMD (MAN) uit te drukken, is er daar geen overlapping. Kortom, voor het begrip OVERHEMD (MAN) in Belgische en Nederlandse standaardtalige bronnen uit 1990 vinden we (17% + 46% + 0% =) 63% uniformiteit. Omgezet in formulevorm ziet deze intuïtieve berekening er zo uit:

We kijken dus naar de mate van onomasiologische uniformiteit U tussen de bronnen, of deelverzamelingen, Y1 en Y2 voor concept Z dat uitgedrukt wordt door de alternatieve benamingen x1 tot xn. Deze formule drukt uit dat de graad van uniformiteit berekend wordt door het minimum te nemen van de relatieve frequentie van variant xi voor concept Z in de materiaalverzameling Y1, weergegeven als FZ,Y₁(xi), en van dezelfde variant voor hetzelfde concept in de deelverzameling Y2. Dezelfde berekening wordt herhaald voor alle varianten xi die concept Z aanduiden en vervolgens worden alle minima opgeteld. Merk op dat voor mogelijke verschillen in conceptfrequentie tussen de deelverzamelingen gecontroleerd wordt door met de relatieve in plaats van de absolute frequenties te werken.

Om te aggregeren over verschillende concepten en te komen tot de gemiddelde uniformiteit voor een lexicaal veld wordt het gemiddelde genomen van de uniformiteitsgraad van alle concepten Zi in het veld, zoals onderstaande formule illustreert:

Tot slot is er nog een aanvulling op deze grondformule die het relatieve gewicht van het concept in het veld mee in rekening brengt. Immers, in communicatief opzicht is het logisch dat hoogfrequente concepten sterker doorwegen bij het meten van de uniformiteit van een lexicaal veld. De gewogen uniformiteit U’ neemt de som van de uniformiteitswaarde van elk concept vermenigvuldigd met de wegingsfactor G voor dat concept. Die laatste is de relatieve frequentie van concept Zi in de gehele deelverzamelingen Y1 en Y2. De formule voor de gewogen uniformiteit wordt dan:

Naast de onomasiologische uniformiteit introduceerden Geeraerts, Grondelaers en Speelman (1999) nog twee maten die toelaten een beter inzicht te krijgen in het materiaal. De interne uniformiteit drukt uit in hoeverre in een deelverzameling voor een bepaald concept eenzelfde benaming wordt gekozen. Twee factoren beïnvloeden de interne uniformiteit, het aantal alternatieve termen en de dominantie van een bepaalde term. De interne uniformiteit is de som van de relatieve frequentie in het kwadraat6 van ieder van de alternatieve benamingen voor een concept:

Voor het voorbeeld van OVERHEMD (MAN) uit Tabel 2 houdt dit in dat de interne uniformiteit voor het concept in het Belgisch Nederlands (0.31² + 0.69² =) 57,22% is en in het Nederlands Nederlands slechts (0.17² + 0.46² + 0.37² =) 37,74%. Deze maat drukt met andere woorden uit in hoeverre er een dominante term is om het lexicale concept uit te drukken. Om dan de interne uniformiteit van een lexicaal veld in een bepaalde bron te berekenen nemen we het gemiddelde van de interne uniformiteitswaarde van alle concepten in het veld:

Net als bij de (externe) uniformiteitsmaat speelt de conceptfrequentie een rol en wordt de wegingsfactor geïntroduceerd om een accurater beeld te krijgen van de interne uniformiteit binnen het lexicale veld:

Tot slot, om het relatieve aandeel van termen met een bepaald kenmerk (zoals ‘normatief afgekeurd’ of ‘van Franse oorsprong’) te berekenen in het bronmateriaal, is de aandeelmaat A geïntroduceerd. Bij deze maat staat K voor de verzameling van alle lexicaliseringen met dat kenmerk. De wegingsfactor W, een waarde van 0 tot 1, bepaalt voor een individuele variant in welke mate het lidmaatschap tot K moet doorwegen. Zo is jeans nog steeds ontegensprekelijk herkenbaar als van Engelse oorsprong, terwijl bij bloes de afstand tot het Frans iets groter is. Dat onderscheid uit zich in verschillende wegingen bij de berekening van de aandeelmaat7. De onderstaande formule toont vervolgens dat de aandeelmaat berekend wordt door de som van de relatieve frequentie van iedere lexicalisering voor een concept vermenigvuldigd met zijn specifieke wegingsfactor:

Als we dan opnieuw gaan kijken wat dat concreet betekent voor het concept OVERHEMD (MAN) uit Tabel 2, vinden we dat enkel de variant shirt een Engelse term is. Voor het Belgisch Nederlands is het aandeel voor het Engels dus 0%, want er zijn geen observaties van shirt, en voor het Nederlands-Nederlandse materiaal is het 37%. We berekenen vervolgens het gemiddelde om te komen tot het aandeel van een bepaald taalkundig kenmerk in een lexicaal veld:

Ook hier is er een gewogen alternatief, waarbij de frequentie van het concept Z in de gehele deelverzameling Y meegerekend wordt:

Vanuit deze systematische methodologische onderbouw is het een kleine stap om de diachrone convergentiehypothese en de synchrone stratificatiehypothese te operationaliseren in termen van uniformiteit. De convergerende beweging tussen het Belgische en Nederlandse Nederlands manifesteert zich in een stijgende uniformiteit over de tijdspanne van 1950 tot 1990. De grotere synchrone afstand tussen standaardtaal en substandaardtaal in België laat zich kwantificeren als een lagere uniformiteit tussen het tijdschrift- en het winkeletalagemateriaal in België dan in Nederland. We geven hierbij de voornaamste resultaten uit Geeraerts, Grondelaers en Speelman (1999) weer, relevant voor dit vervolgonderzoek.

De data in Figuur 18 tonen dat er in de tijdspanne van 1950 over 1970 tot 1990 onmiskenbaar sprake is van lexicale convergentie tussen Belgisch Nederlands en Nederlands Nederlands. De convergerende trend die waargenomen wordt, is bovendien voornamelijk te wijten aan een normatieve oriëntatie van het Belgisch Nederlands op het Nederlands Nederlands: typisch Nederlands-Nederlandse termen worden overgenomen ten koste van typisch Belgisch-Nederlandse uitdrukkingen. Verder geldt algemeen dat de interne uniformiteit van de concepten toeneemt: een dominante term binnen het profiel krijgt duidelijk de voorkeur op de onomasiologische alternatieven. Verder, zowel het Belgisch als het Nederlands Nederlands worden gekenmerkt door een toenemende invloed van Engelse kledingtermen. Voor het aandeel Franse termen wordt de ontwikkeling van het Belgisch Nederlands gekenmerkt door een duidelijk observeerbare afname als historische reactie tegen de Franse invloed, terwijl in het Nederlands-Nederlandse materiaal die afwijzing afwezig is. Opmerkelijk is wel dat het gebruik van Franse termen in Nederland onderhevig lijkt te zijn aan modegrillen: het aandeel “chique” Franse kledingtermen daalt aanzienlijk in 1970, wat toegeschreven kan worden aan de informele tijdsgeest van toen (Geeraerts en Grondelaers, 1999, p. 62). Tot slot, de veronderstelde vertraagde standaardisering van het Belgisch Nederlands wordt weerspiegeld door een beduidend grotere afstand tussen de supraregionale tijdschriftobservaties en het regionale winkeletalagemateriaal dan het geval is bij het Nederlands Nederlands.

Hoewel deze bevindingen steunen op een stevige empirische basis, blijft voorzichtigheid geboden bij de interpretatie ervan. Zo steunt het onderzoek op slechts twee lexicale velden en zijn de bevindingen dus niet zonder meer extrapoleerbaar naar andere woordvelden of woordsoorten. Ook de tweeledige stratificatie binnen het Nederlands in het onderzoek is slechts een beperkte representatie van de werkelijke registerdiversiteit (zie sectie 1 voor vervolgstudies die op deze twee punten uitbreidingen hebben voorgesteld). Tot slot, de omvang van het manueel aangelegde corpus laat niet toe om bepaalde statistische testen uit te voeren (met name de lineaire regressieanalyse). Voor de vergelijkingen van uniformiteitsindices wordt dus veiligheidshalve gewerkt met een foutenmarge van 5% alvorens met zekerheid gezegd kan worden of een uniformiteitswaarde groter al dan niet kleiner is dan een andere.

 

Figuur 1 Gewogen uniformiteitsverhoudingen binnen het kledingmateriaal

 

 

Om de vraag te beantwoorden of de synchrone stratificatiehypothese en de diachrone convergentiehypothese twintig jaar later nog steeds standhouden, werd het initiële corpus uitgebreid. De originele samenstelling werd hierbij zo goed mogelijk gerespecteerd. Voor het standaardtaalmateriaal werd gezocht naar observaties van kledingtermen in mode- en lifestylemagazines uitgegeven in 2012. Twee aanpassingen waren hierbij nodig. Zo waren sommige van de oorspronkelijk gebruikte tijdschriften niet langer in de handel verkrijgbaar en waren niet alle tijdschriften van de maanden januari en februari 2012 verkrijgbaar (zie Appendix 3 voor een overzicht). Voor het etalagemateriaal werden opnieuw winkeletalages in dezelfde twee Belgische en twee Nederlandse universiteitssteden uitgekamd9. Anders dan in de oorspronkelijke studie hebben we het concept MANTELPAKJE (VROUW) achterwege gelaten omwille van dataschaarste. Dit houdt eveneens in dat voor het materiaal uit Geeraerts, Grondelaers en Speelman (1999) alle berekeningen opnieuw uitgevoerd zijn voor veertien in plaats van vijftien concepten. Tabel 3 toont de samenstelling in aantal observaties voor veertien kledingconcepten in alle deelverzamelingen:

 

Tabel 3 Kwantitatief overzicht voor de kledingtermen per land en brontype in aantal woorden

 

Voor het testen van de hypotheses10 in deze vervolgstudie vertrekken we van dezelfde methodes als Geeraerts, Grondelaers en Speelman (1999). Aan de basis ligt de uniformiteitsmaat en die wordt aangevuld met de interne uniformiteitsmaat en de aandeelmaat voor linguïstische kenmerken. We zullen onze interpretaties baseren op de gewogen uniformiteit U’ omdat die maat de reële verhoudingen in het taalgebruik het best reflecteert.

We brengen in herinnering dat de statistische betrouwbaarheid van de berekeningen uit Geeraerts, Grondelaers en Speelman (1999) beperkt werd door de omvang van het corpus, maar dat die beperking opgevangen werd door een marge van 5% te hanteren bij het vergelijken van de resultaten. In Speelman, Grondelaers en Geeraerts (2003, p. 321; 2006, p. 192) wordt een bijkomende stap geïntroduceerd bij de uniformiteitsberekening, en die nemen wij in deze studie ook. Om na te gaan of een profiel uit de ene variëteit zonder meer vergeleken mag worden met het profiel voor hetzelfde concept in een andere variëteit, passen we eerst de log likelihood ratio test11 toe. Deze toets test de aannemelijkheid dat de twee profielen significant van elkaar verschillen. Indien dit niet het geval is, moeten we aannemen dat de uniformiteit maximaal (100%) is. Dat wil zeggen dat we op basis van de beschikbare data moeten concluderen dat de verschillende (absolute) frequenties voor de lexicaliseringen in de twee profielen te wijten zijn aan het toeval. In het andere geval, als de twee profielen wel significant van elkaar verschillen, kunnen we uitgaan van de betrouwbaarheid van de uniformiteitsmaat. We hanteren het gebruikelijke significantieniveau van 5%12. Parallel hebben we ook de uniformiteitsberekeningen gemaakt waarbij we deze voorafgaande aannemelijkheidsquotiënttest niet toepassen om na te gaan wat het effect ervan is. Hoewel de uniformiteit wat verschilt in waarde, zijn de waargenomen tendensen nagenoeg dezelfde. Waar er afwijkingen zijn, vermelden we die ook bij de resultaten. Tabel 6 in Appendix 2 geeft een overzicht van alle berekende uniformiteitswaarden.

Voor we tot de bespreking van de resultaten overgaan, verklaren we eerst de voorstellingswijze van de uniformiteitswaarden. Eerst geven we telkens schematisch de algemene tendens weer, om dan daaronder dezelfde vergelijking te kwantificeren. Helemaal rechts is tussen haken steeds een verwijzing te vinden naar het aantal concepten waarop de berekening gebaseerd is. Immers, in het materiaal van 1950 hebben we geen observaties van drie concepten, namelijk T-SHIRT (MAN/VROUW), LEGGING (VROUW) en JEANS (MAN/VROUW). Voor de diachrone convergentiehypothese vergelijken we daarom slechts uniformiteitswaarden gebaseerd op de gedeelde elf concepten. Wanneer we enkel data bekijken uit 1990 en 2012, zoals voor de stratificatiehypothese, gaan we uit van alle veertien kledingconcepten.

De convergentiebeweging die geconstateerd werd in Geeraerts, Grondelaers en Speelman (1999) zet zich niet voort in het nieuwe materiaal en een divergerende trend lijkt zich te manifesteren13:

(1)

De onderlinge toenadering tussen het Belgisch Nederlands en het Nederlands Nederlands in woordkeuze is niet langer af te leiden uit deze dataverzameling. Bijkomend kan dan de vraag gesteld worden aan welke kant de meeste verschuivingen plaatsvinden. Als de uniformiteit tussen de periodes lager is in België kunnen we daaruit afleiden dat de ontwikkelingen daar sterker zijn. In Geeraerts, Grondelaers en Speelman (1999) was de verwachting dat de convergentie kwam door wijzigingen aan de Belgische kant, wat vooral bevestigd werd door de vergelijking op lange termijn in (2). Ondanks de recente divergerende ontwikkeling vinden we in (3) dat de verschuivingen over de periode van 1950-2012 nog altijd enigszins sneller gebeuren aan Belgische kant. Hoewel een interval van deze lengte andere effecten kan maskeren, toont (4) dat ook voor de laatste tijdsafstand de bevindingen hetzelfde zijn. Het is wel zo dat de ongewogen uniformiteitsberekeningen in (5) een licht ander beeld tonen, namelijk dat de uniformiteit in Belgisch Nederlands iets hoger ligt. Wanneer we de data van naderbij bekijken, vinden we dat die vertekening grotendeels veroorzaakt wordt door de uniformiteit voor het laagfrequente concept KOSTUUM (MAN). Hier zien we duidelijk het effect van het niet mee in rekening brengen van de frequentie van concepten, wat de keuze om onze interpretaties te baseren op de gewogen uniformiteitsberekeningen bekrachtigt. In grote lijnen kunnen we stellen dat het verschil in ontwikkelingssnelheid met het Nederlands Nederlands geringer wordt en lijkt te stagneren14.

(2)
(3)
(4)
(5)

In Geeraerts, Grondelaers en Speelman (1999) werd bovendien met de nodige voorzichtigheid verondersteld dat standaardisering interne variatie reduceert. Immers, als alle taalgebruikers dezelfde benaming kiezen voor een bepaald begrip, is het taalgebruik in die situatie maximaal gestandaardiseerd. Hoewel het niet vaststaat hoeveel interne variatie normaal is voor een gestandaardiseerde taalsituatie, kan de Nederlands-Nederlandse situatie als ijkpunt genomen worden. De interne uniformiteit in (6) fluctueert maar in grote lijnen is er sprake van een toename in het Belgisch Nederlands. De voornaamste ontwikkeling gebeurde hierbij tijdens de eerste periode (1950-1970). Hoewel de interne uniformiteit van het Nederlands Nederlands in (7) over het algemeen hoog blijft, is deze ook onderhevig aan schommelingen. Ook in een gestandaardiseerde taal kunnen immers steeds onomasiologische verschuivingen optreden. Wanneer we kijken naar de interne uniformiteit voor alle veertien concepten bij het recentste materiaal in (8) vinden we zelfs een hogere interne uniformiteitswaarde voor het Belgisch Nederlands. Een mogelijke verklaring is dat het Belgisch Nederlands na de inhaalbeweging stopt met vernieuwen, aangezien er geen externe bron van variatie meer is, namelijk de exonormatieve oriëntatie. Deze stilstand kan dan een indicatie zijn van de mogelijke zoektocht naar een eigen Belgisch-Nederlandse norm, wat aansluit bij de particularistische visie.

(6)
(7)
(8)

Algemeen wordt aangenomen dat de ontwikkeling van het Belgisch Nederlands gekenmerkt wordt door een reactie tegen de Franse invloed, een afkeuring die afwezig geacht wordt in het Nederlands Nederlands (Geeraerts en Grondelaers 2000, p. 54). Voor termen van Engelse oorsprong daarentegen wordt een toegenomen aandeel verwacht. Voor zowel het Nederlands in België (9) als in Nederland (10) vinden we dat het aandeel Franse termen daalt, een tendens die overigens nog sterker is bij het ongewogen materiaal waar de laagfrequente concepten harder doorwegen. Zoals we al eerder aanhaalden, kan het grillige patroon voor het Franse aandeel bij het Nederlands-Nederlandse materiaal gerelateerd worden aan de trendgevoeligheid van het Nederlands Nederlands.

Eveneens vanuit taalintern perspectief vinden we dat het aandeel Engelse termen in beide variëteiten in (11-12) stijgt. Bovendien is dit patroon nog sterker wanneer we alle veertien kledingconcepten beschouwen in (13), aangezien JEANS (MAN/VROUW), LEGGING (VROUW) en T-SHIRT (MAN/VROUW) net nieuwe concepten zijn waarvoor aanvankelijk de Engelse term werd overgenomen. In (13) stellen we eveneens vast dat de Engelse invloed minder sterk aanwezig is bij het Nederlands Nederlands dan bij het Belgisch Nederlands. Terwijl de taalzuivering in Nederlandstalig België wegens historische redenen vooral gallicismen in het vizier nam, lijkt de houding tegenover anglicismen permissiever geweest te zijn. Nederland lijkt de Engelse invloed van meet af aan meer te weren.

(9)
(10)
(11)
(12)
(13)

Samenvattend kunnen we zeggen dat de toenadering tussen Belgisch Nederlands en Nederlands niet langer volgt uit het materiaal van 2012. Om de standaardiseringsachterstand in te halen zijn de verschuivingen diachroon altijd sneller geweest aan de Belgische kant, maar recent wordt het verschil met het Nederlands Nederlands minder duidelijk. Ook voor de interne uniformiteit zijn beide variëteiten tot op hetzelfde niveau genaderd. Voor het Belgisch-Nederlandse kan er hier sprake zijn van een normverschuiving weg van het Nederlands Nederlands. Verder lijkt zich naast de algemene afname van de Franse invloed in beide variëteiten, in Nederland eveneens een meer terughoudende reactie te manifesteren ten opzichte van het Engels.

Naast de ontwikkelingen op het standaardtaalniveau, laat de opbouw van de dataverzameling ook toe om de taalsituatie binnen de nationale variëteiten zelf te bestuderen. Het etalagemateriaal vertegenwoordigt het regiolectische niveau en wordt in de bespreking aangeduid met de stadsnaam waarvan de observaties afkomstig zijn. De hoofdhypothese in Geeraerts, Grondelaers en Speelman (1999) luidde dat er door de veronderstelde standaardiseringsachterstand in het Belgisch Nederlands een grotere afstand zou zijn tussen het standaard- en substandaardtaalgebruik. Zoals de berekeningen in (14) en (15) tonen, werd die verwachting destijds bevestigd en blijft dat ook het geval in de huidige dataset. Wel vinden we zowel voor het Belgisch Nederlands (16) als voor het Nederlands Nederlands (17) dat de afstand tussen regionaal en supraregionaal taalgebruik is afgenomen in de periode 1990-2012.

(14)
(15)
(16)
(17)

Dat de afstand tussen de twee registers groter is in België dan in Nederland impliceert overigens niet dat de onderlinge variatie tussen de regionale meetpunten ook groter zou zijn in België. Net als in de oorspronkelijke studie in (18), vinden we daarvoor ook nu geen bewijs in (19). Bovendien bevestigen de interne uniformiteitswaarden in (20-23) dat het Belgisch Nederlands niet heterogener is dan het Nederlands Nederlands.

(18)
(19)
(20)
(21)
(22)
(23)

Doordat deze vervolgstudie de opbouw van Geeraerts, Grondelaers en Speelman (1999) overneemt, beschikken we voor het substandaardtaalgebruik nu ook over een diachrone dimensie. Dit laat toe om na te gaan op welk stratificationeel niveau er de meeste verschuivingen zijn geweest de laatste twintig jaar. We herhalen dat een lagere uniformiteit een indicatie is voor meer ontwikkelingen. In Nederlandstalig België vinden we dat het bovengewestelijke niveau in (24) het meest in beweging is geweest, wat we kunnen linken aan de eerder geobserveerde divergerende tendens op dat niveau. Het Nederlands-Nederlandse materiaal in (25) toont een omgekeerde situatie, waarbij de verschuivingen vooral plaatsvinden op het regionale niveau. Voor de volledigheid signaleren we dat dit niet het geval is bij de ongewogen uniformiteit in (26), maar dat daar de waarden eerder vergelijkbaar zijn.

(24)
(25)
(26)

Verder was het een van de hypotheses in Geeraerts, Grondelaers en Speelman (1999) dat het standaardtalige Belgisch Nederlands dichter zou staan bij het Nederlands Nederlands dan bij het regionale taalgebruik in België. Deze verwachting werd niet alleen ingelost in Nederlandstalig België in (27), maar bleek ook te gelden voor het Nederlands Nederlands in (30). De internationale convergentie tussen de twee taalgebieden was met andere woorden sterker dan de intranationale uniformiteit. Voor de recentste data observeren we in (28) een toegenomen uniformiteit tussen het Belgische tijdschriften- en etalagemateriaal, maar het supraregionale niveau staat wel nog steeds dichter bij Nederlands Nederlands dan bij het regionale taalgebruik. De ongewogen uniformiteit in (29) laat echter een ander beeld zien onder invloed van laagfrequente concepten als COLBERT (MAN) en JACK (MAN/VROUW) die binnen het Belgische materiaal zeer uniform zijn, maar duidelijk andere lexicalisatievoorkeuren vertonen in Nederland. Tot slot merken we ook voorzichtig op dat in (31) het Nederlandse intranationale taalgebruik een licht sterkere uniformiteit vertoont.

(27)
(28)
(29)
(30)
(31)

Als laatste benaderen we de stratificatiehypothese vanuit taalintern perspectief. Voor de data van 2012 vinden we dat het Franse aandeel het grootst is in het regionale materiaal, wat vooral blijkt uit het ongewogen materiaal in (35) voor het Belgisch Nederlands en uit (37) voor het Nederlands Nederlands. Geeraerts, Grondelaers en Speelman (1999) brachten die observatie in verband met de commerciële functie van de winkeletalages, waar de appreciërende invloed van het Frans meer tot uiting komt. Daarnaast verwachtten Geeraerts, Grondelaers en Speelman (1999, p. 118; p. 126) dat het Franse aandeel het grootst zou zijn in de Leuvense en Kortrijkse etalages door de historische invloed van het Frans. De data wezen echter meer in de omgekeerde richting, wat als een mogelijke aanwijzing beschouwd werd dat de typisch Belgische puristische tendens ook tot het niveau van het minder formele taalgebruik doorgedrongen zou zijn. In navolging dan van de bevindingen in Geeraerts, Grondelaers en Speelman (1999, p. 126) kunnen we opnieuw verwachten dat de invloed van het Frans in (41) sterker is in Nederland dan in Vlaanderen. Daarnaast stellen we ten opzichte van 1990 in (38-39) een daling vast.

(32)
(33)
(34)
(35)
(36)
(37)
(38)
(39)
(40)
(41)

Voor het Engels bevinden de grootste verschuivingen zich in het Belgisch Nederlands. Het aandeel lexicaliseringen van (deels) Engelse oorsprong kent een toename in de periode 1990-2012 in (47) en komt zelfs tot op dezelfde hoogte als het aandeel in het Nederlands Nederlands in (50). Het ongewogen Belgisch-Nederlandse materiaal in (44) vertoont een groter aandeel op standaardtaalniveau dan op het niveau van het meer regionaal gekleurde taalgebruik door een toename van Engelse termen als skirt en blazer bij respectievelijk de minder frequente concepten ROK (VROUW), en COLBERT (MAN) en COLBERT (VROUW).

(42)
(43)
(44)
(45)
(46)
(47)
(48)
(49)
(50)

Ten slotte kijken we naar de invloed van taalnormering op het hedendaagse Belgische materiaal. We veronderstellen hier uitsluitend een synchroon perspectief omdat de laatste decennia het belang van taalzuiveringswerken is afgenomen (zie ook Van Hoof en Jaspers 2012, p. 112) en taaladviezen minder prescriptief zijn geworden (Hendrickx 2013, p. 26). Bovendien zijn de taalbeheersingsbronnen uit Geeraerts, Grondelaers en Speelman (1999) niet langer actueel. Vertrekkende van de afgekeurde termen in Theissen en Debrabrandere (2004) en Koops et al. (2005), bevestigt de aandeelmaat in (51) dat vooral het regionale, meer informele materiaal afgekeurde kledingbenamingen bevat. Een blik op de data toont dat dit voornamelijk komt door het concept JEANS (MAN/VROUW), waarvoor spijkerbroek volgens de normatieve werken de voorkeur heeft op jeans.

(51)

In het kort kunnen we stellen dat de oorspronkelijke stratificatiehypothese in grote lijnen bevestigd is voor het hedendaagse materiaal. De afstand tussen beide onderzochte registers blijft het grootst in het Belgisch Nederlands, maar dat maakt die variëteit intern niet heterogener dan het Nederlands Nederlands. In Nederlandstalig België vonden in de periode 1990-2012 de meeste verschuivingen plaats op het standaardtaalniveau, terwijl in Nederland dat het geval was op regionaal niveau. Het Nederlandse Standaardnederlands staat nu zelfs dichter bij het lagere register dan dat het bij het Standaard Belgisch Nederland staat. Ook de resultaten voor de aandeelmaten stemmen overeen met de traditionele verwachtingen. Het aandeel Franse termen is afgenomen en is groter in het regionale register, vooral dan in de Nederlands-Nederlandse data. Voor het Engels vinden we een inhaalbeweging bij het Belgisch Nederlands, waardoor het tot op dezelfde hoogte als het Nederlands Nederlands komt wat dit aandeel betreft. Ten slotte merken we de meeste afgekeurde termen op in het etalagemateriaal in België, maar kunnen we tegelijk een vraagteken plaatsen bij de huidige relevantie van taalzuiveringswerken.

 

De vervolgstudie die in dit artikel voorgesteld wordt, bouwt voort op de basis van Geeraerts, Grondelaers en Speelman (1999).Voor veertien kledingconcepten hebben we onderzocht of er voor de periode 1950-2012 sprake is van convergentie of divergentie tussen het Belgisch Nederlands en Nederlands Nederlands en of die eerste variëteit bovendien een grotere afstand vertoont tussen het regionale en supraregionale taalregister als gevolg van de exogene normgerichtheid. Hiertoe gaan we uit van een corpus van reëel taalgebruik dat op drie niveaus gelaagd is. De geografische dimensie weerspiegelt het pluricentrische karakter van het Nederlands, waarbij zowel de Nederlands-Nederlandse als de Belgische-Nederlandse variëteit vertegenwoordigd zijn. Het oorspronkelijke corpus bestond uit observaties van standaardtaalgebruik zoals aangetroffen in tijdschriften in 1950, 1970 en 1990 en daar is voor dit artikel een nieuwe deelverzameling aan toegevoegd met gelijkaardig materiaal uit 2012. Daarbovenop zijn er ook observaties opgenomen van kledingbenamingen uit winkeletalages in vier universiteitssteden in Vlaanderen en Nederland als weergave van het meer informele, regionaal gekleurde taalgebruik.

De methodologische vernieuwing uit Geeraerts, Grondelaers en Speelman (1999), met name de introductie van de profielgebaseerde uniformiteitsmaat, reikt een eenduidige berekeningswijze aan om de overlapping tussen de verschillende taalvariëteiten te meten. Op die manier hebben we de meervoudige bevindingen uit de oorspronkelijke studie gerepliceerd, wat verschillende nieuwe inzichten heeft opgeleverd. Figuur 2 geeft een overzicht van de resultaten voor de gewogen uniformiteitswaarden op basis van elf kledingconcepten15. In wat volgt vatten we eerst de voornaamste conclusies samen in verband met de verhouding tussen de nationale variëteiten en vervolgens bespreken we de evoluties binnen die nationale variëteiten in het licht van het destandaardiseringsdebat.

De verhouding tussen de nationale variëteiten: het Belgisch en Nederlands Nederlands groeien niet langer naar elkaar toe

Wanneer we over de periode 1950-2012 kijken naar de verhouding tussen het Belgisch Nederlands en het Nederlands Nederlands, kunnen we niet langer spreken van convergentie tussen het Belgisch Nederlands en het Nederlands Nederlands, maar observeren we een divergerende trend voor de periode 1990-2012. De langetermijntrend naar diachrone convergentie, zoals vastgesteld in Geeraerts, Grondelaers en Speelman (1999), lijkt dus omgebogen te zijn. Deze vaststelling bevestigt nu ook aan de hand van kwantitatieve metingen (zij het op een bescheiden steekproef) wat reeds elders in de literatuur geopperd werd. Waar de Belgisch-Nederlandse geschreven pers, de modebladen in deze studie, zich in de tweede helft van de twintigste eeuw qua woordgebruik steeds dichter naar de Nederlandse “norm” toebewoog, zien we nu, in het begin van de eenentwintigste eeuw, voor het eerst een lichte verwijdering optreden. Op de oorzaken van deze convergentiestop gaan we hier niet verder in, maar we verwijzen naar de in de literatuur (zie, o.a., Grondelaers en Van Hout 2011a, p. 228) reeds aangehaalde factoren zoals het grotere culturele en talige zelfbewustzijn in Nederlandstalig België, een verminderde aandacht voor taalzuivering en belgicismenvermijding, en het verminderde contact van de Vlaming met de Nederlandse media: allemaal factoren die de gerichtheid van het Belgisch Nederlands op de exogene Nederlands-Nederlandse norm deden afnemen. Interessant is nog dat de toenemende invloed van het Engels, in zekere zin een nieuwe exogene “norm”, deze keer inwerkend op beide nationale variëteiten, niet sterk genoeg is om een tegengewicht te bieden voor divergentie, zelfs niet in een trendgevoelig lexicaal veld als mode.

 

Figuur 2 Gewogen uniformiteitsverhoudingen binnen het kledingmateriaal (elf concepten)

 

Evoluties binnen de nationale variëteiten: standaardisering én (in)formalisering?

De tweede hoofdhypothese uit de oorspronkelijke studie betrof de grotere afstand tussen het bovengewestelijke formele en het regionaal gekleurde informele niveau in het Belgisch Nederlands in vergelijking met het Nederlands Nederlands. De uniformiteitsmaten uit 2012 bevestigen dat dit nog steeds het geval is. We vinden zelfs dat de intranationale uniformiteit, d.i. de overlapping tussen het supraregionale en het regionale register, in Nederland groter is dan de supranationale overeenkomst tussen het Nederlands Nederlands en het Belgisch Nederlands. De data duiden bovendien op een veranderende taalinterne situatie in beide nationale variëteiten. In het Nederlands Nederlands observeren we verschuivingen in het lagere register, terwijl in Nederlandstalig België net het omgekeerde het geval is. Tot slot vermelden we dat we in het Nederlands Nederlands een grotere terughoudendheid observeren ten opzichte van het Engels dan in het Belgisch Nederlands, alsook dat er een afname van de Franse invloed is op beide taalniveaus in de twee variëteiten.

Hoewel het de hoofdopzet van dit artikel was om de bevindingen van deze replicatiestudie (in opvolging van Geeraerts, Grondelaers en Speelman 1999) te beschrijven en de vergelijking te maken met de oorspronkelijke studie, bespreken we ook kort hoe de vaststellingen in deze studie in verband gebracht kunnen worden met het lopende onderzoek naar destandaardisering en demotisering van het Nederlands en het tussentaaldebat (zie o.a. Auer en Spiekermann 2011 voor een algemene beschouwing; Grondelaers en Van Hout 2011a; Absillis, Jaspers en Van Hoof 2012; Cajot 2012; Van Hoof en Jaspers 2012). Hierbij is het van belang om termen als (de)standaardisering te vertalen naar de verschillende processen die we bestuderen vanuit een profielgebaseerd perspectief. We maken een conceptueel onderscheid tussen drie dimensies en volgen hierin Geeraerts en Speelman (2014). De eerste dimensie gaat kijken of de afstand tussen twee taalregisters toe- of afneemt. We spreken dan van convergentie of divergentie16 en meten dit aan de hand van de uniformiteitsmaat. Als de afstand tussen twee taalregisters verandert, kan dat in twee richtingen. Wanneer het hogere taalregister zich naar het lagere beweegt, spreken we van informalisering. Het omgekeerde gebeurt bij formalisering. Tot slot, de variabiliteit binnen een bepaald register (voornamelijk, het hogere taalniveau) kan ook af- of toenemen. We spreken dan van (de)homogenisering. Een register wordt homogener als de variabiliteit afneemt en dus de interne uniformiteit groter wordt. Standaardisering, zoals opgevat door Auer en Spiekermann (2011), kan dan vanuit een profielgebaseerd perspectief in verband gebracht worden met convergentie, formalisering en homogenisering. Echter, deze drie dimensies zijn onafhankelijk van elkaar en kunnen dus in verschillende combinaties voorkomen.

Met de data waarover we nu beschikken, vinden we dat er zowel binnen het Belgisch Nederlands als binnen het Nederlands Nederlands convergentie (de afstand tussen de registers vernauwt, want de uniformiteit stijgt) en homogenisering (de interne uniformiteit stijgt in het hoogste register) optreedt. Deze tendensen voor twee van de drie dimensies wijzen dus op een klassiek standaardiseringproces. Bij de derde, (in)formaliserings-dimensie, zien we in de twee nationale variëteiten echter tegenovergestelde processen. In het Belgisch Nederlands beweegt het hogere register zich naar het lagere17: de traditionele exonormatieve oriëntatie maakt plaats voor een endogene, informelere norm. Deze verschuiving kan als demotisering in de zin van Kristiansen (2009) geïnterpreteerd worden. Meteen wordt in de Belgisch-Nederlandse situatie dan ook duidelijk dat aspecten van standaardisering en demotisering elkaar niet noodzakelijk uitsluiten. Bij het Nederlands in Nederland observeren we echter een verschuiving van het lagere taalniveau richting het hogere. In de Nederlandse situatie wijzen de drie dimensies voor de periode 1990-2012 dus op een klassiek standaardiseringsproces, en niet op aan de gang zijnde destandaardisering. Een mogelijke verklaring voor dit verrassende resultaat is dat in Nederland woordenschat historisch minder een markeerder is geweest van een lagere status dan in Nederlandstalig België, waar het net in het middelpunt stond in de taalverzorgingsliteratuur. Dit kan ook de tegenstelling met de bevindingen van Grondelaers en Van Hout (2011a) verklaren, doordat uitspraak en grammatica in Nederland misschien meer expliciete taalattitudes teweegbrengen. Hoe dan ook zijn verder onderzoek en een kritische beschouwing van termen als (de)standaardisering en (in)formalisering vanuit een profielgebaseerd perspectief (zoals in Geeraerts en Speelman (2014)) nodig om conclusies te trekken over de standaardiseringsstatus van het Nederlands.

Verder onderzoek: grotere corpora, meer registers en andere (lexicale) velden

Met de bevindingen in deze studie is nog niet alles gezegd over de taalsituatie in de Lage Landen. Verscheidene uitbreidingen zijn nodig om de vaststellingen uit dit onderzoek, hoe robuust ook, door te trekken met enige mate van zekerheid naar conclusies over de status en de structuur van het Nederlands. In eerste instantie is de uitbreiding van het corpus een cruciale stap. Zelfs voor slechts veertien kledingconcepten is het een tijdrovend proces om manueel data te verzamelen in tijdschriften en winkeletalages. De automatisering van het tellen van observaties in een elektronisch corpus zoals in Ruette, Speelman en Geeraerts (2011) en Heylen en Ruette (2013), is hiervoor deels een oplossing en kan een significante schaalvergroting opleveren, ook al leidt deze automatisering tot het verlies van de referentiële informatie uit afbeeldingen die de oorspronkelijke verzamelingswijze oplevert. Toch is het een voor de hand liggende keuze om voor de verzameling van concepten uit andere lexicale velden of van grammaticale constructies die lijn te vervolgen. Een corpusgebaseerde studie naar variatie zoals in dit onderzoek voorgesteld is, kan immers bijdragen aan het standaardtaalonderzoek. Daarnaast is de stratificationele opbouw van dit artikel slechts een beperkte weerspiegeling van de talige realiteit van het Nederlands. De toevoeging van andere registers zou toelaten om de complexiteit van het brede spectrum tussen de standaardtaal en de dialecten, in zowel geschreven als gesproken vorm, beter te beschrijven. Tot dan biedt deze studie enkel een gedeeltelijke inkijk in de lectale structuur van het Nederlands.

 

1Graag bedanken we masterstudente Tine De Cnodder (academiejaar 2012-2013) voor het verzamelen van de data uit zowel de tijdschriften en de winkeletalages. We danken ook de anonieme reviewers voor hun suggesties bij een eerdere versie van dit artikel. Het onderzoek waarover dit artikel rapporteert wordt gesteund door het OT-project 3H110243 van de KU Leuven.

2In dit artikel geldt, alsook het geval is in Geeraerts, Grondelaers en Speelman (1999, pp. 6-7), dat we zullen spreken van Belgisch Nederlands en Nederlands Nederlands om te verwijzen naar de twee geografisch gescheiden variëteiten van het Nederlands. In deze context vermijden we dus de term Vlaams, die ook verwijst naar een verzameling dialecten, evenals de spelling met koppelteken Belgisch-Nederlands, welke vooronderstelt dat het een aparte taalvariëteit betreft. Wanneer deze termen bijvoeglijk gebruikt worden, is een koppelteken onvermijdelijk.

3De City-block distance (CBD) uit Speelman, Grondelaers en Geeraerts (2003; 2006) meet niet de overlapping of uniformiteit (U) tussen twee taalvariëteiten, maar het verschil ertussen. Een simpele rekensom laat de overgang van de ene maat naar de andere toe, namelijk CBD = 1 - U, of anders genoteerd: U = 1 - CBD.

4Appendix 1 bevat een overzicht van de veertien kledingconcepten en hun frequentie in aantal woorden in de verschillende deelverzamelingen. Appendix 3 somt de tijdschriftbronnen voor het materiaal van 2012 op.

5De absolute frequenties van de kledingtermen in deze twee profielen zijn te vinden in Tabel 4 in Appendix 1.

6Door te kwadrateren wordt meer gewicht gegeven aan de dominantie van een één bepaalde term, wat niet het geval is door louter het gemiddelde te nemen. Een kleine vergelijking illustreert dit goed. In bron A wordt een bepaald concept aangeduid met vier synoniemen, in de verhouding 50%, 25%, 15% en 10%. Datzelfde concept kent in bron B een andere distributie, namelijk 85%, 5%, 5% en 5%. Door de interne uniformiteit te berekenen op basis van de som van de kwadraten, betekent dit dat in bron A, met 34,5%, de uniformiteit veel lager ligt dan in bron B, met 73%. Het gemiddelde in beide gevallen is evenwel 25%, en dus nietszeggend met betrekking tot de homogeniteit van de taalsituatie in bron A en die in bron B.

7Deze wegingsfactor wordt momenteel manueel bepaald door de onderzoeker, maar een andere mogelijkheid is het experimenteel meten van de herkenbaarheid van gallicismen en anglicismen. Voor de manuele toekenning onderscheiden we op verschillende gronden de waarden 0 (geen aandeel), 1 (volledig aandeel) en enkele tussenliggende gevallen. Kledingtermen waarvan zowel de schrijfwijze als de uitspraak nog dezelfde is als in de brontaal krijgen waarde 1, zoals caleçon en leggings voor LEGGING_V voor respectievelijk de Franse en Engelse aandeelmaat. Vernederlandste termen qua uitspraak en/of schrijfwijze die niet onmiddellijk als termen van vreemde herkomst herkenbaar zijn, ontvangen de score 0,5. Dit is bijvoorbeeld het geval bij vest voor VEST_MV. Aan samenstellingen met een Nederlands grondwoord en een grondwoord van Franse of Engels herkomst wordt waarde 0,5 toegekend, zoals bij jeansbroek voor JEANS_MV. Aan windbloes voor JACK_MV kennen we slechts 0,25 toe, op grond van het vernederlandste grondwoord bloes. Voor het aandeel van de taalzuiveringswerken geldt in eerste instantie een binaire toekenning, 0 (niet opgenomen in het taalzuiveringswerk) en 1 (afgekeurd). Vervolgens wordt het gemiddelde genomen van de waarden gebaseerd op de twee geraadpleegde werken.

8De uniformiteitswaarden in Figuur 1 zijn gebaseerd op de berekening voor elf kledingconcepten en kunnen dus voor het hedendaagse materiaal verschillen van de waarden die we opgeven bij de vergelijkingen (14-19; 24-31), omdat we daar uitgaan van alle veertien kledingconcepten.

9Net zoals voor de oorspronkelijke materiaalverzameling, zijn er vooral kleinere winkels (en niet grotere winkelketens) onderzocht (Geeraerts, Grondelaers en Speelman, 1999, p. 34). Het is echter aannemelijk dat een groot aantal van de boetieks in het straatbeeld plaats hebben gemaakt voor net die grotere winkelketens, wat verklaart waarom het aantal observaties voor het etalagemateriaal in 2012 ligt lager dan in 1990.

10Niet alle subhypotheses uit Geeraerts, Grondelaers en Speelman (1999) worden hier herhaald en getest met de nieuwe data uit 2012, maar de vergelijkingen zijn repliceerbaar met de tabellen uit Appendix 2.

11Voor het uitvoeren van de log likelihood ratio test gebruiken we de implementatie van Pete Hurd in R, genaamd de ‘g-test’, waarvoor de code te vinden is op: http://www.psych.ualberta.ca/~phurd/cruft/g.test.r.

12De significantiegrens van 5% die we hier vermelden verwijst naar de log likelihood ratio test en is dus niet hetzelfde als de foutenmarge gehanteerd in Geeraerts, Grondelaers en Speelman (1999) voor het vergelijken van twee uniformiteitswaarden. Bij het vergelijken van berekeningen die steunen op de interne uniformiteitsmaat en de aandeelmaat gebruiken we wel de statistische foutenmarge van 5%.

13De uniformiteitsindices voor het materiaal van 1950, 1970 en 1990 verschillen van die in Geeraerts, Grondelaers en Speelman (1999) omdat het concept MANTELPAKJE (VROUW) omwille van dataschaarste niet mee opgenomen is 2012. De originele uniformiteitswaarden werden daarom herrekend voor 14 concepten.

14Ook wanneer we de tijdsblokken opsplitsen, zien we een geleidelijke toename van de uniformiteit wat de plausibiliteit verhoogt van de interpretatie dat de ontwikkelingen vooral aan Belgische kant voorvallen. In dit opzicht, net als in Geeraerts, Grondelaers en Speelman (1999, p. 74), zijn er ook geen retardatie-effecten te observeren. We verwijzen hier slechts beknopt naar deze berekeningen omdat ze qua interpretatie niet verschillen van de oorspronkelijke studie en geen nieuwe inzichten opleveren. Appendix 2 geeft wel de relevante berekeningen weer om alle analyses uit de oorspronkelijke studie na te gaan.

15Doordat Figuur 2 een globaal overzicht geeft waarin zowel de basisbevindingen voor de diachrone convergentiehypothese als voor de stratificatiehypothese af te lezen zijn, geven we de uniformiteitswaarden weer voor elf kledingconcepten. Hierdoor verschillen de waarden voor onder andere het regionale materiaal met die van de vergelijkingen in sectie 3 van dit artikel, omdat we daar rekenen met veertien kledingconcepten.

16De termen convergentie en divergentie worden door de focus van Geeraerts, Grondelaers en Speelman (1999) voornamelijk geassocieerd met respectievelijk een vernauwing en een verwijding van de afstand tussen geografische variëteiten (cf. de diachrone convergentie tussen het Belgisch en Nederlands Nederlands), maar dit hoeft niet het geval te zijn. Convergentie betekent meer algemeen de vernauwing van de afstand tussen twee taalvariëteiten, zijnde geografisch, stratificationeel… In een discussie over standaardisering, wordt de term convergentie gebruikt om de afstand tussen twee verschillende registers te bestuderen. Merk hierbij op dat dit verschilt van de terminologie in Geeraerts en Speelman (2014), waar de dimensie ‘convergentie-divergentie’ aangeduid wordt met ‘(de)standaardisering’.

17In een profielgebaseerde aanpak operationaliseren we het concept ‘informalisering’ aan de hand van de volgende vergelijking: U(Li,Hi+1) > U(Hi,Li+1). Hierbij staat ‘L’ voor het lagere register, en ‘H’ voor hogere taalniveau, voor de twee tijdstippen ‘i’ en ‘i+1’. Voor de data uit deze studie wordt dat:

(52)
(53)

 
  1. Absillis, Kevin, Jürgen Jaspers en Sarah Van Hoof (red.), De manke usurpator. Over Verkavelingsvlaams, Gent: Academia Press, 2012.
  2. Auer, Peter en Helmut Spiekermann, ‘Demotisation of the standard variety or de-standardisation? The changing status of German in late modernity (with special reference to south-western Germany),’ In: Tore Kristiansen en Nikolas Coupland (red.), Standard Languages and Language Standards in a Changing Europe, Oslo: Novus Press, 2011, pp. 161-176.
  3. Cajot, José, ‘Waarom het Verkavelingsvlaams onvermijdelijk was. De ontwikkeling van een informele omgangstaal in Vlaanderen’, In: Kevin Absillis, Jürgen Jaspers en Sarah Van Hoof (red.), De manke usurpator. Over Verkavelingsvlaams, Gent: Academia Press, 2012, pp. 39-66.
  4. De Cnodder, Tine, ‘Convergentie en divergentie in de Nederlandse woordenschat anno 2012. Een onderzoek naar kledingtermen’, Meesterproef onder begeleiding van Dirk Geeraerts, Leuven: KU Leuven, 2012-2013.
  5. Geeraerts, Dirk en Dirk Speelman, ‘A lectometric definition of demotisation and destandardisation’, Presentatie op Taal & Tongval 2014 (28 november 2014), 2014.
  6. Geeraerts, Dirk en Stefan Grondelaers, ‘Purism and fashion. French influence on Belgian and Netherlandic Dutch’, Belgian Journal of Linguistics, 13 (1999), pp. 53-68. doi:10.1075/bjl.13.04gee.
  7. Geeraerts, Dirk, Stefan Grondelaers en Dirk Speelman, Convergentie en divergentie in de Nederlandse woordenschat: een onderzoek naar kleding- en voetbaltermen. Amsterdam: P.J. Meertens-Instituut, 1999.
  8. Goossens, Jan, ‘De toekomst van het Nederlands in Vlaanderen’, Ons Erfdeel 43 (2000), pp. 3-13.
  9. Grondelaers, Stefan, Dirk Geeraerts, Dirk Speelman en José Tummers, ‘Lexical standardisation in internet conversations. Comparing Belgium and The Netherlands’, In: Josep M. Fontana, Louise McNally, M. Teresa Turell en Enric Vallduví (red.), Proceedings of the First International Conference on Language Variation in Europe, Barcelona: Universitat Pompeu Fabra, Institut Universitari de Lingüística Aplicada, Unitat de Investigació de Variació Lingüística, 2001a, pp. 90-100.
  10. Grondelaers, Stefan, Hilde Van Aken, Dirk Speelman en Dirk Geeraerts, ‘Inhoudswoorden en preposities als standaardiseringsindicatoren. De diachrone en synchrone status van het Belgische Nederlands’, Nederlandse Taalkunde, 6-3 (2001b), pp. 179-202.
  11. Grondelaers, Stefan en Roeland van Hout, ‘The Standard Language Situation in the Low Countries: Top-Down and Bottom-Up Variations on a Diaglossic Theme’, Journal of Germanic Linguistics 23-3 (2011a), pp. 199-243.
  12. Grondelaers, Stefan en Roeland van Hout, ‘The standard language situation in The Netherlands’, In: Tore Kristiansen en Nikolas Coupland (red.), Standard Languages and Language Standards in a Changing Europe, Oslo: Novus press, 2011b, pp. 113-118.
  13. Hendrickx, Els, ‘Het effect van lexicale taaladvisering op het Belgisch-Nederlandse taalgebruik. Een diachroon corpusonderzoek naar factoren van invloed’, Dissertatie, Leuven: KU Leuven, 2013.
  14. Heylen, Kris en Tom Ruette, ‘Degrees of semantic control in measuring aggregated lexical distances’. In: Lars Borin en Anju Saxena (red.), Approaches to Measuring Linguistic Differences, (Trends in Linguistics. Studies and Monographs 265), Berlin: Mouton de Gruyter, 2013, pp. 353-374. doi:10.1515/9783110305258.353.
  15. Kristiansen, Tore, ‘The nature and role of language standardisation and standard languages in late modernity’, Projectvoorstel, 2009. http://dgcss.hum.ku.dk/exploratoryworkshops/proposal/ (18 mei 2015).
  16. Koops, Bert-Jaap, Pim Slop, Paul Uljé, Kees Vermeij en Dick van Zijderveld, ‘2400 x liever Nederlands. Woordenlijst onnodig Engels’, Stichting Nederlands, 2005. http://snn.vvb.org/woordenlijst/a.htm (22 augustus 2013).
  17. Ruette, Tom, Dirk Speelman en Dirk Geeraerts, ‘Measuring the lexical distance between registers in national varieties of Dutch’, In: Augusto Soares da Silva, Amadeu Torres en Miguel Gonçalves (red.), Línguas Pluricêntricas. Variação Linguística e Dimensóes Sociocognitivas, Braga: Publicações da Faculdade de Filosofia, Universidade Católica Portuguesa, 2011, pp. 541-554.
  18. Speelman, Dirk, Stefan Grondelaers en Dirk Geeraerts, ‘A profile-based calculation of region and register variation: the synchronic and diachronic status of the two main national varieties of Dutch’. In: Andrew Wilson, Dawn Archer en Paul Rayson (red.), Corpus Linguistics around the World, Amsterdam: Rodopi, 2006, pp. 181-194.
  19. Speelman, Dirk, Stefan Grondelaers en Dirk Geeraerts, ‘Profile-based linguistic uniformity as a generic method for comparing language varieties’, Computers and the Humanities, 37-3 (2003), pp. 317-337. doi:10.1023/A:1025019216574.
  20. Theissen, Siegfried en Peter Debrabandere. Woordenboek voor correct taalgebruik. Deurne: Wolters Plantyn, 2004.
  21. Van Hoof, Sarah en Jürgen Jaspers. ‘Hyperstandaardisering’, Tijdschrift voor Nederlandse Taal- en Letterkunde, 128-2 (2012), pp. 97-125.
  22. Zenner, Eline, Dirk Speelman en Dirk Geeraerts, ‘Cognitive Sociolinguistics meets loanword research: Measuring variation in the success of anglicisms in Dutch’, Cognitive Linguistics 23-4 (2012), pp. 749-792. doi:10.1515/cog-2012-0023.
 

Appendix 1 Overzicht observaties in alle subcorpora in aantal woorden

 

Tabel 4 Kwantitatief overzicht voor de veertien kledingconcepten in het standaardtaalmateriaal in aantal woorden

 

 

Tabel 5 Kwantitatief overzicht voor de veertien kledingconcepten in het substandaardtaalmateriaal in aantal woorden

 


Appendix 2 Uniformiteitswaarden, interne uniformiteitswaarden en aandeelmaten

 

Tabel 6 Uniformiteitswaarden voor elf en veertien kledingconcepten met en zonder de log likelihood ratio (LLR) significatietest

 

 

Tabel 7 Interne uniformiteitswaarden voor elf en veertien kledingconcepten

 

 

Tabel 8 Aandeelmaten voor de kenmerken ‘Frans’, ‘Engels’ en ‘afkeuring in taalzuiveringswerken’ voor veertien kledingconcepten

 


Appendix 3 Overzicht van de bronnen voor het materiaal uit 2012

Onderstaande bronnen werden geraadpleegd door Tine De Cnodder in de stedelijke bibliotheken van Herentals, Leuven en Eindhoven, alsook in de Koninklijke Bibliotheken van België (Brussel) en Nederland (Den Haag). De eerste twee maanden werden weggelaten omwille van de onbeschikbaarheid van de magazines Flair en Feeling uit die periode in de Koninklijke Bibliotheek van België.

  • Kledingnamenbronnen voor het vergelijkingspunt Nederland 2012 (N12)
    • Burda
    • KNIP
    • Margriet
    • Esquire
    • Cosmopolitan
    • Libelle (NL)
  • Kledingnamenbronnen voor het vergelijkingspunt België 2012 (B12)
    • Flair
    • Feeling
    • Libelle (BE)