juli 2021

bekijk deze nieuwsbrief in uw browser

jaargang 13, nummer 2

Beste lezer,

Dit is de nieuwe Nieuwsbrief Terminologie, waarin u informatie vindt over actuele zaken op terminologiegebied, zoals nieuws en evenementen. Eerdere nieuwsbrieven vindt u hier.

Reacties en tips zijn welkom. Als u deze nieuwsbrief niet meer wilt ontvangen, kunt u zich als volgt uitschrijven: klik op de link 'inschrijving of gebruikersprofiel bijwerken' onderaan in deze nieuwsbrief. U ontvangt een e-mail met een link om uw voorkeuren bij te werken. Klik op deze link, vink 'Terminologienieuwsbrief' uit en klik op 'voorkeuren bijwerken' om te bevestigen.

Vriendelijke groet,
Het redactieteam van het INT

Contact: Dirk Kinable
+31 (0)71 527 24 89
dirk.kinable@ivdnt.org
www.ivdnt.org

Inhoud

Terugblik
Nieuws
Tools en bronnen
Uitgelichte term
Bericht van NL-Term
Agenda (zie ook ivdnt.org)

Terugblik

Juridische vertaalinstanties en terminologie

Van nationale of supranationale overheden en hun instellingen is bekend dat ze voor hun werking en beleidsuitvoering behoefte hebben aan een goed georganiseerde infrastructuur voor juridische vertalingen. In de praktijk houdt dat op zijn minst een driehoeksverhouding in tussen overheid/instelling, juridische vertaalinstanties en terminologie. Hoe deze relatie haar beslag krijgt in de dynamiek van verschillende politieke contexten, werd belicht in twee gastcolleges die de KULeuven-campus Antwerpen organiseerde in het kader van haar vertaalopleidingen.

Gastlezing 1. Het Duits in België en de juridische vertaling naar het Duits op federaal vlak: een overzicht

Albert Henn, diensthoofd van de Centrale Dienst voor Duitse Vertaling belichtte op 20 april de werkzaamheden van zijn afdeling in de Belgische federale staatsstructuur. De overheveling van de kantons Malmedy met inbegrip van St. Vith, en Eupen, van Duitsland naar België werd al vastgelegd in het Verdrag van Versailles (28 juni 1919) maar het proces van institutionele uitbouw van vertaalvoorzieningen is veel recenter. Deze uitbouw blijkt nauw verbonden met politieke evoluties en beslissingen van wetgevende en rechterlijke instanties. Een belangrijke rol speelde vooral de Belgische staatshervorming van 1970 die voorzag in de oprichting van drie cultuurgemeenschappen waaronder de Duitse, thans Duitstalige Gemeenschap genoemd. Andere beslissende momenten waren de oprichting van de Centrale Dienst voor Duitse vertaling CDDV in 1976 en een arrest in 1994 van het Arbitragehof, thans het Grondwettelijk Hof, dat bepaalde dat alle wettelijke en verordenende teksten afkomstig van de federale overheid van na 1 januari 1989 systematisch in het Duits moeten worden vertaald. De Collas-wet van 2007, genoemd naar de senator die het voorstel indiende, legde ook de taken van de centrale vertaaldienst vast: vertaling van de federale wetten, de Koninklijke Besluiten en de Ministeriële Besluiten van de Belgische Federale Openbare Dienst Binnenlandse Zaken; daarnaast kunnen andere ministeries betaalde vertaalopdrachten laten uitvoeren.

Vertaalinfrastructuur

Deze beleidsbeslissingen lagen aan de basis van een vertaalinfrastructuur die intussen zo’n 6000 federale normen in het Duits ter beschikking stelt, goed voor ca. 80.000 A4-bladzijden. Het vertaalwerk in Malmedy gebeurt traditioneel in 5 stappen, namelijk de eigenlijke vertaling, de revisie door de vertaler zelf, de revisie door een revisor, de feedback door de revisor en de onderlinge discussie, en uiteindelijk de opmaak van de eindversie door de vertaler. Bijkomende lezingen in samenspraak met domeinexperten vinden plaats voor complexe juridische en technische regelgeving. Deze procedurele, statische taakaspecten combineert CDDV met de dynamiek die zich in het vertalersberoep voltrekt door productieverhogend gebruik van tekstherkenningsprogramma’s en Neural Machine Translation. Ondanks automatiseringsondersteuning blijft de vertaler noodzakelijk voor postediting of revisie, en voor recherchewerk, bijvoorbeeld wanneer de Nederlandstalige en Franstalige brontekst minder eensluidend en kwalitatief gelijkwaardig zijn dan idealiter gewenst.

Termbanken

Terminologie verschaft deze juridische vertaalpraktijk een onmisbaar steunvlak. De CDDV-website stelt in dit verband drie databases ter beschikking: de termbanken DEBETERM en SEMAMDY, en de database TITREOFF (interface naar de Duitse vertaling van Belgische wetten en besluiten). Daarbij dient men zich te realiseren dat DEBETERM (van de Commissie voor de Duitse rechtsterminologie van de Duitstalige Gemeenschap) en SEMAMDY (van de Centrale Dienst voor Duitse Vertaling CDDV) zijn gebaseerd op Belgische normen. Voor betreffende Nederlandse, Duitse en Franse normen kunnen ze daardoor maar gedeeltelijk hulp bieden. Waar echter nationale normen op normen van de Europese Unie steunen, kunnen deze databases wel behulpzaam zijn.

DEBETERM (D-NL/FR)

De database DEBETERM is via SDL MultiTerm Online beschikbaar en biedt de daar gebruikelijke zoekmogelijkheden. Het aantal gelijktijdige gebruikers is beperkt tot 35 en er is een time-out na 30 minuten. DEBETERM telt op dit ogenblik ongeveer 2.500 records. DEBETERM vertoont een eerder volledige opbouw, kenmerkend voor een officiële database van een gespecialiseerde commissie van juristen, waar de nadruk absoluut op betrouwbaarheid ligt.

SEMAMDY (D-NL/FR)

De CDDV heeft een eigen terminologische gegevensbank, SEMAMDY genaamd. Deze wordt voor een groot gedeelte online ter beschikking gesteld via een eigen zoekmodule. Online telt het bestand meer dan 50.000 records afkomstig uit Belgische federale normen. De termen uit DEBETERM verschijnen met dezelfde informatie ook in SEMAMDY. SEMAMDY is een terminologische werkdatabase, een eenvoudig intern werkinstrument, met alle beperkingen van dien, dat voor het grote publiek toegankelijk wordt gemaakt. De Nederlandstalige en Franstalige termen in SEMAMDY zijn overgenomen uit wetten en besluiten, zonder kritische benadering. De overeenstemmende Duitse termen zijn op hun betrouwbaarheid getoetst. Opzoekingen in de module zijn heel eenvoudig en op de website beschreven.

TITREOFF

TITREOFF is een drietalig bestand voornamelijk van opschriften van Belgische federale wetten en besluiten. Het dient als interface om de Duitse geconsolideerde versies van federale normen te downloaden. Het telt meer dan 15.000 records, waarvan 6.000 met een directe link naar de voortdurend geactualiseerde word-versie van de Duitse tekst. Voor zoekacties is er een eenvoudig zoekscherm naar afkondigings- en/of bekendmakingsdatum van de betreffende norm en/of naar trefwoorden.

Aanwervingen bij de CDDV gebeuren via het selectiebureau van de Belgische overheid SELOR. Vereist zijn naargelang van het geval een diploma bachelor of master alle studierichtingen. Voor niet-Belgische diploma’s is een erkenning vereist. Gevraagd wordt een kennis van het Duits niveau moedertaal, een goede kennis van het Frans en een goede passieve kennis van het Nederlands. Kandidaturen zijn welkom bij info@scta.be.

Gastlezing 2. Vertalen voor het Hof van Justitie

Een tweede constellatie van overheid of overheidsinstelling, vertaalinstanties en terminologie stond centraal in een webinar over de juridische vertaalpraktijk aan het Hof van Justitie van de Europese Unie. Op 4 mei belichtte Koen Wolfs, hoofd van de Nederlandstalige vertaalafdeling, vier klassieke uitdagingen waarmee de vertaalwerkzaamheden gepaard gaan. De werktaal voor beraadslagingen en arresten van het Hof is Frans maar daarnaast bepaalt de taalregeling voor het Hof dat de taal gebruikt bij de procesvoering een van de 24 (de facto 23) officiële talen kan zijn: bij prejudiciële zaken de taal van de verwijzende rechter, bij rechtstreekse beroepen de taal van de verzoeker, en bij niet-nakomingszaken de taal (of een van de talen) van de lidstaat. De rechtspraak van het Hof dient in alle officiële talen te worden vertaald.

Talencombinaties

Een eerste uitdaging is bijgevolg dat er 552 (24x23) talencombinaties mogelijk zouden zijn indien alle teksten rechtstreeks van de ene taal in de andere taal zouden worden vertaald. Om het vertaalwerk efficiënter te laten verlopen, is gekozen voor een systeem van spiltalen waarbij eerst naar de meest gebruikte talen van de Unie wordt vertaald (naargelang van het geval Engels, Duits, Spaans, Italiaans of Pools), en pas daarna naar de andere. Zo is Duits de spiltaal voor Nederlandstalige bronteksten. Bij dit systeem staat de kwaliteit voorop: indien juristen-vertalers binnen een afdeling ook andere dan de spiltalen beheersen, zal bij voorkeur rechtstreeks uit die talen worden vertaald en/of gereviseerd. Voorts zal de vertaling in de spiltaal en in het Frans steeds worden gecontroleerd door een native speaker van de procestaal, om te vermijden dat eventuele fouten in de spilvertaling doorsijpelen in de afgeleide vertalingen of pas in een late fase van de procedure aan het licht komen.

Stijgende werklast

De tweede uitdaging bestaat uit de werklast die voortvloeit uit het gestaag toenemende aantal te vertalen bladzijden. Restricties voor de publicatie en omvang van documenten werden noodzakelijk, evenals productieverhogende maatregelen door de productie door freelancers te optimaliseren en computerondersteunde vertalingstechnieken in te zetten.

Talen, rechtssystemen en terminologie

Het doel om te voldoen aan de vertalingsbehoefte van deze juridische instelling resulteert meteen ook in de derde uitdaging, die direct betrekking heeft op de terminologie. Onder het overkoepelende EU-rechtssysteem vormt de combinatie van 24 officiële talen met tientallen nationale rechtssystemen een onderliggende realiteit. Eenzelfde taal kan aan meer nationale rechtssystemen gerelateerd zijn, zoals het Duits, het Nederlands en het Frans. Termvarianten zijn daardoor vaak specifiek voor individuele rechtssystemen. Zo duiden het Belgisch-Franse inculpé en het Frans-Franse mis en examen beide een persoon aan die door de onderzoeksrechter formeel in kennis is gesteld dat hem bepaalde feiten ten laste worden gelegd. Een complexere situatie nog ontstaat wanneer verschillende rechtssystemen binnen één taal een andere begripsafbakening hanteren. Dit verschijnsel werd onder meer geïllustreerd met de Nederlandstalige term verdachte. Het achterliggende concept blijkt in Nederland veel breder dan in België en overkoepelt de in België geldende opsplitsing in verdachte, inverdenkinggestelde, inbeschuldiginggestelde, beklaagde en beschuldigde. Vertaling naar een andere taal en rechtssysteem vergt dus de nodige nuancering om begripsverwarring te vermijden.

Vertaalstrategieën

Een aantal vertaalstrategieën echter die uitkomst kunnen bieden, passeerden in de webinar de revue. Waar het een unierechtelijke kwestie betreft, laat men de unierechtelijke term primeren. De vertaler kan ook kiezen voor een functioneel equivalent (bijvoorbeeld, contrat/Vertrag/overeenkomst) of een leenwoord inlassen en dus niet vertalen maar een omschrijving toevoegen, zoals voor namen van bestuurlijke of rechterlijke instanties. Functionele equivalenten in juridische vertalingen (zie voor meer informatie de bijdragen van F. Terral, p. 40 e.v. en M. Harvey, p. 42 e.v.) drukken in wezen dezelfde functie uit, zonder honderd procent identiek te zijn. De verschillen zijn van ondergeschikt belang. Letterlijke vertalingen echter behoren eveneens tot de mogelijkheden (bijvoorbeeld, high court/haute court, d.w.z. formele equivalentie) of de introductie van een neologisme. Verder kunnen korte, benaderende omschrijvingen verhelderend zijn, zeker wanneer vertaald moet worden naar een rechtstaal die begrippen anders afbakent (Fr. contraventions, délits, crimes/ Eng. minor offences, major offences and serious crimes). Voor aangelegenheden van een specifieke lidstaat, sluit men aan bij de daar gangbare terminologie, bijvoorbeeld Hoge Raad en college van burgemeester en wethouders in Nederland en Hof van Cassatie, college van burgemeester en schepenen in België. Als strategie voor een duidelijke vertaling kan de vertaler verder in beginsel aansluiten bij de terminologie van de grootste groep (“établir un acte notarié/een notariële akte passeren” (NL) i.p.v. “een notariële akte verlijden” (VL)). Een andere techniek bestaat erin om een term of uitdrukking te gebruiken die bekend is in beide systemen (“partijen zijn het erover eens” i.p.v. “het is in confesso”), te kiezen voor een overkoepelende term (“openbare aanklager” i.p.v. “officier van justitie” (NL) of “procureur des konings” (BE), of voor een term die niet tot verwarring kan leiden (“bestuurder” i.p.v. “zaakvoerder” van een GmbH).

Zoekstrategieën en hulpmiddelen

Door de complexe aard van een juridische vertaalopdracht dient een vertaler bijgevolg te beschikken over gedegen voorkennis en/of zich verder in te werken aan de hand van uiteenlopende bronnen. Voor kennismaking met de EU en het Unierecht zijn zowel algemene bronnen beschikbaar (meertalige handboeken/brochures en inleidingen als meer specifieke (meertalige portaalsites zoals het Europees E-Justitieportaal (23 talen), de EUR-Lex-site, de site van het Hof van Justitie enz.). Frequent zal een juridisch vertaler zijn inzicht moeten verdiepen door contextueel te zoeken, bijvoorbeeld op webpagina’s voor wetgeving en rechtspraak van de EU of ingericht op nationaal vlak door Nederland, België, Frankrijk of enige andere lidstaat, of in termbanken als IATE, die sinds kort ook de meertalige databank omvat die in het kader van het VJM-project (Vocabulaire juridique multilingue comparé) door juristen-vertalers en terminologen van het Hof van Justitie is ontwikkeld op het gebied van het familierecht, het vreemdelingenrecht en het strafrecht. Dit laatste bestand bevat veel metagegevens (o.m. verwijzingen naar wetgeving en rechtspraak, terminologische verschillen tussen rechtsordes die dezelfde taal hanteren, valse vrienden) die de jurist-vertaler helpen bij het maken van de juiste terminologische keuzes.

Duidelijke taal

Als vierde uitdaging tenslotte vermeldde de webinar het omzetten van de brontekst in vlot, begrijpelijk, ondubbelzinnig en correct Nederlands. Streefdoel daarbij is een getrouwe vertaling die de boodschap weergeeft en niet de te letterlijke vertaling die juist vaak slecht scoort op het vlak van duidelijkheid en eenduidigheid. Wie zich aangesproken voelt door deze uitdagingen, is mogelijk ook geïnteresseerd in stage- of carrièremogelijkheden bij het Hof.

Nieuws

Begrijpelijke taal in de zorg

De relatie tussen terminologie en de taalniveaus van het Europees Referentiekader voor de Talen vertoont verschillende schakeringen. Dat gespecialiseerde vaktaal vaak nauw gerelateerd is aan taalgebruik op de hoge kwalificatieniveaus C1 en C2 ligt in de lijn van de verwachting. Afhankelijk van factoren zoals vakgebied en te bereiken doelgroepen dient zich daarnaast in de landstaal of landstalen een verband aan met de andere zijde van het spectrum, de lagere niveaus als basisgebruiker A2 en onafhankelijk gebruiker B1. Zeker op het gebied van de medische zorg waar iedereen op zeker ogenblik als zorgvragende of als zorgverlener mee te maken heeft, doet zich de behoefte voelen aan heldere communicatie en de nodige, begrijpelijk gehanteerde of begrijpelijk gemaakte termen en omschrijvingen voor een breed publiek. In dit perspectief lanceerde de Taalunie een aantal initiatieven. Een reportage documenteert deze in interviews en geeft een beeld van de sterk toenemende aandacht voor goede gezondheidsvaardigheden, waarbij mensen informatie over gezondheid kunnen vinden, begrijpen en vooral toepassen. Het belang van de onlosmakelijke band tussen taal en zorg en van het toegankelijk maken van taal voor iedereen in dit verband valt moeilijk te onderschatten. Vooruitgang op dit vlak is niet alleen nuttig bij laaggeletterdheid, een situatie die gezondheidsvaardigheden meestal negatief beïnvloedt. Ook hoger opgeleiden blijken in stressvolle omstandigheden van ziekte behoefte te hebben aan bevattelijke informatie.

ZorgVoorZorgPrijs

De coronacrisis heeft de behoefte aan communicatie en zorgverstrekking nog versneld en verscherpt. Stimulansen van de Taalunie resulteerden onder meer in producten als een COVID-woordenlijst die samen met partners als Pharos en Nictiz werd geïnitieerd. Een omvattende realisatie was het onderzoek dat de Taalunie liet uitvoeren, getiteld ‘Injectie voor taal. Inventarisatie van materialen gericht op medische communicatie’. Het rapport komt met een concrete aanbeveling van vijf stappen voor iedereen die medische informatie communiceert. Van belang blijkt verder om versnippering te vermijden en juist te streven naar samenwerking. In een derde initiatief dat de reportage voor het voetlicht brengt, wordt deze lijn doorgetrokken: de ZorgVoorZorgPrijs, ingesteld voor projecten die helpen met het ontwikkelen en verspreiden van materialen die taal en zorg begrijpelijker helpen maken. De prijs beoogt onder meer projecten in Nederland en Vlaanderen onder de aandacht te brengen die op hun eigen manier bezig zijn met het toegankelijk maken van medische informatie. Zo creëert de prijs voor de inzenders, tegenover versnippering, een platform waarop mensen elkaars ideeën kunnen bekijken en van elkaar leren. Tevens hoopt men op een handreiking naar het taalgebied aan de andere kant van de grens, waar soms een andere zorgterminologie wordt gehanteerd maar de behoeftes hetzelfde zijn.

Medische terminologie en termvariatie

Een ander aspect van terminologisch begrip in de medische sfeer dient zich aan bij verschillende communicatieve contexten en vertaling. Recent verscheen het Routledge Handbook of Translation and Health (Ş. Susam-Saraeva, E. Spišiaková (eds.)) dat een hoofdstuk bevat over "Medical terminology and Discourse". Daarin behandelt Joost Buysschaert (UGent) de opmerkelijk grote termvariatie binnen de medische terminologie en de pogingen tot normalisering; maar ook het nut van die variatie, rekening houdend met de diverse contexten waarin medische terminologie wordt gebruikt. Het hoofdstuk besteedt verder nog aandacht aan de rol die taaltechnologie kan spelen in het medisch termenbeheer en geeft suggesties voor nuttige bronnen voor wie de betekenis, het gebruik en de vertaling van medische termen wil naspeuren. Verdere informatie over deze publicatie vindt u hier.

Federated eTranslation TermBank Network

Maken disciplines periodes van bloei of neergang door, dan bevindt de terminologie zich momenteel in een positieve fase van ontplooiing. De uiteenlopende aard van de factoren die aan dit beeld bijdragen, bevestigt dat deze ontwikkeling momenteel de nodige draagkracht heeft. Zo kan men wijzen op de terminologische standaarden die TC37 als technisch comité in de Internationale Organisatie voor Standaardisatie beschrijft en actualiseert, de verankering van terminologie in de taalindustrie, het aanbod van terminologietools, de gestage uitbouw van termbanken als IATE enz. Groei gaat echter eveneens gepaard met het besef en de verbetering van wat nog onvolkomen is. De fragmentatie van het landschap wordt als zo’n uitdaging ervaren en het project FedTerm (Federated eTranslation TermBank Network) wil die aangaan.

Kern van de missie is om de terminologiegemeenschap te verbinden door middel van een netwerk. Het project wil het voor organisaties en instellingen in de EU mogelijk maken om plaatselijk eigen termbanken uit te bouwen die gelinkt worden aan een centraal terminologieknooppunt, en om datawijzigingen geregeld te synchroniseren.

Met de hulp van het Connecting Europe Facility Program en de ervaring van terminologische instanties en instellingen is daarvoor een consortium opgericht dat de “FedTerm toolkit” heeft opgeleverd. Deze infrastructuur voor terminologiegegevens moet het mogelijk maken om in een netwerk van geografisch verspreide instanties en personen termbanken te creëren, beheren en te delen. De gebruikers worden onderscheiden in publieke gebruikers en geautoriseerde gebruikers met inhoudelijke rechten. Beschikbaar zijn verschillende zoekfunctionaliteiten, die resultaten tonen tijdens het intikken, zoeken op exacte overeenkomst of in de volledige tekst, evenals filterfuncties en een knop voor terminologiegerelateerde informatie. Een eerste downloadbare versie van deze gratis software was gepland op 1 juni laatstleden. Voor verdere updates kan men de website EuroTermBank.eu raadplegen. Deze presentatie en een opname van de vijfde ELRC-conferentie (4:23:30) gaan dieper in op het project. Het werd ook gepresenteerd op de lezingendag die TermNet op 30 juni (mits registratie) organiseerde voorafgaand aan de jaarlijkse TermNet-zomerschool.

TOTh 2021

Aansluitend bij zijn programmatisch acroniem richt deze organisatie op 10 december een studiedag in. Binnen het interessegebied 'Terminology & Ontology: Theories and applications' gaat de aandacht meer in het bijzonder uit naar de interoperabiliteit en integratie van data en kennisgegevens. De vragen en uitdagingen hieromtrent dringen zich meer op naarmate het aantal bronnen op internet zoals classificaties, thesauri, terminologieën en ontologieën, en meertalige kennissystemen toeneemt. De interoperabiliteit van deze bronnen vergt inzicht in tal van factoren die meebepalend zijn en het discussieterrein sterk verbreden: de invloed op de bouw van deze bronnen van Linked Open Data, Linguistic Linked Open Data et Linked Open Vocabulary, de relatie tussen de taalkundige en ontologische dimensies, de invloed van ISO-terminologiestandaarden e.d.

Tools en bronnen

Termextractie

Op 28 mei 2021 verdedigde Ayla Rigouts Terryn haar proefschrift (UGent) met als titel D-TERMINE. Data-driven Term Extraction Methodologies Investigated. De bekende methodes voor automatische termextractie gebruiken linguïstische en statistische methodes om kandidaat-termen te identificeren. Rigouts Terryn volgt een andere weg en maakt gebruik van artificiële intelligentie door zelflerende systemen te trainen op een manueel geannoteerd corpus. Het onderzoek leidde uiteindelijk tot een uitgebreide, herbruikbare dataset en drie nieuwe methodologieën voor automatische termextractie. Meer specifiek is het onderzoekstraject drieledig.

ACTER

Het eerste deel van dit doctoraatsproject was gewijd aan het opstellen en valideren van een nieuwe dataset voor automatische termextractie: ACTER – Annotated Corpora for Term Extraction Research. Named Entities (namen van personen, plaatsen, etc.) en termen werden manueel geannoteerd met vier verschillende labels in twaalf gespecialiseerde corpora, in drie talen en vier domeinen. In totaal bevat de dataset meer dan 100.000 annotaties op een totaal van bijna 600.000 woorden. Zulke datasets zijn noodzakelijk om zelflerende systemen te ontwikkelen, die op basis van geannoteerde data automatisch leren hoe termen te herkennen, en die kennis dan kunnen toepassen om termen te vinden in andere, ongeziene teksten. De data vormden de basis voor de organisatie van een gezamenlijke opdracht waarbij vijf internationale teams zo accuraat mogelijk de termen probeerden te extraheren uit dezelfde testdata. ACTER is sindsdien ook online publiek verkrijgbaar. De opdracht toonde hoe de dataset een betekenisvolle bijdrage kan leveren aan het onderzoek, maar toonde ook aan dat automatische termextractie nog lang niet op punt staat; zelfs de beste deelnemende teams haalden bescheiden scores.

Traditionele en zelflerende systemen

Daarom werd in het tweede deel van dit project onderzocht hoe zelflerende systemen kunnen worden gebruikt om onderzoek in dit domein vooruit te helpen. De traditionele hybride strategie voor automatische termextractie gebruikt een combinatie van taalkundige en statistische informatie om termen te zoeken. Op basis van de taalkundige informatie (bijvoorbeeld, woordsoortpatronen) wordt een initiële lijst van unieke kandidaat-termen geëxtraheerd. Deze lijst wordt gefilterd met behulp van statistische berekeningen die frequenties gebruiken om de relevantste kandidaat-termen te selecteren. Het resultaat is een gerangschikte lijst van kandidaat-termen. HAMLET – Hybrid, Adaptable Machine Learning Approach to Extract Terminology – is een zelflerend systeem dat werd ontwikkeld op basis van die traditionele aanpak. In tegenstelling tot regelgebaseerde systemen kan HAMLET op efficiënte wijze veel meer informatie combineren om termen te leren herkennen. Dat maakt het systeem minder vatbaar voor typische problemen, zoals de detectie van zeldzame termen. Een vergelijking met een state-of-the-art regelgebaseerd systeem bevestigt de voordelen van deze aanpak. Hoewel taal en domein een grote impact hebben op de resultaten, haalt HAMLET algemeen goede scores, zelfs zonder domeinspecifieke trainingsdata.

Het derde en laatste deel van het project bouwt voort op die bevindingen en onderzoekt methodologieën die nog meer afwijken van de traditionele aanpak. In plaats van te starten met een initiële lijst van unieke kandidaat-termen, werden strategieën onderzocht waarbij de kandidaat-termen rechtstreeks in de originele tekst worden aangeduid. Twee methodologieën werden zo ontwikkeld, geëvalueerd, en vergeleken: een conditional random fields classifier op basis van features, en een recurrent neural network met word embeddings. De sequentiële, neurale aanpak bleek beter en haalde vergelijkbare scores als HAMLET.

Voor de evaluaties werden niet enkel scores gerapporteerd, maar ook uitgebreide en vergelijkende foutenanalyses die de sterktes en zwaktes van elke methodologie identificeren.

Uitgelichte term

insolventie

In mei 2021 waarschuwt de Europese Centrale Bank (ECB) voor de grotere risico’s op insolventie in sommige eurolanden wanneer coronasteun wordt afgebouwd, lezen we op de coronablog van knack.be. Sinds de uitbraak van de pandemie bieden overheden namelijk financiële steun aan bedrijven en ondernemers om het herstel van de economie te bevorderen. Insolventie wil zeggen de situatie waarin een persoon of onderneming niet aan zijn of haar financiële verplichtingen kan voldoen. Anders gezegd: iemand kan zijn schulden niet afbetalen. Niet verwonderlijk dus dat insolventie soms voorafgaat aan een faillissement. Het woord is een afleiding van het bijvoeglijk naamwoord insolvent ‘onmachtig tot betaling’, en het wordt vooral in financiële en juridische context gebruikt.

Meer juridische termen op ivdnt.org

Bericht van NL-Term

Vooraankondiging: TiNT 2021
Terminologie en communicatie: van Simon Stevin tot vandaag

De Nederlands-Vlaamse vereniging NL-Term organiseert haar jaarlijkse TiNT-dag op 15 oktober 2021 in hartje Brugge. TiNT staat voor “Terminologie in het Nederlandse Taalgebied”. TiNT 2021 neemt de veelzijdige humanist Simon Stevin als inspiratie. Hij was van oordeel dat vaktermen begrijpelijk moeten zijn voor sprekers van de volkstaal. Dankzij hem spreken we bijvoorbeeld nog over een driehoek en over meetkunde.

Sprekers

De vraag of het Nederlands eigen vaktermen moet hebben of kan volstaan met leenwoorden, blijft actueel. Zeker als een thematiek ook voor een breder publiek toegankelijk moet worden gemaakt, zijn begrijpelijke termen nodig. Hoe moeten we aan luisteraars en kijkers uitleggen hoe de straalstroom werkt? Gevierd weerman Frank Deboosere kan het ons toelichten. Met welke woorden maak je duidelijk hoe het nieuwe coronavirus onze longen bedreigt? Marleen Finoulst, bedreven in wetenschapscommunicatie, licht het toe. En via welke procedure kun je het coronapaspoort aanvragen? Ambtenaar Lodewijk van Noort, leider van de campagne Direct Duidelijk, maak het ons duidelijk. Samen met andere sprekers tonen ze hoe in de wereld van wetenschap, geneeskunde en de ambtenarij – en in heel wat andere domeinen – goed gekozen bewoordingen de sleutel zijn tot begrijpelijke communicatie.

Tijdens deze TiNT-dag zal ook voor het eerst de Simon-Stevinpenning voor terminologie worden uitgereikt.

Publiek & inschrijving

Zoals steeds richt de TiNT-dag zich tot een ruim publiek van taalgebruikers: wetenschappers, juristen, ambtenaren, vertalers, tolken, communicatieverantwoordelijken van bedrijven en organisaties, studenten. Vanaf 1 september kan voor de TiNT-dag worden ingeschreven; details zullen verschijnen op de website. Als het enigszins kan, wordt de bijeenkomst ter plaatse georganiseerd, wat met het oog op netwerken de beste keuze blijft. Als de omstandigheden nopen tot een versie geheel of gedeeltelijk online, wordt ook daarvoor alles in gereedheid gebracht.

Agenda

Hieronder vindt u een korte aankondiging van evenementen. Meer informatie vindt u op de website van het Instituut voor de Nederlandse Taal.

7 - 11 september 2021, Alexandroupolis (Griekenland): EURALEX
7 - 8 oktober 2021, Talinn (Estland): NatAcLang
15 oktober 2021, Brugge (België) en/of online: NL-Term, TiNT
21 - 22 oktober 2021, Vilnius (Litouwen) en online: 4th International Conference on Terminology
25 - 26 november 2021, Dublin (Ierland): EAFT
10 december 2021, Parijs (Frankrijk) : TOTh

Redactie: Dirk Kinable

Twitter

Facebook

Instagram

Website

© 2021 Instituut voor de Nederlandse Taal, alle rechten voorbehouden.
U ontvangt dit bericht omdat u zich heeft ingeschreven voor een van de nieuwsbrieven (Algemeen en/of Terminologie) van het Instituut voor de Nederlandse Taal.

onze contactgegevens:
Instituut voor de Nederlandse Taal
Rapenburg 61
NL-2311 GJ Leiden

voeg ons toe aan uw adresboek

inschrijving of gebruikersprofiel bijwerken of afmelden voor alle nieuwsbrieven