Technisch onmogelijk video te vervalsen

Volgens experts is de band met de bekentenis van Osama bin Laden over de aanslagen van 11 september echt omdat het technisch vrijwel onmogelijk is om diens woorden kunstmatig na te bootsen. Het grootste obstakel voor een eventuele vervalsing is het nadoen van de cadans en het ritme van zijn stem. Ook het vermengen van echt stemgeluid met een vervalste tekst is zeer lastig en de technologie voor het bewerken van Arabisch staat nog in de kinderschoenen.

APNED

BR>

Chi-Lin Shih, een taalspecialist bij Bell Labs, een onderdeel van Lucent Technologies, omschreef het vermengen van echte en vervalste delen van een speech als het plakken van een gebroken vaas: van dichtbij zie je de barsten duidelijk. Er is software voor het aan elkaar plakken van elementen van een menselijke stem, maar een dergelijke opname wordt door een expert meteen herkend als vals, zegt Kenneth Stevens, hoofd spraakonderzoek aan het Massachusetts Institute of Technology.

In grote delen van de islamitische wereld wordt weinig geloof gehecht aan de video, die donderdag door de Amerikaanse regering openbaar werd gemaakt, en zegt men dat die als excuus moet dienen voor de militaire actie tegen Afghanistan. Volgens president George Bush is dat een "onzinnige" gedachte en is de band een duidelijk bewijs voor de schuld van de terroristenleider. Amerikaanse functionarissen zeiden de soms slechte geluidskwaliteit van de opname opzettelijk niet te hebben versterkt om niet van manipulaties beschuldigd te kunnen worden.

Technologie voor het synthetiseren van stemmen maakt het mogelijk dat computers nu al de menselijke stem kunnen nadoen, maar het is een zeer gecompliceerd en langdurig proces. Ontwerpers van de Natural Voices software van AT&T zeggen dat met de technologie de stem van bijvoorbeeld de overleden acteur John Wayne nagedaan kan worden. Omdat te kunnen doen, moet een computer echter zoveel mogelijk stukken tekst van de betrokken persoon hebben geanalyseerd. Op basis van dat nauwkeurige onderzoek van alle stemveranderingen en manieren van het uitspreken van woorden, kan de computer dan de stem nadoen.

Theoretisch kan dat ook met de stem van Bin Laden want daar bestaan opnamen van, zegt Lynn Shepherd van Fonix Corp., een bedrijf gespecialiseerd in spraaksynthese uit Salt Lake City in de westelijke staat Utah. "Indien ze veel opnamen van Bin Laden hebben kan men stemmen namaken die zeer goed klinken", aldus Shepherd. Maar voor een echt goed gelijkende stem zijn uren opnamen van studiokwaliteit nodig waarbij de spreker gevraagd wordt allerlei zinswendingen en combinaties van woorden en geluidscombinaties uit te spreken. "Het duurt maanden om al die stemfragmenten te scheiden zodat de stem geheel nagebootst kan worden", stelt spraakexpert Bill DeStefanis van ScanSoft, Inc. uit Peabody in de staat Massachusetts.

"Het idee dat de regering dit binnen een maand voor elkaar zou hebben gekregen is zeer onaannemelijk", zei DeStefanis. "Met een klein stukje vervalste tekst kun je mensen wel voor de gek houden, maar niet met een lange speech." Op de video zijn delen van de woorden van Bin Laden onverstaanbaar. De slechte geluidskwaliteit kan volgens experts theoretisch gebruikt worden om falsificaties te verbergen. Maar indien het bij de band om een vervalsing zou gaan, moet de aangepaste tekst ook nog gesynchroniseerd zijn met de video-opnamen, een zeer moeilijke opgave, die indien niet goed uitgevoerd, snel door de leek wordt doorzien.