Catching words in a stream of speach: computational simulations of segmenting transcribed child-directed speech

Cagri Coltekin

Research output: ThesisThesis fully internal (DIV)

653 Downloads (Pure)

Abstract

De segmentatie van continue spraak in lexicale eenheden is één van de eerste vaardigheden die een kind moet leren gedurende de taalverwerving. Dit proefschrift onderzoekt segmentatie met behulp van computationeel modelleren en computationele simulaties. Segmentatie is moeilijker dan het op het eerste gezicht kan lijken. Kinderen moeten woorden vinden in een continue stroom van spraak, zonder kennis van woorden te hebben. Gelukkig laten experimentele studies zien dat kinderen en volwassen een aantal aanwijzingen uit de invoer gebruiken, alsmede simpele strategieën die gebruik maken van deze aanwijzingen, om spraak te segmenteren. Nog interessanter is dat een aantal van deze aanwijzingen taal-onafhankelijk zijn, waardoor een taalverwerver continue input kan segmenteren voordat het een enkel woord kent. De modellen die in dit proefschrift voorgesteld worden, verschillen op twee belangrijke vlakken van modellen uit de literatuur. Ten eerste gebruiken ze lokale strategieën – in tegenstelling tot globale optimalisatie – die gebruik maken van aanwijzingen waarvan bekend is dat kinderen ze gebruiken, namelijk voorspelbaarheidsstatistieken, fonotactiek en lexicale beklemtoning. Ten tweede worden deze aanwijzingen gecombineerd met behulp van een expliciet aanwijzing-combinatie model, dat eenvoudig uitgebreid kan worden met meer aanwijzingen.
Original languageEnglish
QualificationDoctor of Philosophy
Supervisors/Advisors
  • Nerbonne, John, Supervisor
Award date8-Dec-2011
Place of PublicationGroningen
Publisher
Print ISBNs9789036752328
Electronic ISBNs9789036752596
Publication statusPublished - 2011

Keywords

  • Proefschriften
  • Computerlinguistiek
  • Segmentering
  • Woordherkenning
  • Taalverwerving
  • taalverwerving

Cite this