Elsevier

Cognition

Volume 6, Issue 4, 1978, Pages 291-325
Cognition

The sausage machine: A new two-stage parsing model

We dedicate this paper to the memory of John Kimball, whose proposals about sentence parsing, as will become clear, have had a considerable influence on our own.
https://doi.org/10.1016/0010-0277(78)90002-1Get rights and content

Abstract

It is proposed that the human sentence parsing device assigns phrase structure to word strings in two steps. The first stage parser assigns lexical and phrasal nodes to substrings of roughly six words. The second stage parser then adds higher nodes to link these phrasal packages together into a complete phrase marker.

This model of the parser is compared with ATN models, and with the two-stage models of Kimball (1973) and Fodor, Bever and Garrett (1974). Our assumption that the units which are shunted from the first stage to the second stage are defined by their length, rather than by their syntactic type, explains the effects of constituent length on perceptual complexity in center embedded sentences and in sentences of the kind that fall under Kimball's principle of Right Association. The particular division of labor between the two parsing units allows us to explain, without appeal to any ad hoc parsing strategies, why the parser makes certain ‘shortsighted’ errors even though, in general, it is able to make intelligent use of all the information that is available to it.

Résumé

Dans cet article on propose un mécanisme de segmentation des énoncés qui assigne en deux étapes une structure syntagmatique aux suites de mots. La première méthode de segmentation assigne des noeuds lexicaux et syntagmatiques à des suites de 6 mots environ. La seconde ajoute des noeuds à un niveau supérieur pour lier ces blocs syntagmatiques et obtenir ainsi un marqueur syntagmatique complet.

Ce modèle de segmentation est comparé d'une part aux modèles ATN et d'autre part au modèle en deux étapes de Kimball (1973) et Fodor, Bever et Garrett (1974). Nous pensons que les unités qui passent du ler au 2è niveau sont caractérisées par leur longueur plutôt que par leur forme syntaxique. Ceci expliquerait les effects de la longueur des constituants sur la complexité perceptuelle des phrases enclassées et des phrases du type de celles qui tombent sous le principe de l'association à droite de Kimball.

La distinction spécifique du travail entre les deux unités de segmentation permet d'expliquer, sans faire intervenir des stratégies ad hoc, certaines erreurs de segmentation même si, en général, il est possible de faire un usage intelligent de toutes les informations disponibles.

References (24)

  • N. Chomsky et al.

    Filters and control

    Ling. Inq.

    (1977)
  • J.A. Fodor et al.

    The Psychology of Language

    (1974)
  • Cited by (766)

    View all citing articles on Scopus
    View full text