[Opentaal-discussie] Woordenlijst

Ruud Baars baarsrj op xs4all.nl
Wo Apr 29 06:55:18 CEST 2009


Bob van de Loo schreef:
> wat dacht je van een persoonlijk voornaamwoord in relatie tot de 
> positie in een zin?
>
> wij worden ...
> hij wordt ...
>
> wordt hij ...
> worden wij ...daan.
>
> aangezien we nu voldoende corpus hebben, zouden we toch een 
> zoekopdracht moeten kunnen doen?
>
> een zin omzetten naar een array van woorden, om daarna het woord na 
> het persoonlijk voornaamwoord te registreren, daarna de array 
> omdraaien en nogmaals het woord na het persoonlijk voornaamwoord 
> zoeken. Het zal niet 100% sluitend zijn, maar als de corpus groot 
> genoeg is, kan het al een redelijk lijst met woorden opleveren.
>
> Of is dit te high-tech?
>
Nee hoor. Iets dergelijks is al eens gedaan, verder heb ik natuurlijk 
andere bronnen al geraadpleegd.
Het gaat hier om 'werkwoorden' waarvan ook nog geen enkel voorbeeld is ....


> Groet,
> Bob
>
>
> 2009/4/28 Bart Knubben <bart op knubben.org <mailto:bart op knubben.org>>
>
>     Dag Ruud,
>
>     Zie: http://ens.ewi.tudelft.nl/donau/
>     Bij de woorden in de lijst "groene_boekje_uitgebreid" zijn coderingen
>     van woordsoorten aangegeven. Deze coderingen staan toegelicht in het
>     bestand "LEESMIJ".
>
>     Heb je hier wat aan?
>
>     Groet,
>     Bart
>
>
>     Op 28 april 2009 19:49 heeft Ruud Baars <baarsrj op xs4all.nl
>     <mailto:baarsrj op xs4all.nl>> het
>     volgende geschreven:
>     > Onze woordenlijst 1.0, de basis van al het verdere werk, is wel
>     keurig
>     > gesplitst in basis- en flexvormen.
>     >
>     > Helaas zijn er nooit woordsoorten bij aangegeven.
>     >
>     > Omdat ik nu de woord-vlaggen voor de spellingcontrole niet puur
>     > statistisch wil aanpakken, zoals tot nu toe (en nog in 1.10),
>     maar op
>     > basis van woordsoort en morfologie, is een strakkere scheiding van
>     > woordsoorten nodig.
>     >
>     > Is er iemand die uit een lijst met basiswoorden (zo'n 900 ...) de
>     > werkwoorden wil aanwijzen?
>     >
>     > Hulp is welkom.
>     >
>     > mvg
>     > Ruud
>     >
>     > _______________________________________________
>     > Over de Opentaal-mailinglist: http://opentaal.org/mailinglist.php
>     > Zoeken in het mailinglistarchief: http://opentaal.org/zoeken.php
>     > Juridische voorwaarden: http://opentaal.org/licentie.php
>     >
>
>     _______________________________________________
>     Over de Opentaal-mailinglist: http://opentaal.org/mailinglist.php
>     Zoeken in het mailinglistarchief: http://opentaal.org/zoeken.php
>     Juridische voorwaarden: http://opentaal.org/licentie.php
>
>

------------- volgend deel ------------
Een HTML-bijlage is gescrubt...
URL: <http://lists.sf.own-it.nl/pipermail/opentaal/attachments/20090429/2f22e69a/attachment-0007.htm>


Meer informatie over de OpenTaal maillijst