Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Vai saīsinājumi var būt lokāmi #59

Open
lauma opened this issue Dec 17, 2020 · 2 comments
Open

Vai saīsinājumi var būt lokāmi #59

lauma opened this issue Dec 17, 2020 · 2 comments
Labels
jautājums Nepieciešams vairāk informācijas un papilddiskusija morfoloģija Leksēmas, paradigmas, utt. Tezaurs WN pamatā esošā Tēzaura teorija un prakse

Comments

@lauma
Copy link
Member

lauma commented Dec 17, 2020

Vai tādi saīsinājumi kā k-gs un k-dze ir lokāmi? Ja jā, tad jāizdomā, kā attēlot viņus tēzaurā. Vai tie lokās pēc parastajām lietvārdu paradigmām, piem., pēc 1. un 5. deklinācijas sistēmas?

@lauma lauma added morfoloģija Leksēmas, paradigmas, utt. jautājums Nepieciešams vairāk informācijas un papilddiskusija Tezaurs WN pamatā esošā Tēzaura teorija un prakse labels Dec 17, 2020
@PeterisP
Copy link
Member

PeterisP commented Mar 4, 2021

Kādam tagam būtu jābūt pie vārdformas "k-dzei" ? Ja es pieliktu lokāmu k-gs 1. deklinācijas paradigmā, tad viss darbotos, bet tam būtu n..... tags nevis yn kā pašreiz.

Tas ir mazliet tālāk par to, kad mēs savulaik ieviesām saīsinājumu tagu sadalījumu atbilstoši saīsinātajai vārdšķirai.

Konceptuāli visiem lietojumiem kas iet tālāk par morfoloģijas/vārda līmeni - sintakse, semantika, utt - saīsinājums ir ekvivalents saīsinātajai lietai; tādi lietojumi priecātos, ja "k-dzei" būtu ekvivalenti atribūti kā "kundzei", vienīgi ar papildnorādi, ka tas ir saīsinājums; ja "piem." tiktu sintaksē traktēts pilnīgi ekvivalenti kā "piemēram". Tas, šķiet, saskan ar UD pieeju https://universaldependencies.org/u/feat/Abbr.html

Ir tehniska problēma tajā, ka vecajā MULTEXT-EAST stila marķējumā (lemma + pozicionāls tags) nav praktiski norādīt papildu atribūtus. Bet tā ir plašāka sāpe, kas apgrūtina arī citas lietas. Ja mēs ilgtermiņā karodziņu/atribūtu sistēmu ko lieto Tēzaurs un morfoanalizators pamazām izplestu uz citiem rīkiem, iekļaujot to arī korpusu anotācijā, tad varbūt tas būtu ilgtermiņa risinājums, bet nu tas būtu paliels projekts.

@lauma
Copy link
Member Author

lauma commented Mar 9, 2021

Temporāli var ielikt "k-dze" noun-5a paradigmā un pielikt viņai vārdšķiru saīsinājums - no Tēzaura viedokļa var sataisīt smuki, no analizatora viedokļa būs informācija, bet tageris var arī nošauties par tādu perversiju

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
jautājums Nepieciešams vairāk informācijas un papilddiskusija morfoloģija Leksēmas, paradigmas, utt. Tezaurs WN pamatā esošā Tēzaura teorija un prakse
Projects
None yet
Development

No branches or pull requests

2 participants