Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Známé chyby překladu #34

Open
6 tasks
martinpopel opened this issue Mar 26, 2022 · 5 comments
Open
6 tasks

Známé chyby překladu #34

martinpopel opened this issue Mar 26, 2022 · 5 comments
Assignees
Labels
translation errors in the translation model (or backend)

Comments

@martinpopel
Copy link
Member

martinpopel commented Mar 26, 2022

  • jazyky (např. česky/český=українська, čeština=Українська, language:cs=language:uk)
  • národnosti (Čech/Češi=Українська)
  • měny (např. 100 Kč=100 грн., 100 CZK=100 UAH)
  • emaily a URL (např. mff.cuni.cz=mff.cuni.com.ua)
  • jména (např. Honza=Лісовик)
  • města (např. Praha=Київ, Київ=Karlovarský, Jihlava=Житомир, Житомир=Jičín)

O těchto chybách víme a snažíme se je co nejrychleji opravit.
V různých větných kontextech se mohou daná slova přeložit i jinak (většinou taky chybně).

Další "chyby" často hlášené uživateli:

  • Překladač (zatím) nepodporuje ruštinu. Když se místo ukrajinštiny vloží texty v ruštině, překlady do češtiny budou nepoužitelné.
  • Překladač (zatím) překládá jen prostý text, tj. bez formátovacích značek (html, markdown apod.). Přítomnost formátovacích značek může snížit kvalitu překladu.
@martinpopel martinpopel added the translation errors in the translation model (or backend) label Mar 26, 2022
@ptakopysk
Copy link

Ne vždy je ten pár české vs ukrajinské reálie, dělá to i toto:

  • Vyrobeno v Egyptě.
  • Зроблено в Україні.

@posel
Copy link

posel commented Apr 7, 2022

Ten výběr jazyků je nepředvídatelný:
Slovensky
Polsky

Je přeloženo:
Українська
Польська

@martinpopel
Copy link
Member Author

8.4. jsme nasadili novou verzi překladače, která dělá méně chyb uvedených typů. Např. "Jihlava" už se přeloží jako "Їглава", ale "Vítejte v Jihlavě." je stále chybně "Ласкаво просимо до Юрія." Nebo "100 CZK" => "100 CZK", ale "Stojí to 100 CZK." => "Це коштує 100 грн."
Na opravách tedy stále pracujeme.

@martinpopel martinpopel self-assigned this Apr 19, 2022
@tomasvladik
Copy link

tomasvladik commented Oct 21, 2022

Zkratku ЗСУ - což jsou Ozbrojené síly Ukrajiny

to nahrazuje v jednom textu, jakoby náhodně, zkratkami ZŠ, VZP, ČSSD ...

@martinpopel
Copy link
Member Author

@tomasvladik Díky za nahlášení. Odfiltroval jsem z trénovacích dat chybné překlady a až časem natrénujeme nový překladový model, tak by se překlad zkratky ЗСУ měl zlepšit. Správných překladů ale moc nezbylo, takže ještě lepších výsledků bychom dosáhli, kdyby nám někdo dal trénovací data (stovky ukrajinských vět a jejich českých překladů), kde se ЗСУ často vyskytuje.

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
translation errors in the translation model (or backend)
Projects
None yet
Development

No branches or pull requests

4 participants