Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Rešerše poetry papers na Zoteru #10

Open
ptakopysk opened this issue Feb 21, 2024 · 3 comments
Open

Rešerše poetry papers na Zoteru #10

ptakopysk opened this issue Feb 21, 2024 · 3 comments
Assignees

Comments

@ptakopysk
Copy link
Collaborator

Rudolf přidal na Zotero nějaké další poetry papers z loňského ICCC:
https://www.zotero.org/groups/5184983/poetrygeneration/items/AR7KTGPK

  • On the power of special-purpose GPT models to create and evaluate new poetry in old styles
  • Creative Data Generation: A Review Focusing on Text and Poetry
    Na první pohled se zdá, že oba stojí za zkouknutí.

Prosil bych je zkouknout a sem nebo na Slack napsat stručně co jste se tam dozvěděli.

@jinymusim
Copy link
Collaborator

jinymusim commented Feb 27, 2024

  • On the power of special-purpose GPT models to create and evaluate new poetry
    in old styles

GPT-3 / GPT-3.5 Použití. Finetuning pro nalezení stylu autora už od 300 básní!
Pro nalezení tématického začlenění a nějaké sumarizace, GPT-3.5 byl prompnutej ať zesumarizuje a ať vybere téma z listu. Trénování poté děláno na GPT-3 tím, že začne autorem (Jméno, Narození, Úmrtí, Země), následně téma a sumarizace. To dohromady dává prompt (Pro následující generování). Poslední je samotná báseň (Completion v GPT-3).

Určitě by tedy šel použít větší model a dát tam tyhle věci + Metrum a Rýmové schéma a mohlo by to být zajímavé.
Problém je, že používají GPT-3-Davinci, který má 175B parametrů. Stačili ale jen 4 epochy

@jinymusim
Copy link
Collaborator

jinymusim commented Feb 28, 2024

Zkouším dostat z modelů kategorie, ale nic moc.

Zkoušené modely: h2oai/h2ogpt-4096-llama2-7b-chat, simecek/cswikimistral_0.1, mistralai/Mistral-7B-Instruct-v0.2, NickyNicky/Mistral-7B-OpenOrca-oasst_top1_2023-08-25-v2

Problém je asi v tom, že to nepozná věnování vrchlickému a další věci. Metadata by tedy mohla pomoci

@jinymusim
Copy link
Collaborator

jinymusim commented Feb 28, 2024

  • Creative Data Generation: A Review Focusing on Text and Poetry

Tento článek je spíše review toho co se děje okolo Creative Generation. Ohledně poezie zde není mnoho, pouze to, že se liší od prózy rytmem a rýmem. Ukazuje na několik druhů básní jako Haiku, Sonet a Lymerica. Metody jsou pouze zmíněné, ne moc do detailu. Zajímavé je RNN RL podle autorova stylu. Je tam zmíněno i řešení s fill mask na templatu. To je ještě filtorváno tak, ať metrum sedí.

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Projects
None yet
Development

No branches or pull requests

3 participants