A tétel áttekintő adatai

Szerző
dc.contributor.author
Dodé Réka
Elérhetőség dátuma
dc.date.accessioned
2024-04-22T10:04:31Z
Rendelkezésre állás dátuma
dc.date.available
2024-04-22T10:04:31Z
Kiadás
dc.date.issued
2023
Issn
dc.identifier.issn
2062-7858
Uri
dc.identifier.uri
http://hdl.handle.net/20.500.12944/24655
Kivonat
dc.description.abstract
A kulcsszó- és terminuskinyerés nem új keletű kutatási téma, már ötven éve foglalkoznak vele a kutatók, azonban még mindig rejt magában kihívásokat. A nyelvi modellek új perspektívát adnak számos nyelvtechnológiai területen, így a kulcsszó- és terminuskinyerésterületén is, mivel a nyelvi modellek olyan új kulcsszavak generálására is képesek, amelyek nem, vagy csak részlegesen szerepelnek a szövegben. Amikor a szerzők kézzel adnak meg kulcsszavakat, akkor a saját háttértudásukból is merítenek, így ezek a kulcsszavak nemfeltétlenül szerepelnek a szövegben. A kézzel megadott kulcsszavakkal tehát érdemes foglalkozni, és tekinthetők a gold sztenderdnek, célnak a kulcsszókinyerő alkalmazások teszteléséhez. Kutatásunkban 30 változó doménból származó tudományos szöveget és a hozzájuk tartozó szerzői kulcsszavakat vetettünk össze a ChatGPT által, többféle promptra adott megoldásokkal. Az eredmények szerint nincs szignifikáns különbség a kvantitatív eredményekben, de amennyiben kvalitatívan elemezzük a ChatGPT megoldásait, azokat relevánsnak találjuk. A dolgozat célja, hogy a ChatGPT által adott kimeneteket kiértékeljük abból a szempontból, hogy mennyire közelítik meg a szerzők által megadott kulcsszavakat.
Kivonat
dc.description.abstract
Keyword and term extraction is a well-established area of research that has attracted scholarly attention for the past five decades. However, it continues to pose persistent challenges. Language models introduce a novel dimension to various facets of natural language processing, including the realm of keyword and term extraction. They offer the capability to generate novel keywords that may be absent or only partially represented within the source text. When the authors enter keywords manually, they draw on their own background knowledge, so these keywords are not necessarily included in the text. Manually entered keywords are therefore worth dealing with and can be considered the gold standard, a benchmark, against which to test keyword extraction applications. In our study, we conducted a comparative analysis of manually assigned keywords for 30 scientifical textual documents (from different domains) against keyword solutions provided by ChatGPT in response to various prompts. Our findings indicate that while there may not be a statistically significant difference in quantitative metrics, a qualitative examination of ChatGPT-generated solutions reveal their relevance and utility in augmenting keyword assignments. The aim of the thesis is to evaluate the outputs given by ChatGPT from the point of view of how close they are to the keywords given by the authors.
Nyelv
dc.language
hu
Kulcsszó
dc.subject
terminus
Kulcsszó
dc.subject
kulcsszókinyerés
Kulcsszó
dc.subject
kulcsszómegadás
Kulcsszó
dc.subject
nyelvi modell
Kulcsszó
dc.subject
ChatGPT
Kulcsszó
dc.subject
term
Kulcsszó
dc.subject
keyword extraction
Kulcsszó
dc.subject
providing keyword
Kulcsszó
dc.subject
language model
Cím
dc.title
Magyar kulcsszavak vizsgálata és kinyerésük eredményeinek összevetése – pilotkutatás
Cím változat
dc.title.alternative
Research on Hungarian Keywords and Comparing the Results of their Extraction – Pilot Study
Típus
dc.type
folyóiratcikk
Változtatás dátuma
dc.date.updated
2024-04-19T08:35:18Z
Változat
dc.description.version
kiadói
Hozzáférés
dc.rights.accessRights
nyílt hozzáférésű
Doi azonosító
dc.identifier.doi
10.59648/filologia.2023.1-4.3
Tudományág
dc.subject.discipline
Társadalomtudományok
Tudományterület
dc.subject.sciencebranch
Társadalomtudományok/Média- és Kommunikációs tudományok
Mtmt azonosító
dc.identifier.mtmt
34799776
Folyóirat
dc.identifier.journalTitle
Filológia.hu
Évfolyam
dc.identifier.journalVolume
14
Füzetszám
dc.identifier.journalIssueNumber
1–4
Terjedelem
dc.format.page
51-64
Folyóiratcím rövidítve
dc.identifier.journalAbbreviatedTitle
FILOLÓGIA.HU
Szerző intézménye
dc.contributor.department
HUN-REN Nyelvtudományi Kutatóközpont
Szerző intézménye
dc.contributor.department
Nyelvtudományi Kutatóközpont
Szerző intézménye
dc.contributor.department
Nyelvtechnológiai és Alkalmazott Nyelvészeti Intézet


A tételhez tartozó fájlok

Magyar kulcsszavak vizsgálata és kinyerésük eredményeinek összevetése – pilotkutatás
 
 

Ez a tétel a következő gyűjteményekben található meg

A tétel áttekintő adatai

Tallózás a gyűjteményekben

Kategóriák és gyűjtemények
Megjelenés dátuma
Szerző
Cím
Tárgyszó
Feltöltés dátuma
Közszolgálati Online LexikonMagyary ArchívumLudovika Gyűjtemény