Szerző dc.contributor.author | Csányi Gergely Márk | hu_HU |
Szerző dc.contributor.author | Vági Renátó | hu_HU |
Szerző dc.contributor.author | Nagy Dániel | hu_HU |
Szerző dc.contributor.author | Üveges István | hu_HU |
Szerző dc.contributor.author | Vadász János Pál | hu_HU |
Szerző dc.contributor.author | Megyeri Andrea | hu_HU |
Szerző dc.contributor.author | Orosz Tamás | hu_HU |
Elérhetőség dátuma dc.date.accessioned | 2022-04-11T10:31:17Z | |
Rendelkezésre állás dátuma dc.date.available | 2022-04-11T10:31:17Z | |
Kiadás dc.date.issued | 2022 | hu_HU |
Issn dc.identifier.issn | 2076-3417 | hu_HU |
Uri dc.identifier.uri | http://hdl.handle.net/20.500.12944/17573 | |
Kivonat dc.description.abstract | One of the most time-consuming parts of an attorney’s job is finding similar legal cases. Categorization of legal documents by their subject matter can significantly increase the discoverability of digitalized court decisions. This is a multi-label classification problem, where each relatively long text can fit into more than one legal category. The proposed paper shows a solution where this multilabel classification problem is decomposed into more than a hundred binary classification problems. Several approaches have been tested, including different machine-learning and text-augmentation techniques to produce a practically applicable model. The proposed models and the methodologies were encapsulated and deployed as a digital-twin into a production environment. The performance of the created machine learning-based application reaches and could also improve the human-experts performance on this monotonous and labor-intensive task. It could increase the e-discoverability of the documents by about 50%. | hu_HU |
Nyelv dc.language | en | hu_HU |
Kiadó dc.publisher | MDPI | hu_HU |
Kulcsszó dc.subject | Digital twin | hu_HU |
Kulcsszó dc.subject | Legal document classification | hu_HU |
Kulcsszó dc.subject | Legaltech | hu_HU |
Kulcsszó dc.subject | Multi-label classification | hu_HU |
Kulcsszó dc.subject | Multi-label documents | hu_HU |
Cím dc.title | Building a Production-Ready Multi-Label Classifier for Legal Documents with Digital-Twin-Distiller | hu_HU |
Típus dc.type | folyóiratcikk | hu_HU |
Változat dc.description.version | published | hu_HU |
Hozzáférés dc.rights.accessRights | nyílt hozzáférésű | hu_HU |
Doi azonosító dc.identifier.doi | 10.3390/app12031470 | hu_HU |
Tudományág dc.subject.discipline | Társadalomtudományok | hu_HU |
Tudományterület dc.subject.sciencebranch | Társadalomtudományok/Állam- és jogtudományok | hu_HU |
Mtmt azonosító dc.identifier.mtmt | 32634154 | hu_HU |
Folyóirat dc.identifier.journalTitle | Applied Sciences (Switzerland) | hu_HU |
Évfolyam dc.identifier.journalVolume | 12 | hu_HU |
Füzetszám dc.identifier.journalIssueNumber | 3 | hu_HU |
Wos azonosító dc.identifier.wos | 000760224200001 | hu_HU |
Scopus azonosító dc.identifier.scopus | 2-s2.0-85123611535 | hu_HU |
Szerző intézménye dc.contributor.department | Információs Társadalom Kutatóintézet | hu_HU |
Kar dc.contributor.faculty | Eötvös József Kutatóközpont | hu_HU |