Slovenský národný korpus (SNK) je rozsiahly zdroj jazykových dát, ktorý spravuje Jazykovedný ústav Ľ. Štúra SAV, v. v. i. Elektronické jazykové a textové zdroje Slovenského národného korpusu, ktoré sa budujú a rozvíjajú v Jazykovednom ústave Ľ. Štúra SAV už takmer dve desaťročia (od roku 2002), slúžia mnohým záujemcom o poznanie a používanie slovenského jazyka. SNK je neoceniteľným nástrojom pre lingvistov, učiteľov slovenského jazyka, prekladateľov a všetkých, ktorí sa zaoberajú výskumom a analýzou slovenského jazyka. Ponúka rozsiahle, reprezentatívne a prehľadne spracované údaje o zakončení tvarov slov v slovenčine, založené na referenčnom korpuse slovenského jazyka spolu so štatistickým spracovaním ich výskytov a distribúcie.
V roku 2001 ministerstvo kultúry v spolupráci s ministerstvom školstva a Slovenskou akadémiou vied pripravilo návrh projektu vybudovania Slovenského národného korpusu a projektu elektronizácie jazykovedného výskumu v rokoch 2002 - 2006, ktorý schválila vláda SR uznesením č. 137 z 13. februára 2002. Na základe tohto projektu sa v Jazykovednom ústave Ľudovíta Štúra SAV 22. novembra 2002 otvorilo pracovisko Slovenského národného korpusu s cieľom vybudovať do roku 2006 korpus s kapacitou 200 miliónov tokenov - základných textových jednotiek používaných v korpusoch. V súčasnosti sa realizuje už 5. etapa tohto projektu (2022 - 2026). Hlavný korpus písaných textov Slovenského národného korpusu, jeho aktuálna verzia prim-8.0, bola sprístupnená 31. januára 2018 v rozsahu takmer 1,5 miliardy tokenov.

Podmienky používania a citovania SNK
Používanie a citovanie korpusových zdrojov má byť v súlade s ustanoveniami zákona č. 185/2015 Z. z. (Autorský zákon). Texty sa do Slovenského národného korpusu (SNK) získavajú priamo od autorov alebo vlastníkov autorských či distribučných práv na základe zmluvy o inom, t. j. nekomerčnom použití v súlade so zákonom o autorských právach. Ako používateľ sa zaväzujete, že texty budete používať len na vedecké, výskumné, učebné alebo iné nekomerčné ciele. Budete citovať všetky údaje získané zo Slovenského národného korpusu (kontexty, frekvencie a iné údaje zo všetkých alebo z vybraných textov) podľa príslušnej verzie a časti SNK. Pri citovaní konkrétneho diela (novín, časopisu, knihy, článku atď.) uvediete SNK ako hlavný zdroj, takisto uvediete citáciu daného textu podľa bibliografickej normy.
Ich zaradenie do korpusových databáz je možné len na základe licenčnej zmluvy, v ktorej sa Jazykovedný ústav Ľ. Štúra SAV, v. v. i. zaväzuje autorom či majiteľom autorských práv, že tieto texty nebude poskytovať tretím osobám a že sa z nich používateľom zobrazí len bezprostredný kontext hľadaného jazykového javu. Zároveň sa registrovaný používateľ svojím vlastnoručným, nie elektronickým a ani skenovaným podpisom zaväzuje, že sa nebude úmyselne usilovať o znefunkčnenie infraštruktúry Slovenského národného korpusu a ani o neoprávnené získavanie dát z korpusových databáz nad rámec poskytovaného rozsahu. Súhlas s podmienkami používania korpusov (najmä obmedzený rozsah citovania konkrétneho textu) a v rámci nich záväzok korektného prístupu k dátam je preto nevyhnutné potvrdiť vlastnoručným, nie elektronickým a ani skenovaným podpisom.
Registrácia a prístup k SNK
Na získanie plného prístupu do databáz Slovenského národného korpusu je potrebná registrácia prostredníctvom vyplnenia webového registračného formulára. Jednoduché vyhľadávanie je možné aj bez registrácie prostredníctvom webového rozhrania, ale s veľmi obmedzeným prístupom ku korpusom (prim-6.0-public-all, r-mak-3.0 a iné), bez možnosti vytvárania podkorpusov.
Kroky registrácie:
- Vyplňte webový registračný formulár.
- Po jeho vyplnení a odoslaní treba počkať niekoľko sekúnd, kým bude vo Vašom počítači vygenerovaný dokument Podmienky používania SNK, ktorý je potrebné podpísať.
- Podpísaný dokument doručte poštou alebo osobne na adresu: Slovenský národný korpus, Jazykovedný ústav Ľ. Štúra SAV, v. v. i., Panská 26, 811 01 Bratislava.
Ak ste zaslali požadované údaje a prihlasovacie údaje vám doteraz neprišli, kontaktujte priamo Jazykovedný ústav Ľ. Štúra SAV.
Citovanie výsledkov z SNK
Pri použití citácie z korpusových databáz alebo výsledkov hľadania z jednotlivých zdrojov SNK sa odkazuje na konkrétnu verziu a/alebo podkorpus SNK (prim-10.0-public-sane, s-hovor-7.0, r-mak-6.0, par-sken-all-4.0 a pod.). Všetky dostupné zdroje sú uvedené v časti Korpusy SNK, v ponuke korpusov vo vyhľadávacom programe NoSketchEngine, ako aj v osobitnom zozname verejne prístupných korpusov SNK. Presné informácie o použitých korpusoch a podkorpusoch sú nevyhnutné aj preto, aby bolo vždy zrejmé, z akého druhu textov a z akého rozsahu dát pochádzajú získané údaje.
Citácia výsledkov z celého korpusu v bibliografii
V bibliografii sa citácia výsledkov z celého korpusu uvádza takto, napr.:
Verzia prim-10.0 a jej podkorpusy:
- Slovenský národný korpus - prim-10.0-public-all. Bratislava: Jazykovedný ústav Ľ. Štúra SAV 2022.
- Slovenský národný korpus - prim-10.0-public-all. Bratislava: Jazykovedný ústav Ľ. Štúra SAV 2020.
Za bibliografiou citovaného diela uveďte odkaz na príslušnú verziu a podkorpus Slovenského národného korpusu podľa uvedeného návodu.
Príklad na odborný článok v časopise z verzie prim-7.0:
- Kultúra slova. Martin: Vydavateľstvo Matice slovenskej, 1995. In: Slovenský národný korpus - prim-7.0-public-all. Bratislava: Jazykovedný ústav Ľ. Štúra SAV 2015.
- [Názov knihy]. Bratislava: Tatran 1989. 311 s. Preklad: Marta Zamborová. In: Slovenský národný korpus - prim-6.1-public-sane. Bratislava: Jazykovedný ústav Ľ. Štúra SAV 2013.
- [Názov publikácie]. Bratislava: Vydavateľstvo Spolku Slovenských spisovateľov 1998. In: Slovenský národný korpus - prim-5.0-public-inf. Bratislava: Jazykovedný ústav Ľ. Štúra SAV 2011.
Citovanie textov z Korpusu nárečí
V texte štúdie, monografie a pod. sa odkazuje na jednotlivé verzie Korpusu nárečí Slovenského národného korpusu, ako sú uvedené vo vyhľadávacom nástroji NoSketch Engine (napr. dialekt-1.0), aby vždy bolo zrejmé, z akého druhu korpusu a z akého rozsahu pochádzajú získané údaje. Pri citácii textov z konkrétneho zdroja použite informácie z položky zdroj (source), číslo textu (textnumber) a názov lokality (location) spolu s kompletným bibliografickým odkazom na textový zdroj. Za bibliografiou citovaného diela uveďte odkaz na príslušnú verziu a podkorpus Slovenského národného korpusu.
Pri citácii textov z nepublikovaných textov dialektologického oddelenia JÚĽŠ SAV použite informácie z položky zdroj (source), kód textu (code) a názov lokality (location) spolu s kompletným bibliografickým odkazom na textový zdroj. Za bibliografiou citovaného diela uveďte odkaz na príslušnú verziu a podkorpus Slovenského národného korpusu.
Citácia výsledkov z celého korpusu v bibliografii:
- Verzia dialekt-x.0
- Korpus nárečí Slovenského národného korpusu - dialekt-4.0. Bratislava: Jazykovedný ústav Ľ. Štúra SAV 2018.
- Korpus nárečí Slovenského národného korpusu - dialekt-4.0. Bratislava: Jazykovedný ústav Ľ. Štúra SAV 2016.
- Korpus nárečí Slovenského národného korpusu - dialekt-4.0. Bratislava: Jazykovedný ústav Ľ. Štúra SAV 2015.
V prípade, že používate ďalšie verzie korpusu dialekt, je potrebné zmeniť v bibliografii príslušnú verziu, napr. zdroj z ANT DO JÚĽŠ 19/12 citovaný v korpuse dialekt-2.0.
Príklady citácií z konkrétnych zdrojov Korpusu nárečí:
- Textový zdroj z príručky Praktická dialektológia. Vysokoškolská príručka na nárečovú interpretáciu od autoriek G. Múcsková, K. Muziková, V. Wambach z verzie dialekt-1.0: PRIR 016 - Sklabiňa. MÚCSKOVÁ, Gabriela - MUZIKOVÁ, Katarína - WAMBACH, Viera: Praktická dialektológia. Vysokoškolská príručka na nárečovú interpretáciu. Wien: Facultas Verlags- & Buchhandels AG Wien 2012. In: Korpus nárečí Slovenského národného korpusu - dialekt-1.0. Bratislava: Jazykovedný ústav Ľ. Štúra SAV 2014.
- Jónu z verzie dialekt-1.0: NOV 0014 - Ozdín. JÓNA, Eugen: Novohradské nárečia. Ed. P. Žigo. Bratislava: Veda 2009. 164 s. In: Korpus nárečí Slovenského národného korpusu - dialekt-1.0. Bratislava: Jazykovedný ústav Ľ. Štúra SAV 2014.
- Archív nárečových textov dialektologického oddelenia Jazykovedného ústavu Ľ. Štúra SAV: In: Korpus nárečí Slovenského národného korpusu - dialekt-1.0. Bratislava: Jazykovedný ústav Ľ. Štúra SAV 2014.
- Reč a slovesnosť oravského ľudu od A. Habovštiaka z verzie dialekt-2.0: OSM 012 - Dlhá nad Oravou. Habovštiak, Anton: Oravci o svojej minulosti. Reč a slovesnosť oravského ľudu. Martin: Osveta 1983, s. 23 - 358. In: Korpus nárečí Slovenského národného korpusu - dialekt-2.0. Bratislava: Jazykovedný ústav Ľ. Štúra SAV 2015.
- Habovštiaka z verzie dialekt-2.0: ORAVN 015 - Leštiny. Habovštiak, Anton: Oravské nárečia. Bratislava: Slovenská akadémia vied 1965, s. 355 - 396. In: Korpus nárečí Slovenského národného korpusu - dialekt-2.0. Bratislava: Jazykovedný ústav Ľ. Štúra SAV 2015.
- Buffu z verzie dialekt-2.0: SARNAR 007 - Fintice. Buffa, Ferdinamd: Šarišské nárečia. Bratislava: VEDA, Vydavateľstvo Slovenskej akadémie vied 1995, s. 318 - 373. In: Korpus nárečí Slovenského národného korpusu - dialekt-2.0. Bratislava: Jazykovedný ústav Ľ. Štúra SAV 2015.
- Buffu z verzie dialekt-2.0: NADLHL 002 - Dlhá Lúka. Buffa, Ferdinand: Nárečie Dlhej Lúky v Bardejovskom okrese. Bratislava: Vydavateľstvo Slovenskej akadémie vied 1953, s. 116 - 128. In: Korpus nárečí Slovenského národného korpusu - dialekt-2.0. Bratislava: Jazykovedný ústav Ľ. Štúra SAV 2015.
- Kováčovej z verzie dialekt-2.0: VKOV 009 - Ľubiša. Kováčová, Viera: Sotácke nárečia na západoslovansko-východoslovanskom jazykovom pomedzí. Bratislava: Slovenská akadémia vied v Bratislave, Slavistický ústav Jána Stanislava 2005, s. 123 - 144. In: Korpus nárečí Slovenského národného korpusu - dialekt-2.0. Bratislava: Jazykovedný ústav Ľ. Štúra SAV 2015.
- Ripku z verzie dialekt-2.0: DOLNTRN 025 - Trenčianske Bohuslavice. Ripka, Ivor: Dolnotrenčianske nárečia. Bratislava: Veda 1975, s. 216 - 246. In: Korpus nárečí Slovenského národného korpusu - dialekt-2.0. Bratislava: Jazykovedný ústav Ľ. Štúra SAV 2015.
- Múcskovej z verzie dialekt-2.0: GMUCS 010 - Prakovce. Múcsková, Gabriela: Nárečie a spisovný jazyk v bežnej hovorenej komunikácii obyvateľov Gelnice. Dizertačná práca. Bratislava: Jazykovedný ústav Ľudovíta Štúra SAV 2006, s. 92 - 100. In: Korpus nárečí Slovenského národného korpusu - dialekt-2.0. Bratislava: Jazykovedný ústav Ľ. Štúra SAV 2015.
- Paulinyho z verzie dialekt-2.0: ZATOPOS 003 - Ústie nad Oravou. Pauliny, Eugen: Nárečie zátopových osád na hornej Orave. Spisy Jazykovedného odboru Matice slovenskej. Séria B. Zväzok 3. Turčiansky Sv. Martin: Matica slovenská 1947, s. 99 - 115. In: Korpus nárečí Slovenského národného korpusu - dialekt-2.0. Bratislava: Jazykovedný ústav Ľ. Štúra SAV 2015.
- Dodekovej z verzie dialekt-3.0: DODEKOVA 004 - Turzovka. DODEKOVÁ, Eva: Charakteristika nárečovej terminológie Turzovky. Rigorózna práca. Bratislava: Filozofická fakulta Univerzity Komenského 2002, s. 124 - 130. In: Korpus nárečí Slovenského národného korpusu - dialekt-3.0. Bratislava: Jazykovedný ústav Ľ. Štúra SAV 2016.
- Romana z verzie dialekt-3.0: KOKAVNAR 007 - Kokava nad Rimavicou. ROMAN, Ján: Kokavské nárečie. Martin: Osveta 1976, s. 43 - 48. In: Korpus nárečí Slovenského národného korpusu - dialekt-3.0. Bratislava: Jazykovedný ústav Ľ. Štúra SAV 2016.
- Stanislava z verzie dialekt-3.0: LIPTNAR 013 - Nižná Revúca. STANISLAV, Ján: Liptovské nárečia. Turčiansky Sv. Martin: Vydanie Matice slovenskej 1932, s. 489 - 505. In: Korpus nárečí Slovenského národného korpusu - dialekt-3.0. Bratislava: Jazykovedný ústav Ľ. Štúra SAV 2016.
- Kiliánovej z verzie dialekt-3.0: NARODOPISINFO81 001 - Riečnica. KILIÁNOVÁ, Gabriela: Ukážka z repertoáru Alojza Kováča. In: Národopisné informácie. Bulletin Národopisného ústavu SAV a Slovenskej národopisnej spoločnosti pri SAV, Bratislava, roč. 1981, č. 2, s. 220 - 224. In: Korpus nárečí Slovenského národného korpusu - dialekt-3.0. Bratislava: Jazykovedný ústav Ľ. Štúra SAV 2016.
- Prvá svetová vojna jazykom prastarých otcov a materí od kolektívu autorov z verzie dialekt-3.0: ROZPAMAT 003 - Skalica. SMATANA, Miloslav - BALLEKOVÁ, Katarína - HLÔŠKOVÁ, Hana - HOLEC, Roman: Rozpamätávanie. Prvá svetová vojna jazykom prastarých otcov a materí. Ed. Miloslav Smatana - Katarína Balleková - Martina Kopecká - Dagmar Šimunová. Bratislava: Veda, vydavateľstvo SAV 2015, s. 66 - 204, 210 - 236, 244 - 248. In: Korpus nárečí Slovenského národného korpusu - dialekt-3.0. Bratislava: Jazykovedný ústav Ľ. Štúra SAV 2016.
Citovanie výsledkov z Historického korpusu
V texte štúdie, monografie a pod. sa odkazuje na jednotlivé verzie Historického korpusu, ako sú uvedené vo vyhľadávacom nástroji NoSketch Engine (napr. hist-1.0), aby bolo vždy zrejmé, z akého druhu korpusu a z akého rozsahu pochádzajú získané údaje. Pri citácii textov z konkrétneho zdroja použite informácie z položky názov (doc.name) a zdroj (doc.source) spolu s kompletným bibliografickým odkazom na textový zdroj. Za bibliografiou citovaného diela uveďte odkaz na príslušnú verziu a podkorpus Slovenského národného korpusu.
Citácia výsledkov z celého korpusu v bibliografii:
- Verzia hist - x.0.
- Historický korpus slovenčiny - hist-7.0. Bratislava: Jazykovedný ústav Ľ. Štúra SAV, v. v. i. 2024.
- Historický korpus slovenčiny - hist-7.0. Bratislava: Jazykovedný ústav Ľ. Štúra SAV, v. v. i. 2022.
- Historický korpus slovenčiny - hist-7.0. Bratislava: Jazykovedný ústav Ľ. Štúra SAV 2020.

Pri publikovaní výsledkov výskumu uvádzajte, prosíme, odkaz na konkrétne zdroje v nasledujúcom formáte:
- Archív nárečí SNK. Kód nahrávky […]. Bratislava: Jazykovedný ústav Ľ. Štúra SAV [rok, v ktorom ste analyzovali zdroj z AN SNK]. napr. Archív nárečí SNK. Kód nahrávky KovVie-001. Bratislava: Jazykovedný ústav Ľ. Štúra SAV 2019.
- V prípade analýzy viacerých nahrávok alebo ucelenej časti AN SNK môžete uviesť aj meno poskytovateľa, miesto nahrávania, dialekt, ktorý nahrávky zachytávajú, a pod.: Archív nárečí SNK. Miesto nahrávania: […]. Bratislava: Jazykovedný ústav Ľ. Štúra SAV [rok, v ktorom ste analyzovali zdroj z AN SNK]. napr. Archív nárečí SNK. Miesto nahrávania: Adidovce. Bratislava: Jazykovedný ústav Ľ. Štúra SAV 2019.
- alebo Archív nárečí SNK. Nahrávky […] dialektu. Bratislava: Jazykovedný ústav Ľ. Štúra SAV [rok, v ktorom ste analyzovali zdroj z AN SNK]. napr. Archív nárečí SNK. Nahrávky sotáckeho dialektu. Bratislava: Jazykovedný ústav Ľ. Štúra SAV.

Dôležité publikácie a zdroje SNK:
- Garabík, R. - Kmeťová, B. - Šimková, M. - Zumrík, M.: Frekvenčný slovník slovenčiny na báze Slovenského národného korpusu. Bratislava: Veda, 2017.
- ŠIMKOVÁ, Mária - GAJDOŠOVÁ, Katarína - KMEŤOVÁ, Beáta - DEBNÁR, Marek: Slovenský národný korpus. Texty, anotácie, vyhľadávania. Bratislava: Jazykovedný ústav Ľ. Štúra SAV - Vydavateľstvo Mikula 2017.
- GAJDOŠOVÁ, Katarína - ŠIMKOVÁ, Mária a kol.: Frekvenčný slovník hovorenej slovenčiny na báze Slovenského hovoreného korpusu. Bratislava: Veda 2018.