Rýchly a presný výber štatistík: Objavte tajomstvá efektívneho rozhodovania!

Zber dát vo forme párových porovnaní sa vyskytuje v mnohých oblastiach, vrátane získavania preferencií, športových súťaží a vzájomného hodnotenia. Uvažujeme parametrické ordinálne modely pre takéto dáta párových porovnaní, ktoré zahŕňajú latentný vektor $w^* \in \mathbb{R}^d$, reprezentujúci „kvality“ porovnávaných $d$ položiek; táto trieda modelov zahŕňa dva najrozšírenejšie parametrické modely - Bradley-Terry-Luce (BTL) a Thurstone modely.

V rámci štandardného minimax rámca poskytujeme tesné horné a dolné hranice optimálnej chyby pri odhadeve vektora kvalít $w^*$ v rámci tejto triedy modelov. Hranice závisia od topológie porovnávacieho grafu indukovaného podmnožinou porovnávaných párov prostredníctvom jeho spektra Laplaciánu. Preto v kontextoch, kde je možné vybrať podmnožinu párov, naše výsledky poskytujú princípové usmernenia pre tento výber.

List coloring, predstavené nezávisle Vizingom [1] a Erdősom, Rubin a Taylorom [2], priraďuje každému vrcholu predpísanú množinu prípustných farieb. Graf G admituje L-coloring. a G nepripúšťa žiadne proper L-coloring; slovo „kritický“ sa v celom článku vzťahuje výlučne na túto uniformnú definíciu.

Kompletné bipartitné grafy poskytujú prirodzený testovací prípad. pre pevné m. Erdős, Rubin a Taylor [2] iniciovali systematické štúdium tohto správania. pod týmto intervalom. Opísali tiež extrémne zoznamy priradení pri týchto prahoch, hoci niekoľko štrukturálnych krokov bolo len naznačených. Ďalšie výsledky o voliteľnosti bipartitných grafov sa nachádzajú v [4], kde podmienky stupňa poskytujú všeobecné hranice; pre voliteľnostné číslo náhodných bipartitných grafov pozri [5,6].

Algebraické metódy, najmä metódy Alona a Tarsiho [7] a Alonovho Kombinatorického Nullstellensatzu [8], sa ukázali ako účinné pri list coloring prostredníctvom techník grafových polynómov. Galvinovo rozlíšenie [9] Dinitzovej hypotézy, ktoré ukazuje, že list chromatický index bipartitného multigrafu sa rovná jeho chromatickému indexu, podčiarkuje silu týchto nástrojov v bipartitných kontextoch. a naznačili extrémne konštrukcie, ale ponechali niekoľko štrukturálnych krokov implicitných. Tento článok poskytuje rigorózne dôkazy všetkých medzistupňových tvrdení, konkrétne Korolár 1 (princíp transverzaľnej prekážky), Lema 1 (hraničné číslo pokrytia) a úplnú AM-GM optimalizáciu v Propozícii 1. Okrem dokončenia týchto dôkazov prispievame tromi novými výsledkami. (Veta 3). (Veta 4) a stanovujeme asymptotickú dolnú hranicu za štrukturálnych predpokladov (Veta 5). Rámec transverzaľnej prekážky z Korolára 1, hoci implicitný v argumentoch pokrytia z [2,3], sa v tejto explicitnej forme doteraz neobjavil.

Kontext sa spája aj s aplikovanou kombinatorikou. Pri prideľovaní bezdrôtových frekvencií vrcholy na strane M predstavujú základňové stanice s pevnými obmedzeniami kanálov, vrcholy na strane N predstavujú mobilných používateľov a zoznamy kódujú lokálne dostupné frekvencie; voliteľnostné číslo udáva najhorší možný počet frekvencií potrebných na zaručenie bezkonfliktného prideľovania bez ohľadu na lokálnu dostupnosť [10]. Pri plánovaní s obmedzeniami zdrojov obie strany modelujú úlohy a stroje s veľkosťami zoznamov odrážajúcimi špecifické okná uskutočniteľnosti strojov a uskutočniteľnosť časového rozvrhu sa redukuje na grafickú zafarbenie [11]. Pri indexovom kódovaní pre vysielacie kanály kompletné bipartitné podgrafy zachytávajú interferenčné vzory a voliteľnostné číslo riadi minimálnu dĺžku kódového slova potrebnú pre univerzálnu dekódovateľnosť [12].

Niekoľko argumentov závisí iba od uniformnej veľkosti zoznamu a nezafarbiteľnosti; tieto predpoklady sú explicitne uvedené tam, kde sa používajú. [13]. Najmä spomedzi kladných reálnych čísel s fixným súčtom sa súčin maximalizuje, keď sú všetky členy rovnaké.

Zvyšok článku je organizovaný nasledovne. Sekcia 2 predstavuje rámec transverzaľnej prekážky a lemu minimálneho pokrytia. Sekcia 3 analyzuje prípad I a dokončuje dolnú hranicu. Sekcia 4 analyzuje prípad II. Sekcia 5 analyzuje prípad II a overuje Príklad 1. Sekcia 6 analyzuje prípad II a rozvíja model s pevným k blokom. Sekcia 7 analyzuje prípad II a Sekcia 8 prezentuje výsledky v nevyváženom nastavení, zatiaľ čo Sekcia 9 poskytuje prípadové štúdie a Sekcia 10 predstavuje niektoré otvorené problémy.

Graf bipartitného stromu s farebnými vrcholmi

2. Transverzaľná prekážka a lema minimálneho pokrytia

Táto časť sa zaoberá abstraktným rámcom, ktorý sa zaoberá problémami výberu z viacerých zoznamov. Tento rámec sa dá priamo preformulovať v pojmoch extrémnych systémov množín. nech je rodina množín. pre všetky i. . Transverzál je výberová množina s veľkosťou presne t, ekvivalentne tá, ktorá vzniká z injektívnej výberovej funkcie. . V ďalšom texte sa transverzály objavujú prostredníctvom argumentu pokrytia z Lemmy 1, namiesto priameho použitia Hallovej vety.

Teraz spojíme tento rámec s list coloring. generuje proper L-coloring. . Nech f je výberová funkcia na M s obrazom T. , čo je spor.(⇐) Naopak, predpokladajme, že každý výberový set T obsahuje nejaký N-list. by bol výberový set. , čo je spor s propernosťou. -podmnožiny sa musia pretínať so všetkými m-transverzálami vznikajúcimi z disjunktných častí. . Potom platí rovnosť v oboch vyššie uvedených nerovnostiach. . □

Lema 1 je nová derivácia prispôsobená kontextu bipartitného list coloring. najmenšie časti sú jedinečne optimálne, kedykoľvek je najväčšia časť striktne väčšia ako druhá najväčšia. -podmnožiny a argument dvojitého počítania už priamo neplatí, a to je presne zdroj dodatočnej zložitosti v Prípade II.

3. Analýza prípadu I

Táto sekcia sa zameriava na prípad I, kde sa predpokladá, že M-listy sú disjunktné. Analyzujeme štruktúru takéhoto nastavenia a identifikujeme rigiditu vynútenú na každej úrovni. na M. . Priraďte tieto transverzály bijektívne ako N-listy. Každý výberový set je potom jedným z týchto transverzálov a preto sa rovná N-listu; podľa Korolára 1 je priradenie nezafarbiteľné. pre všetky vrcholy. by obsahoval nejaký N-list. . Preto sú M-listy párovo disjunktné. , čo je spor s predpokladom. . □

Dôkaz ukazuje, že nezafarbiteľnosť pri veľkosti zoznamu m vynucuje párovú disjunktnosť M-listov. pre všetky vrcholy a že L je nezafarbiteľný. a predpokladajme, že L je nezafarbiteľný. , potom sa každé dve hrany pretínajú vo vrchole. sú párovo disjunktné, takže platí Prípad (I). sa párovo pretínajú. , ktoré sa pretínajú. zoznamy sú párovo disjunktné po odstránení najviac jedného vrcholu. ako komponent, pričom podmienka (i) navyše vynucuje farebnú disjunktnosť troch párových prienikov. -výberový set je transverzál, čo umožňuje priame extrémne počítanie.

4. Dolná hranica pre prípad I

V tejto sekcii odvodíme dolnú hranicu pre voliteľnostné číslo v Prípade I, kde sú M-listy párovo disjunktné. Tieto zoznamy sú párovo disjunktné. [13]. -transverzály. a pretína každý M-list, takže podľa Korolára 1 sa musí vyskytnúť ako N-list. , a rovnosť platí presne v tejto konfigurácii. ). ; tento prípad nemôže nastať. ; preto je zahrnutý medzi N-listy.Teda každý výberový set obsahuje N-list a Korolár 1 implikuje nezafarbiteľnosť. □

5. Analýza prípadu II

Predpokladajme Prípad (II) Lemmy 2. pre všetky v a neexistuje žiadne proper L-coloring. že sa môžu vyskytnúť v T. rôzne neusporiadané páry. , disjunktné od predchádzajúcej rodiny. -podmnožiny. Sčítanie dáva hranicu. □

6. Všeobecná dolná hranica

Táto sekcia rozširuje výsledky z prípadu I na všeobecnejší prípad, kde sa M-listy nemusia nutne prekrývať. Používame techniky z [13], aby sme získali dolnú hranicu pre diskrétny prípad. s cyklickými permutáciami. prinášajúce požadovanú striktnú nerovnosť. už pri najtesnejšom celočíselnom bode.

7. Extrémne konfigurácie

Táto sekcia sa zaoberá konkrétnymi extrémnymi konfiguráciami, ktoré dosahujú hranice odvodene v predchádzajúcich sekciách. nie sú pokryté Lemmou 6 a musia byť spracované priamo. ), koncentrujúc prípustnú oblasť blízko vnútorného minimizéra F. a jej zoznamy, nižšie. Overujeme nezafarbiteľnosť pomocou Korolára 1. . Teda každý výberový set obsahuje N-list, takže priradenie nepripúšťa žiadne proper L-coloring. .

8. Nevyvážené nastavenie

Táto sekcia skúma problém list coloring v nevyváženom nastavení, kde veľkosti častí bipartitného grafu sú výrazne odlišné. v nevyváženom nastavení. Dôkaz.Dôkaz má dve časti. ) používame Vetu 1. kombinujeme Propozíciu 1 (dolná hranica v Prípade I) s Lemmou 4 (explicitná konštrukcia). . Podľa Lemmy 2 spadá do Prípadu (I) alebo Prípadu (II). ) prinášajú rovnakú dolnú hranicu. patrí do Prípadu (I) a je, až na premenovanie (v zmysle Definície 2), typu A alebo typu B. . Preto každé kritické priradenie patrí do Prípadu (I). Propozícia 1 identifikuje dve extrémne konfigurácie, ktoré sú odlišné až na premenovanie. , Propozícia 2 ukazuje, že Prípad (II) dosahuje rovnakú hranicu a produkuje jeden ďalší typ. pre pevné m. je dobre definovaná. presne v jednom elemente.V tomto modeli sú ℓ-elementové výberové sety presne transverzály blokov. . Takáto množina sa pretína s každým M-listom práve vtedy, keď sa pretína s každým určeným listom. transverzály blokov. prináša vzorec. . Predpokladajme, že M-listy sú dané Konštrukciou 1. pre všetky v a neexistuje žiadne proper L-coloring, potom každý ℓ-výberový set počítaný v Lemme 7 sa vyskytuje ako N-list. nech je rodina ℓ-elementových výberových setov M-listov. , táto inklúzia množín vo všeobecnosti zlyháva. pretínajúc všetky M-listy. ).

Schéma bipartitného grafu s označenými vrcholmi a zoznamami

Nedostatočná dostatočnosť z Poznámky 7 odráža štrukturálnu prekážku: keď sa viacero určených zoznamov čerpá z rovnakého bloku, výsledný výberový set nemusí obsahovať transverzál bloku, ktorý sa pretína so všetkými k určenými zoznamami. Potenciálne použiteľné sú dva všeobecné rámce.

Metóda kontajnerov [15] organizuje nezávislé množiny (alebo tu rodiny transverzálov) do niekoľkých štrukturálne jednoduchých kontajnerov. rovnomerne v t. dokončuje dôkaz. Dôkaz.Nech L je kritický a spĺňa predpoklad. . Za predpokladov je každý takýto transverzál výberovým setom veľkosti ℓ. o najviac k. . □

9. Výpočtová metodológia a výsledky

V tejto sekcii diskutujeme výpočtovú metodológiu použitú na získanie výsledkov prezentovaných v článku, konkrétne v Tabuľke 1 a Tabuľke 2. Vstupy v Tabuľke 1 a Tabuľke 2 boli získané vyčerpávajúcim výpočtom v rámci modelu blokovej disjunktnosti. Pre každé m v danom rozsahu boli vygenerované všetky priradenia zoznamov predpísanej uniformnej veľkosti nad kanonickou množinou farieb, až na permutácie farieb. Nezafarbiteľnosť bola overená pomocou Korolára 1: priradenie bolo klasifikované ako nezafarbiteľné práve vtedy, keď každý výberový set M-listov obsahoval nejaký N-list. Triedy izomorfizmu boli identifikované pomocou kanonického označovania: dve priradenia boli považované za izomorfné (v zmysle Definície 2), ak jedno bolo získateľné z druhého permutáciou M-vrcholov, permutáciou N-vrcholov a premenovaním farieb. Výsledné počty izomorfných typov sú vo všetkých overených prípadoch konzistentné s Vétou 3.

Tabuľka 1: Počty typov nezafarbiteľných priradení pre malé hodnoty m a n

Tabuľka 2: Počty typov nezafarbiteľných priradení pre väčšie hodnoty m a n

kde explicitné transverzaľné prekážky produkujú polynomiálne prahy. Keď obe časti rastú v rovnakom meradle, správanie sa zásadne mení. , voliteľnostné číslo rastie len logaritmicky. Zaznamenávame klasický argument, aby sme zdôraznili tento kontrast. Vlastnosť B. pretína obe R aj B. nech je k-uniformný hypergraf bez vlastnosti B. na i-tý vrchol M a na i-tý vrchol N. je proper L-coloring. má vlastnosť B, čo je spor. , a limit vyplýva. dá sa presne určiť, je otvorený problém; pozri [5] pre súvisiace výsledky v náhodnom bipartitnom nastavení.

10. Otvorené problémy

Tento článok rieši otázku list coloring bipartitných grafov, najmä v extrémnych prípadoch a pri rôznych veľkostiach častí. je plne určený na prvých dvoch prahoch v nevyváženom rozsahu a extrémna štruktúra na nižšom prahu je teraz úplne rigidná. objavuje sa tretí typ z Prípadu (II).Dva prahové nastavenia sa líšia v mechanizme prekážky, ktorý riadi nezafarbiteľnosť. prekročiť počet nevyhnutných výberových setov (Korolár 1). tak, že každý hyperhrana pridruženého hypergrafu pretína obe časti, čo potvrdzuje vlastnosť B. pretrváva na hlbších úrovniach, je prirodzená otázka. , konštrukcia pevného k bloku naznačuje hierarchiu hlbších prahov. kde $\overline{x}$ je prahová hodnota mojej vynucujúcej premennej. Analyzoval som a dosiahol som celkom dobré výsledky, ale teraz by som chcel otestovať robustnosť svojich výsledkov. Ako inak môžem ukázať robustnosť svojich výsledkov? Zatiaľ som použil polynomiálne RD a RD s lokálnou lineárnou regresiou a výsledky sú stabilné. Existuje ešte niečo iné? Určite by ste mali podporiť svoju analýzu grafmi. Ak chcete otestovať, či máte správny počet polynómov, môžete rozdeliť svoje údaje do skupín a zahrnúť dummy pre každú skupinu do svojej regresie. Ak je vaša funkčná forma správna, žiadna z týchto dummy premenných by nemala byť významná (pozri Lee a Lemieux, 2010). Ak sú niektoré dummy premenné významné, môžete pridať polynómy vyššieho stupňa, kým táto významnosť nezmizne. V tom istom článku tiež navrhujú metódy na výber vhodnej šírky pásma pre neparametrické RD. Pekný graf pre body 1. a 2. V súvislosti s tretím bodom môžete tiež formálne otestovať skok v hustote vynucovacej premennej okolo prahu. McCrary (2008) vyvinul testovaciu metódu na tento účel. Pokiaľ ide o bod 2., môžete použiť svoje kontroly ako výstupné premenné, znovu spustiť analýzu a zistiť, či pri prahu skočia. Nemali by, inak bude vaša analýza v problémoch. Majte na pamäti, že väčšina týchto testov je ľahko dostupná v balíku R RDDtools, ktorý ponúka: analýzu citlivosti regresie (graf citlivosti šírky pásma, placebo graf) ako aj analýzu citlivosti návrhu (McCraryho test manipulácie, test rovnosti kovariátov okolo prahu).

Online kurz Analýza Dát - Prehľad grafov, rýchla analýza a dátovej analýzy v Microsoft Excel 📊

tags: #sharp #rychla #volba #pre #statistiky