Bayesovský výběr modelu ukazuje extrémně polarizované chování, když jsou modely špatné

Statistika není nuda – přednáškový blok (Smět 2019).

Anonim

Vědci z University College London (UCL) a Akademie matematiky a systémů vědy Čínské akademie věd (CAS, AMSS) oznámili pokrok v pochopení problémů spojených s Bayesovským výběrem modelů. Výzkum naznačuje, že Bayesovská metoda má tendenci vytvářet velmi posteriórní pravděpodobnosti pro odhadované evoluční stromy, i když jsou stromy zjevně nesprávné, a nabízí možné vysvětlení tohoto jevu.

Modelové srovnání je široce používáno v různých oborech věd, ve kterých jsou vědecké hypotézy formulovány jako statistické modely a testovány pomocí pozorovaných dat. Porovnání modelů je však tristní otázkou jak v klasické statistice, tak v Bayesovské statistice.

V klasické statistice jsou porovnány dva vnořené modely. Rámec nefunguje, když nejsou porovnávané modely vnořené. Naproti tomu Bayesovská statistika porovnává různé modely výpočtem jejich posteriorních pravděpodobností, což naznačuje naši důvěru nebo víru v model.

Nejen, že obě metody vycházejí z drasticky odlišných filozofií, ale také mohou v analýze stejných dat vyvozovat opačné závěry. Výběr Bayesovského modelu je známý tím, že se shoduje se skutečným modelem, pokud je skutečný model zařazen mezi zvažované modely.

To znamená, že pokud vědci shromažďují více dat, posteriori pravděpodobnosti správného modelu se zvýší a přiblíží se k 100%, a tak budou stále jistější, což je skutečný model.

Nicméně, pokud jsou všechny zvažované modely nesprávné, chování Bayesovské metody není známo.

Vědci charakterizovali Bayesovu modelovou problematiku výběru a kategorizovali je do tří typů, z nichž každá ukazuje odlišné chování.

V nejvíce vědecky zajímavém případě, tj. Když jsou porovnávané modely odlišné a téměř stejně nesprávné, výběrová analýza modelu Bayesian ukazuje problematické polarizované chování: V některých datových sadách má tendenci podporovat jeden model s plnou silou, ale v jiných datových sadách podporuje jiný model.

Výsledek lze shrnout pomocí následující analogie: Předpokládejme, že svět je šedý, ale žádáme mudrce, zda je černý nebo bílý. Dívá se hluboko na svět a říká, že je černý, s úplnou důvěrou. Ale příště se zeptáme na stejnou otázku, říká, že je bílá, opět s naprostou důvěrou.

Tato studie byla motivována problémy v molekulární fylogenetice, což je věda vyvíjení vztahů mezi druhy pomocí genetických dat reprezentovaných evolučními stromy.

Tyto různé stromy jsou protikladné statistické modely v Bayesovské analýze dat. Evoluční biologové již dávno pozorovali, že metoda má tendenci vytvářet velmi vysoké posteriorní pravděpodobnosti pro odhadované evoluční stromy (velmi často 100%), i když jsou stromy zjevně špatné.

Naše výsledky poskytují možné vysvětlení tohoto nepříjemného chování. Důsledky výsledků pro použití výběru Bayesovského modelu při testování protikladných vědeckých hypotéz obecně ještě nebyly zkoumány.

menu
menu