[Playlisten] [Impressum und Datenschutzerklärung]

Warum so viele veröffentlichte Forschungsergebnisse falsch sind; Hypothesentest und Publication Bias


CC-BY-NC-SA 3.0

Tempo:

Anklickbares Transkript:

maleine andere Sicht auf die Teewertebin werde hier als die klassischen Hypothesen des Baums klassischen Hypothesentestsheikel sind haben sie immer so gemacht werden Komma dass dieser wahrscheinlich weiterhin auch so machen muss und das Wasser zu fallen und keinen Ärger zu kriegen ?? warum die sehr heikel sind insbesondere gibt es die Vermutungdass gleich die Hälfte aller Veröffentlichungenzum ?? Medizinpsychologiedie auf den Hypothesentest beruht das vielleicht die Hälfte davon falsches bemerkt es daran wenn Leute Wiederholungsstudienversuchenselbst ?? noch mal machen Zweifelsfalldas nicht reproduzierenkönnen was andere Leute vorher veröffentlicht haben also es gibt einige natürlich die Ergebnisse erfindendie Sender sowieso falsch aber es gibt auch die Möglichkeit sich selbst zu betrügen mithilfe von diesem bewerten zu glauben man habe was nachgewiesenaber man hat leider nichts nachgewiesenklassische Arbeit dazu ist von Johann jedesVersagen eine klassische Arbeit das ist seit Jahrzehnten bekannt unter den Fachleutenaber die Reaktion darauf in den Wissenschaften ist sehr TrägerJohnny des Weinbaus verwischt bis Schweindings erfolgtsind Schloss zwei tausend fünf drin gewesenzu einer stark beachtete Arbeit zu diesem Themaeinmal an Christian Wiederholungmit diesemvier Felder Diagrammich unterscheide erstmals die Nullhypothese war oder ist sie falschArnulfwar Arnulf fertig Beistrich wie ich das in ?? Videos gemacht oder verteidigt die Spaltenzahlenanders eingeteiltpassen sie auf andere Leute mögen es auch an der Seite Alicia Getier Arnulfwar auf die linke Seite ?? null falsch auf die rechte Seite sie haben eine Nullhypothese die normalerweise sowas heißt es passiert nichts ?? Medikamenthat keinen Einflusses gibt keinen Unterschied zwischen verschiedenen Unterrichtsformenoder bei uns eben jetzt Bedienoberflächenvorgesehen oder grün mache ist egal das sind typischerweise Nullhypothesedie kann in der Wirklichkeit war sein oder Fall scheint das wissen wir nicht das möchten wir herausfindenmit dem Hypothesentestundder Ärger ist was wir herausfinden ist nicht unbedingt das Wesen wirklich ist es aber schon unterscheiden zu ?? auf der linken Seiteerreichen und wenig die NullhypotheseabA null abgelehnterscheint mir das zu gewagt zu sagen dass dieses Medikamentnichts bewirkt oder diese Oberflächenicht irgendwie anders ist als die alte OberflächeHandel abgelehntoder sage ich das H null nicht abgelehnt istwas ich ja nun nicht ablehnen kann?? Daten sind zu schwach ich kanns nicht sagen es fühlt sich nicht so an als ob es tatsächlich einen Unterschied gäbezwischen alt und neu zwischen Rot und Grün zwischen mit Medikamentund ohne Medikamentkomme ich auf vier Fälleals was passiert in der Warenwelt links und rechts und die entscheide ich mich jetzt und wenn ich die Nullhypothese ab oder wenn ich sie nicht ab darf niemals angenommen werdenkönnen ?? versagensind und sich sicherwollen sie lieber nicht ablehnen stattdessen immer nicht abgelehntes gibt zwei Fällein denen wir kein Problem habenso das Thema zusammen wenn die Nullhypothesefalsch ist ?? es gibt doch einen Unterschied zwischen Rot und Grün oder das Medikamenttut doch etwas und sind in die Nullhypothese ab dann ist alles korrekt wenn die Nullhypothese war es ist kein Unterschied zwischen Rot und Grün das Medikament tut nichts und sie lehnt die Nullhypothese nicht ab wie er sagt es gibt keine Residenz auch alles in Ordnung ?? jammert Fehler erster Artman sich auswendig merken wenn die Nullhypothese wahr ist und sie lehnen die Abfahrt den Fehler erster Art uns hierbleibt ein Fehler des zweiter Artder kein Fehler sein wird wenn sie nur schreiben H null nicht abgelehntwenn sie für das heute üblicher wird die Nullhypotheseannehmenalso sagen gibt kein unterschied aber es gibt einen der Warenwelt den handwerklichen Fehler Gänsefüßchen untenwenn sie das klassisch machen und sagendie Nullhypothese darf bitte niemals angenommen werden ?? Mission kein Fehler sie wissen einfach nur nichts passiert in diesen ??Datenlage zu schwachund jetzt kann man sich das macht übernimmt es zum Beispiel jetzt kann man sich angucken wie häufig denn das passiertund wie häufig jetzt Arbeiten veröffentlicht werden zum Beispiel der Medizin in der Psychologiezu machen ein psychologisches Experimentwollen wissendie SchriftgrößeEinfluss hat darauf wie schnell die Leute lesen oderden Inhalt behalten oder was ihre politische Einstellung ist das mit der Schriftart zusammen keine Ahnung drittes wenn eine macht in der Psychologieund dann möchte man per Hypothesentestjetzt sagen stimmt es oder stimmt es nicht oder wie sind Indizien zumindestin wir davon aus das es wirklich einen Effekt gibtnach dem was wir gesehen haben ?? Experiment oder Geber davon aus das es keinen Effekt gibt als in der Mensch-Maschine-Interaktionsieht es wie gesagt dann eher sowas wie eine bestimmte Form des User Interfacesist die andersals vorherverhält sich anders als vorher etwas besser geworden etwas schlechter geworden Komma in jeder psychologischen Studie vier soziologische Studien und die ganzenmedizinischen Tests irgendwelche Medikamente irgendwelchechirurgischen Eingriffe funktionierenall die laufen ja auf solche vier Felder hinausund die spannende Frage ist wie groß denn jetzt tatsächlich diese Feldersind wenn sie eine Studie machen haben sie quasi gesunde Dartscheibezu machen ein Studio treffen sie rein treffen sie hier rein in das Feldokay Glück gehabt treffen sie dieses Feld ist so schön sie haben zu wenig Daten und so weiter und so weiter wie häufig treten diese Einzelfälle jeweils auf das kann man sich überlegenund dabei findet man erstaunlichesnämlich das in der Tat sehr viele veröffentlichteErgebnissefalsch sein können wenn diese Ergebnisse auf diese Art Hypothesen Test basiert wie sie üblicherweise gemacht wird?? jetzt mal das ich Wahrscheinlichkeitender so drauf zu malenwie konnte das Real Aussehenwerde das wirklich als Dartscheibeauffassenhier einequadratische Dartscheibe und jetzt schießen sie mit ihrem Dartfall dadraufsie werden nicht ein viertel ein viertel Eintritt Landwirte Wahrscheinlichkeit haben oder von zwanzig Prozent vierzehnProzent wahrscheinlich keine haben lieber nicht alle gleich wahrscheinlichauftretensie eine Studie machen machen dann den Hypothesen des dazubewehrte ausdasjetzt tatsächlich überlegen wie wird das Real Aussehen Punkt daneben schreiben dieselbe ein Teil wie hierals reale Dartscheibeund könnt ihr zum Beispiel anfangendie Hypothese dich testewar falschist die Aufteilungeins zu einsin sie irgend eine Hypothese testenwenn sie wahrscheinlich nicht erwarten dass die fifty-fiftyausgeht dass sie stimmt mit fünfzig Prozent und nicht stimmt mit fünfzig Prozent was wäre vielleicht plausibler als fifty-fiftyhier für die Hypothese selbstzumal wir das normalerweise annehmen dass die Nullhypothesedoch häufiger weiß es gibt keinen Effekt was mir sicher keine Wissenschaft machen wenn ich Experiment mache und ich werde mir schon von vornherein sehr sicher dass ich die Nullhypothese ablehnen kann das sein Effekt gibt Komma der das Experiment überhaupt noch Banalitätuntersucht ich möchte dich Experimente machen ?? ich keine Banalitäten untersuchendie riskant sind und deshalb wird die Ware sollte nur für diese häufiger wahr seinBeistrich sagen drei zu einsdreiviertelein Vierteldamit habe ihr schon zwei Spalten gebildet also sie machen ein Experimentdann sagen Sie vielleicht in drei von vier FällenDartscheibe in drei von vier Fällen stellen sie fest es gibt keinen Effekt das Sternzeichen hat keinen Einfluss auf die Lesefähigkeitoder was auch immer aber in einem von vier Fällen gibt es zwei tatsächlich ein Fax das heißt nicht dass sie nachweisen können gibt es tatsächlich einen Effekt Beistrich in welchen von den vier Fälleneine Studie machen so auf der linken Seite jetzt ?? ziehen sich hier ein Trennstrichfifty-fiftywäre offensichtlich nicht klug eine Münze werfen können der Fehler soll selten auftretendas Internet zu diese üblichen fünf Prozentvorkommenalso sich Punkt fünf Prozent habe und John fünfundneunzig Prozent habe ?? was zu sagen wenn ich sagestehen die Nullhypotheseimmer dann ab wenn der P Wert kleiner gleich fünf Prozent dann habe ich tatsächlich um fünf Prozent Wahrscheinlichkeitdas es was man üblicherweise Nationswahrscheinlichkeitbezeichnet die fünf Prozent der Obenwahrscheinlichkeitein Fehler erst dazu machendie Nullhypothese stimmt aber leider bin ich sie hab das ist die übliche Schranke die man da haben wir fünf Prozent und fünfundneunzig Prozentjetzt auf der rechten Seitewas wenn sie da sinnvoll auf der rechten Seiteso also Violine durch auch wenig Fehler haben gewiss nicht ganz billig sein wie auf der linken Seite war dieses Jahrwird dies nicht wirklich annehmen kein echter Fehler sondern einfach eine schwache Datenlagewas man gerne hat ist achtzig Prozent ?? zwanzig Prozentso also jeder dein Experiment macht in dieser sehr vereinfachtenWeltjeder dein Experimentmacht schießt mit einem Dartfall auf diese Scheibekann dahin treffenStimmzettelnie eintreffenstimmt das Resultatkann aber auch da oben treffen das Resultat nicht und unten hin treffender stimmt das Resultat auch nichteine Studie veröffentlichenjetzt kommt die Politik ins SpielwelchesErgebniswird veröffentlicht werden als sie haben jetzt den Dartfall geschlossen sozusagen indem sie ein Experiment gemacht haben haben hundert Leute eingeladenDutzend Leute eingeladen haben damit psychologische Studie gemacht oder User Interface getestet oder medizinischen Test gemacht die Hand in der Fall auf dieses Feld geschossenwas im Dunkeln ist gewiss nicht an welcher Stelle der Datei gelandet ist sie müssen nur ist auf dem Feld gelandetjetzt wollte das Ding veröffentlichen was sie da erforscht haben was wird sie veröffentlichen können was wenn sie nicht veröffentlichen könnenes kommt auf der Application Bayersdiese Resultate hier und diese Resultatedie werden im Zweifelsfallnicht veröffentlicht ist auf jeden Fall schwer zu veröffentlichenwenn sie rauskriegenes gibt keinen unterschied wurde kann ich nachweisen dass es einen Unterschied gibt das interessiert praktisch kein was sie veröffentlichen können ist es gibt einen unterschiedsowieso hat ein Effekt die Schriftgröße hat einen Effekt auf das Behalten solche Sachen die kriegen sie veröffentlichtPunkt deshalbmuss man es frostig sein wie man Wahrscheinlichkeitenberechnetwir müssen ja nach ?? gucken was veröffentlicht wirddies hier dieses Feld wird veröffentlicht und das Feld wird veröffentlicht?? kann man sich fragen das VerhältnisvonwichtigenResultatenzu falschen Resultatenin den Veröffentlichungenwie sie das ausBlättern sein ?? durcheinen Tagungsbanddurch mancher Fragen im Schnitt wie viel davon ist falsch wie viel davones richtigdas interessiert Beistrich ob es also Zahl veröffentlichtohnekorrektoder warein wahres Resultatgeteilt durch Zahl veröffentlichtund falschdieses Verhältnisimmer das Wellness rausdoch nur angewandter Dreisatz veröffentlicht und war ist das richtigauf der rechten Seite ein viertel mal achtzig Prozentund veröffentlicht und falsch ist dieser Streifenauf der linken Seite dreiviertelmal fünf ProzentViertel Komma kürzen achtzig durchführen?? sechzehnsondern sie sechzehndurch drei etwas mehrals wenn sie fünf ?? übernehmenwenn sie sechs bei Barnim haben sie wahrscheinlich eines dabei mit falschen Resultatwann wir das noch schlimmerin welchen Situationenmehr Werte einfach geschätzt achtzig zwanzig es üblich fünfte vierundneunzig üblich dreiviertel ein Viertel ist sehr aus dem Bauchmeines Effekt doch größer ?? können Sie diese Zeichnung ändern damit diese Zahl hier noch schlimmer wird also kleiner wird das sie noch weniger Ware Paper Pro falschen Gräber haben jetzt fünf waren veröffentlichte Resultate auf ein falsches veröffentlichtes Resultaterste Möglichkeit sie haben ein Gebiet mit viel weniger waren Hypothesendieser Streifen auf der rechten Seiterelativ schmaler wird verhält Streifen auf der linken Seitezum Beispiel alle möglichen Enzymedurchprobiertund nur eine handvoll von tausend Enzym funktioniertdamit der Streifen auf der rechten Seite sehr schmaldas mal zu skizzieren und ist dann also so aus der Streifen rechts sehr schmaldieser Streifen steht im Nenner dieser Streifen steht im Zählerder Streifen im Nenner ist größer geworden der Streifenzähler ist kleiner gewordendas wäre eine Möglichkeitschlimmer zu machendiese nach Möglichkeit es schlimmer zu machenso ein kleinen Effekt oder ein schwacher Testhier auf der rechten Seiteist er tatsächlich ein unterschied da die Nullhypothesegilt nicht und ich kann Ihnen in achtzig Prozent der Fälle nachweisenwenn man Test schwachesden Ausdruck des stärkeren tatsächlich powerim Attest schwach ist sie nämlich achtzig Prozent seiner weniger als achtzig Prozent muss sehr sehr genau hinguckenund tatsächlich einen Unterschied zu sehen dann wird der grüne Kasten ihr kleiner und das Verhältnis der Kasten rechts durch den Kasten links ist wieder kleiner gewordenwenigerwahre Veröffentlichungenim Verhältnis zu den falschen Veröffentlichungendas wäre ein schwacher TestKommaTeststärkeist schwach?? Test kann nicht gut unterscheidenwenn es einen Unterschied gibt ob es einen Unterschied gibtdiesen winzigen Effekt vor dem sie einfach kaum bemerkendem ganzen Rauschendas übliche Problem ist das man einfach zu wenig Leute hat die man befragtuntersuchtalso das heißt die auf der rechten Seite ?? dieselbe Breite aberdieser Trennstrich geht nach oben Trennstrich Kind Punkt damit fällt es auch wieder kleinerund was ich jetzt nicht so in diesem Diagramm niederschlägtistkann in der Psychologie versuchten Banalitätenoder Binsenweisheitentausendmalgeprüft werdenjede Studentin jeder Student in der Psychologiemuss dann so soviel Studien ablieferndann werden zum Schluss alle Sachen von denen man glaubt dass sie wohl geltentausendmal geprüft worden sein und irgend eines von diesen tausend Experimenten auf den Steinzusammenhanggibt mir dann schon gelingen und das Wetter veröffentlicht und hundert einundneunzig die nicht gelungen sind sozusagen bei den nicht rausgekommen sind die werden nicht veröffentlichtdas es auch noch ein ungeschickter Effekte kann sie nicht so genau in diesem Bild sehenaber dazu selber Hypothesesehr oft getestetund es wird eben nur das veröffentlichtvon diesen ganzen Tests bei den scheinbareine Weg zu sehen war zufälligsolltest ?? dazu schreiben sicherheitshalber mit Application Bayers also nur das veröffentlichenwo ein Effekt oder ein starker Effekt zu sehen ist wenn sie jedes von diesen Experimenten veröffentlichen würden dann wär's kein Problemdann wüsste man seit fünf hundert Mal nicht geklappt und einmal geklappt?? ist was faul ?? das einmal veröffentlicht wird bei dem es geklappt hat und die anderen fünf hundert in der Schublade verschwindenwas keiner davon Punkt die Kirchen Beistrichaber das ist gerade in der Psychologie wenn Binsenweisheitenvon hundert Leuten nacheinander ausprobiert werden irgendwer wird zufällig ein Effekt finden aufwärts keinen gibt irgendwie zufällig da landen und das veröffentlichendann glaubt man es gibt ein Zusammenhangnur weil die anderen ist nicht öffentlichdass wir noch was zum Hypothesentesthier sind der Tee wird als solcher ist noch gar nicht wirklich vorgekommen ist sein sondern nur ihr dieses Karree von den Möglichkeitender B Wert versteckt sich hier so bisschen Runterwettbewerbversteckt sich hier trennendass ich sage Clinton und Isabelle Bibel kleiner gleich fünf Prozent ist null Komma null fünf dann ?? diese Situationund der Ärger ist das man sich hier immer auf die linke Seite stürztangenommen die Nullhypothese giltdas mit den fünf Prozent und so weiterund die rechte Seite hier ist richtig schwierigbis schwierig zu rechnen ist schwierig zu erfassen ist ?? bitte gerne ignoriertaber die macht das ganz kaputtvor dem ignoriert wird